0

0

学习正则表达式基础

韦小宝

韦小宝

发布时间:2018-03-14 12:52:29

|

1521人浏览过

|

来源于php中文网

原创

本篇文章讲述了javascript正则表达式的基础,大家对于javascript正则表达式不熟悉的正好可以来学习学习,讲的都是javascript比较基础的正则表达式,不熟悉的同学我们一起来看看吧!

怎样学习正则表达式
怎样学习正则表达式

怎样学习正则表达式

下载

正则表达式学习(持续更新)

今天在学javascript的时候学到了RegExp对象,借机学习一下正则表达式,以前没接触过,趁机学习一波,很舒服。

参考网站:正则表达式30分钟入门教程点击打开链接

1.什么是正则表达式

    正则表达式是用来表述字符串匹配的规则。

2.正则表达式的相关概念

2.1元字符

    元字符是正则表达式中自己规定的一种特殊符号,在正则表达式中加入用以代替某些规则。

\b 表示单词的开始或结束
. 表示除换行以外的任意字符
*    表示*前面出现的任意个数的该字符,例如a*,表示前面有任意个数的a(重复0次或多次)
+    表示+前面出现的任意个数的该字符,例如a+,表示前面有任意个数的a(重复1次或多次)
? 重复0或1次                                                                                                                                                                                                  
{n} 重复n次
{n, } 重复大于等于n次
{n, m} 重复n到m次
\d   表示一个0-9的数字                                                                                                                    
\w 匹配字母或数字或下划线或汉字                                                                         
\s 匹配任意的空白符,包括空格、制表符、换行符、中文全角空格等
^ 匹配字符串的开始                                                                           
& 匹配字符串的结束

3.简单的正则表达式

    直接从例子走起:

    例1:当我想去匹配单词hello时,所写的正则表达式(匹配规则)为:hello

    这样会匹配到所有含有hello的单词,如:helloworld也被匹配了进来,但如果只想匹配hello,则需要使用元字符\b,将hello前后断开,形成单独的单词hello,则正则表达式应该为:\bhello\b

    例2:当要找的hello后面任意字符处跟着一个world,则应当使用元字符.和*,正则表达式为\bhello\b.*\world\b

    例3:当想去匹配021-xxxxxxx类似这样的电话号码时,应当使用021-\d\d\d\d\d\d\d,这其中“021-”为简单的字符,不代表任何特殊含义,而后面使用的\d为元字符。这个正则表达式可简写为021-\d{7},代表\d重复了7次。

    例4:匹配1个或多个连续数字,\d+

    例5:匹配以a开头的单词,\ba\w*\b

    例6:匹配5-12位的QQ号,^\d{5, 12}&

4.字符转义

    如果想要查找的字符串里面有元字符,需要在元字符前面加上\来将元字符转为普通的字符。

5.字符类

    这部分解决的问题是如果想要匹配的字符没有相应的元字符对应怎么办,那么我们需要手动创建一个字符类。

    例如如果数字0-9没有\d与之匹配,那么当我们想要查找0-9的任意数字时,可以创建一个[0-9]的字符类,它的作用与\d完全相同。

    例如正则表达式 \(?0\d{2}[), -]?\d{8}可以用来匹配电话号码,依次解释一下\(代表对(进行转义,表示其重复0或1次,\d表示两个数字,[), -]表示)和-的字符类,表示其重复0或1次,后接着有8个数字。

6.分枝条件

    上面写的 \(?0\d{2}[), -]?\d{8}这样的正则表达式可能会匹配到(01012345678或(010-12345678等不正确的字符串,对于这样的情况可以使用分枝条件,分枝条件与js中的逻辑或||类似,并且都是短路操作符,从左到右匹配到一个条件能判断时就结束。

    对于上面的情况可以写为 \(0\d{2}\)\d{8}|0\d{2}-\d{8}|\(0\d{2}\)\d{8}

7.分组

    该部分为了解决重复的不是单个字符,而是多个字符的问题。重复单个字符时我们可以使用字符+元字符里面的限定符这样的写法,但当重复字符为多个时,可以在重复字符外加上()。例如下面的正则表达式可用来表示ip地址。

(2[0-4]\d|25[0-5]|[01]\d\d?\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)

8.反义

当需要查找不属于某个能够简单定义的字符时,例如除了xxx以外的字符时,需要用到反义

\W

匹配任意不是字母、数字、下划线、汉字的字符

\D 匹配任意不是数字的字符
\B 匹配任意不是单词开头或结束位置的字符
\S 匹配任意不是空白的字符
[^x] 匹配除了x以外的字符
[^aeiou] 匹配除了aeiou之外的字符

例如正则表达式^\S+&用来匹配一段不含空白符的字符

9.后向引用

    这部分的内容跟前面的分组是匹配的,当我们使用()为字符分组后,这个分组我们可以通过编号的方式在后面继续引用,对于通过()进行的分组,按照( 出现的顺序从1开始进行分组,例如正则表达式\b(\w+)\s+\1\b,可以用来匹配重复出现的单词,例如go go等,这里就是通过\1引用了之前出现的分组。

    其他涉及到的后向引用语法有:

(exp) 匹配exp,并捕获当前内容到自动的分组里                                                                            
(?exp) 匹配exp,并捕获当前内容并分配组名为name
(?:exp) 匹配exp,不为捕获的内容分配组名

10.零宽断言

    用于查找在某部分内容之前或之后但不包括该内容的部分。

    正则表达式(?=exp)的意思就是断言后面出现的部分可以匹配表达式exp。比如\b\w+(?=ing\b),匹配以ing结尾的单词的前面部分。比如查找I'm dancing and singing时会匹配dance和sing(由于有\w+不会匹配为s)。

    正则表达式(?\bre)\w+\b会匹配以re为开头的单词的后半部分,例如查找reading时会匹配到ading。

    假如你想给一个很长的数字每三位加一个逗号,例如对123456789加逗号,可以使用正则表达式((?

    下面的例子同时使用两种断言(?=

    总的来看,零宽断言的目的就是为了按照一定的规则确定匹配字符的起始点或终止点。

11.负向零宽断言

前面提到了使用反义来查找不是某个字符或不在某个字符里。

    例如如果想查找一个单词出现了字母q而后面跟的不是u。可能会写\bq[^u]\w*\b。但对于这样的表达式,当q出现在单词结尾时就会出现错误,因为[^u]会将单词的间隔符匹配掉,这样会进而匹配下一个单词,它会匹配到Iraq fighting这样的字符串。

    为了解决反义的占用问题,我们可以使用负向零宽断言,因为它只匹配一个位置,不会消耗掉任何字符。上面表达式的可以写为\bq(?!u)\w*\b。

    同理,我们用(?

    一个更复杂的例子:(?).*(?=)

  看到前面的(?则代表html标记,如果前面的为,则后面零宽断言的意思是(使用了转义和后向引用)。所以这个正则表达式是为了匹配html标记之间的部分。

12.注释

通过语法(?#comment)来包含注释,例如2[0-4]\d(?#200-249)。

13.贪婪与懒惰

  在处理字符串匹配问题时,通常的行为是匹配尽可能多的字符。以表达式a.*b和字符串aabab为例,会匹配aabab,而不是匹配ab,这样的匹配规则称为贪婪匹配。

    而有时,我们需要匹配尽可能少字符的懒惰匹配,这时,需要在上面所说的限定符后面加上?,如a.*?b就将贪婪匹配转化为懒惰匹配,此时会匹配到aab(1-3的字符)和ab(4-5的字符)(具体原因涉及到正则表达式的匹配规则)。

14.处理选项

    类似于js里面的flag,有不区别大小写、多行模式、全局模式等。

15.平衡组/递归匹配

    这部分为了处理匹配问题,例如想匹配数学表达式中(5*3)))中的(5*3),不能简单的写为\(.*\),这样会匹配到整个表达式。那么应当采取的匹配策略类似于学到过的括号匹配问题,用栈来解决,遇到(压栈,遇到)弹栈,如果最后栈为空,这说明表达式里面的括号完全匹配,如果不为空,正则表达式引擎会回溯来使得括号匹配。

相关推荐:

JS的正则表达式如何使用


热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Golang 网络安全与加密实战
Golang 网络安全与加密实战

本专题系统讲解 Golang 在网络安全与加密技术中的应用,包括对称加密与非对称加密(AES、RSA)、哈希与数字签名、JWT身份认证、SSL/TLS 安全通信、常见网络攻击防范(如SQL注入、XSS、CSRF)及其防护措施。通过实战案例,帮助学习者掌握 如何使用 Go 语言保障网络通信的安全性,保护用户数据与隐私。

2

2026.01.29

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

446

2026.01.28

包子漫画在线官方入口大全
包子漫画在线官方入口大全

本合集汇总了包子漫画2026最新官方在线观看入口,涵盖备用域名、正版无广告链接及多端适配地址,助你畅享12700+高清漫画资源。阅读专题下面的文章了解更多详细内容。

145

2026.01.28

ao3中文版官网地址大全
ao3中文版官网地址大全

AO3最新中文版官网入口合集,汇总2026年主站及国内优化镜像链接,支持简体中文界面、无广告阅读与多设备同步。阅读专题下面的文章了解更多详细内容。

258

2026.01.28

php怎么写接口教程
php怎么写接口教程

本合集涵盖PHP接口开发基础、RESTful API设计、数据交互与安全处理等实用教程,助你快速掌握PHP接口编写技巧。阅读专题下面的文章了解更多详细内容。

9

2026.01.28

php中文乱码如何解决
php中文乱码如何解决

本文整理了php中文乱码如何解决及解决方法,阅读节专题下面的文章了解更多详细内容。

13

2026.01.28

Java 消息队列与异步架构实战
Java 消息队列与异步架构实战

本专题系统讲解 Java 在消息队列与异步系统架构中的核心应用,涵盖消息队列基本原理、Kafka 与 RabbitMQ 的使用场景对比、生产者与消费者模型、消息可靠性与顺序性保障、重复消费与幂等处理,以及在高并发系统中的异步解耦设计。通过实战案例,帮助学习者掌握 使用 Java 构建高吞吐、高可靠异步消息系统的完整思路。

10

2026.01.28

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

25

2026.01.27

拼多多赚钱的5种方法 拼多多赚钱的5种方法
拼多多赚钱的5种方法 拼多多赚钱的5种方法

在拼多多上赚钱主要可以通过无货源模式一件代发、精细化运营特色店铺、参与官方高流量活动、利用拼团机制社交裂变,以及成为多多进宝推广员这5种方法实现。核心策略在于通过低成本、高效率的供应链管理与营销,利用平台社交电商红利实现盈利。

124

2026.01.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
CSS3 教程
CSS3 教程

共18课时 | 5万人学习

Bootstrap 5教程
Bootstrap 5教程

共46课时 | 3.1万人学习

AngularJS教程
AngularJS教程

共24课时 | 3.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号