0

0

PHP正则表达式入门教程[转]

php中文网

php中文网

发布时间:2016-06-23 14:37:59

|

983人浏览过

|

来源于php中文网

原创

思维导图

点击下图,可以看具体内容!

       正则表达式,大家在开发中应该是经常用到,现在很多开发语言都有正则表达式的应用,比如javascript,java,.net,php等等,我今天就把我对正则表达式的理解跟大家唠唠,不当之处,请多多指教!

需要知道的术语??下面的术语你知道多少?

Δ  定界符

Δ  字符域

Δ  修饰符

Δ  限定符

Δ  脱字符

Δ  通配符(正向预查,反向预查)

Δ  反向引用

Δ  惰性匹配

Δ  注释

Δ  零字符宽

       我们什么时候使用正则表达式呢?不是所有的字符操作都用正则就好了,php在某些方面用正则反而影响效率。当我们遇到 复杂文本数据的解析时候,用正则是比较好的选择。

      正则表达式在处理复杂字符操作的时候,可以 提高工作效率,也在一定程度 节省你的代码量。

       我们在使用正则表达式的时候,复杂的正则表达式会加大代码的 复杂度,让人很 难理解。所以我们有的时候需要在正则表达式内部添加注释。

通用模式

 ¤ 定界符,通常使用 "/"做为定界符开始和结束,也可以使用"#"。

  什么时候使用"#"呢?一般是在你的字符串中有 很多"/"字符的时候,因为正则的时候这种字符需要转义,比如uri。

     使用"/"定界符的代码如下.

$regex = '/^http:\/\/([\w.]+)\/([\w]+)\/([\w]+)\.html$/i';$str = 'http://www.youku.com/show_page/id_ABCDEFG.html';$matches = array();if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

    preg_match中的$matches[0]将包含与整个模式匹配的字符串。 

    使用"#"定界符的代码如下.这个时候对"/"就不转义!

$regex = '#^http://([\w.]+)/([\w]+)/([\w]+)\.html$#i';$str = 'http://www.youku.com/show_page/id_ABCDEFG.html';$matches = array();if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

  ¤ 修饰符:用于改变正则表达式的行为。

立即学习PHP免费学习笔记(深入)”;

     我们看到的('/^http:\/\/([\w.]+)\/([\w]+)\/([\w]+)\.html/i')中的最后一个"i"就是修饰符,表示忽略大小写,还有一个我们经常用到的是"x"表示忽略空格。

贡献代码:

  

$regex = '/HELLO/';$str = 'hello word';$matches = array();if(preg_match($regex, $str, $matches)){    echo 'No i:Valid Successful!',"\n";}if(preg_match($regex.'i', $str, $matches)){    echo 'YES i:Valid Successful!',"\n";}

 

  ¤ 字符域:[\w]用方括号扩起来的部分就是字符域。

  ¤ 限定符:如[\w]{3,5}或者[\w]*或者[\w]+这些[\w]后面的符号都表示限定符。现介绍具体意义。

     {3,5}表示3到5个字符。{3,}超过3个字符,{,5}最多5个,{3}三个字符。

     * 表示0到多个

     + 表示1到多个。

  ¤ 脱字符号

      ^:

          > 放在字符域(如:[^\w])中表示否定(不包括的意思)??“反向选择”

          >  放在表达式之前,表示以当前这个字符开始。(/^n/i,表示以n开头)。

      注意,我们经常管"\"叫"跳脱字符"。用于转义一些特殊符号,如".","/"

 

通配符(lookarounds):断言某些字符串中某些字符的存在与否!

lookarounds分两种:lookaheads(正向预查 ?=)和lookbehinds(反向预查?

> 格式:

正向预查:(?=) 相对应的 (?!)表示否定意思

反向预查:(?

前后紧跟字符

$regex = '/(?<=c)d(?=e)/';  /* d 前面紧跟c, d 后面紧跟e*/$str = 'abcdefgk';$matches = array();if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

否定意义:

$regex = '/(?<!c)d(?!e)/';  /* d 前面不紧跟c, d 后面不紧跟e*/$str = 'abcdefgk';$matches = array();if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

 

>字符宽度:零

验证零字符代码

$regex = '/HE(?=L)LO/i';$str = 'HELLO';$matches = array();if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

打印不出结果!

$regex = '/HE(?=L)LLO/i';$str = 'HELLO';$matches = array();if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

 能打印出结果!

说明:(?=L)意思是HE后面紧跟一个L字符。但是(?=L)本身不占字符,要与(L)区分,(L)本身占一个字符。

正则快速入门+常用的表达式
正则快速入门+常用的表达式

正则快速入门+常用的表达式

下载

捕获数据

没有指明类型而进行的分组,将会被获取,供以后使用。

> 指明类型指的是通配符。所以只有圆括号起始位置没有问号的才能被捕捉。

> 在同一个表达式内的引用叫做反向引用。

> 调用格式: \编号(如\1)。

$regex = '/^(Chuanshanjia)[\w\s!]+\1$/';    $str = 'Chuanshanjia thank Chuanshanjia';$matches = array();if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

 

> 避免捕获数据

   格式:(?:pattern)

   优点:将使有效反向引用数量保持在最小,代码更加、清楚。

>命名捕获组

   格式:(?P) 调用方式 (?P=组名)

$regex = '/(?P<author>chuanshanjia)[\s]Is[\s](?P=author)/i';$str = 'author:chuanshanjia Is chuanshanjia';$matches = array();if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

运行结果

惰性匹配(记住:会进行两部操作,请看下面的原理部分)

  格式:限定符?

     原理:"?":如果前面有限定符,会使用最小的数据。如“*”会取0个,而“+”会取1个,如过是{3,5}会取3个。

先看下面的两个代码:

代码1.

<?php$regex = '/heL*/i';$str = 'heLLLLLLLLLLLLLLLL';if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

  结果1.

 

代码2

<?php$regex = '/heL*?/i';$str = 'heLLLLLLLLLLLLLLLL';if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

  结果2

 

代码3,使用“+”

<?php$regex = '/heL+?/i';$str = 'heLLLLLLLLLLLLLLLL';if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

 结果3

代码4,使用{3,5}

<?php$regex = '/heL{3,10}?/i';$str = 'heLLLLLLLLLLLLLLLL';if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

 结果4

正则表达式的注释

格式:(?# 注释内容)

用途:主要用于复杂的注释

 贡献代码:是一个用于连接MYSQL数据库的正则表达式

$regex = '/    ^host=(?<!\.)([\d.]+)(?!\.)                 (?#主机地址)\|    ([\w!@#$%^&*()_+\-]+)                       (?#用户名)\|    ([\w!@#$%^&*()_+\-]+)                       (?#密码)(?!\|)$/ix';$str = 'host=192.168.10.221|root|123456';$matches = array();if(preg_match($regex, $str, $matches)){    var_dump($matches);}echo "\n";

 

特殊字符

 

特殊字符 解释
* 0到多次
+ 1到多次还可以写成{1,}
? 0或1次
. 匹配除换行符外的所有单个的字符
\w [a-zA-Z0-9_]
\s 空白字符(空格,换行符,回车符)[\t\n\r]
\d [0-9]

 

原文:http://www.cnblogs.com/baochuan/archive/2012/03/12/2391135.html

 

相关文章

PHP速学教程(入门到精通)
PHP速学教程(入门到精通)

PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

智谱清言 - 免费全能的AI助手
智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

相关专题

更多
batoto漫画官网入口与网页版访问指南
batoto漫画官网入口与网页版访问指南

本专题系统整理batoto漫画官方网站最新可用入口,涵盖最新官网地址、网页版登录页面及防走失访问方式说明,帮助用户快速找到batoto漫画官方平台,稳定在线阅读各类漫画内容。

24

2026.02.25

Steam官网正版入口与注册登录指南_新手快速进入游戏平台方法
Steam官网正版入口与注册登录指南_新手快速进入游戏平台方法

本专题系统整理Steam官网最新可用入口,涵盖网页版登录地址、新用户注册流程、账号登录方法及官方游戏商店访问说明,帮助新手玩家快速进入Steam平台,完成注册登录并管理个人游戏库。

1

2026.02.25

TypeScript全栈项目架构与接口规范设计
TypeScript全栈项目架构与接口规范设计

本专题面向全栈开发者,系统讲解基于 TypeScript 构建前后端统一技术栈的工程化实践。内容涵盖项目分层设计、接口协议规范、类型共享机制、错误码体系设计、接口自动化生成与文档维护方案。通过完整项目示例,帮助开发者构建结构清晰、类型安全、易维护的现代全栈应用架构。

0

2026.02.25

Python数据处理流水线与ETL工程实战
Python数据处理流水线与ETL工程实战

本专题聚焦 Python 在数据工程场景下的实际应用,系统讲解 ETL 流程设计、数据抽取与清洗、批处理与增量处理方案,以及数据质量校验与异常处理机制。通过构建完整的数据处理流水线案例,帮助开发者掌握数据工程中的性能优化思路与工程化规范,为后续数据分析与机器学习提供稳定可靠的数据基础。

0

2026.02.25

Java领域驱动设计(DDD)与复杂业务建模实战
Java领域驱动设计(DDD)与复杂业务建模实战

本专题围绕 Java 在复杂业务系统中的建模与架构设计展开,深入讲解领域驱动设计(DDD)的核心思想与落地实践。内容涵盖领域划分、聚合根设计、限界上下文、领域事件、贫血模型与充血模型对比,并结合实际业务案例,讲解如何在 Spring 体系中实现可演进的领域模型架构,帮助开发者应对复杂业务带来的系统演化挑战。

0

2026.02.25

Golang 生态工具与框架:扩展开发能力
Golang 生态工具与框架:扩展开发能力

《Golang 生态工具与框架》系统梳理 Go 语言在实际工程中的主流工具链与框架选型思路,涵盖 Web 框架、RPC 通信、依赖管理、测试工具、代码生成与项目结构设计等内容。通过真实项目场景解析不同工具的适用边界与组合方式,帮助开发者构建高效、可维护的 Go 工程体系,并提升团队协作与交付效率。

18

2026.02.24

Golang 性能优化专题:提升应用效率
Golang 性能优化专题:提升应用效率

《Golang 性能优化专题》聚焦 Go 应用在高并发与大规模服务中的性能问题,从 profiling、内存分配、Goroutine 调度、GC 机制到 I/O 与锁竞争逐层分析。结合真实案例讲解定位瓶颈的方法与优化策略,帮助开发者建立系统化性能调优思维,在保证代码可维护性的同时显著提升服务吞吐与稳定性。

9

2026.02.24

Golang 面试题精选:高频问题与解答
Golang 面试题精选:高频问题与解答

Golang 面试题精选》系统整理企业常见 Go 技术面试问题,覆盖语言基础、并发模型、内存与调度机制、网络编程、工程实践与性能优化等核心知识点。每道题不仅给出答案,还拆解背后的设计原理与考察思路,帮助读者建立完整知识结构,在面试与实际开发中都能更从容应对复杂问题。

5

2026.02.24

Golang 运行与部署实战:从本地到云端
Golang 运行与部署实战:从本地到云端

《Golang 运行与部署实战》围绕 Go 应用从开发完成到稳定上线的完整流程展开,系统讲解编译构建、环境配置、日志与配置管理、容器化部署以及常见运维问题处理。结合真实项目场景,拆解自动化构建与持续部署思路,帮助开发者建立可靠的发布流程,提升服务稳定性与可维护性。

5

2026.02.24

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
【李炎恢】ThinkPHP8.x 后端框架课程
【李炎恢】ThinkPHP8.x 后端框架课程

共50课时 | 4.7万人学习

php初学者入门课程
php初学者入门课程

共10课时 | 0.7万人学习

WEB前端教程【HTML5+CSS3+JS】
WEB前端教程【HTML5+CSS3+JS】

共101课时 | 9.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号