0

0

基本原理是使用一系列特殊字符和语法来匹配和操作文本数据。正则表达式通常包括模式字符串,用于描述要匹配的文本模式,以及一个或多个特殊字符和语法,用于控制匹配的方式和结果。Python中的正则表达式通常使用re模块来实现

WBOY

WBOY

发布时间:2023-05-10 09:40:14

|

1483人浏览过

|

来源于亿速云

转载

    正则表达式是什么?

    正则表达式,又称规则表达式,(英语:regular expression,在代码中常简写为 regex、regexp 或 re),它是计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式的文本。 许多程序设计语言都支持利用正则表达式进行字符串操作。例如在 perl 中内建了一个功能强大的正则表达式引擎。正则表达式这个概念最初是由 unix 中的工具软件普及开的。正则表达式是对字符串(包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为"元字符"))操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个"规则字符串",这个"规则字符串"用来表达对字符串的一种过滤逻辑。正则表达式是一种文本模式,模式描述在搜索文本时要匹配的一个或多个字符串。

    1.实例引入

    说了一大堆废话,大家可能还是云里雾里的,我们通过实例来说明一下,我们可以用正则表达式测试工具,或者python都可以,首先,我们输入一段文本。

    hello,my name is Tina,my phone number is 123456 and my web is http://tina.com.
                                   [a-zA-z]+://[^\s]*

    我们就可以获取网页链接,也就是文本中的url,是不是很神奇?

    这是因为它有自己的匹配规则,部分如下。

    模式 描述
    . 任意字符
    * 0个或者多个表达式
    + 一个或者多个表达式

      关于更多的匹配规则可自行查阅。

    立即学习Python免费学习笔记(深入)”;

    ?,*,+,\d,\w 都是等价字符

    ?等价于匹配长度{0,1}

    *等价于匹配长度{0,}

    +等价于匹配长度{1,}

    \d 等价于[0-9]

    \D 等价于[^0-9]

    \w 等价于[A-Za-z_0-9]

    \W 等价于[^A-Za-z_0-9]

    2.match()

            这里介绍一个常用的匹配方法——match(),向他传入要匹配的字符串以及正则表达式,就可以检测这个正则表达式是否匹配字符串。

    匹配目标

    res = re.match('hello\s(\d+)sword')

    贪婪匹配

    res = re.match('hello.*(\d+)sword')

    3.findall()

    我们最常用的就是这个,我们看看这个是如何使用的。

    import re
     
    useData = str(input('请输入字符串数据:'))
     
    '''
    匹配字符串中的数字,+是匹配前面的子表达式一次或多次
    '''
    digital = re.findall('\d+',useData)
     
    print(digital)

    我们看看运行结果

    Python正则表达式的基本原理是什么

     findall()函数是返回所有匹配到的字符串,返回值的数据类型为列表。

    怪兽AI数字人
    怪兽AI数字人

    数字人短视频创作,数字人直播,实时驱动数字人

    下载

    常用符号

    我们再来说说正则表达式的常用符号吧。

    “.”字符为匹配任意单个字符。

    “\”字符为转义字符。

    “[…]”为字符集。

    “(.*?)” 是python爬虫最常用的一个字符,叫贪心算法,可以匹配任意的字符。

     下面我们看一个示例代码。

    import re
     
    a=‘xxixxjshdxxlovexxsfhxxpythonxx'
     
    data=re.findall(‘xx(.*?)xx')
     
    print(data)

    我们运行一下,看下效果。

    运行结果
    [‘I’ ,‘love’,‘python’]

    特殊字符

     所谓特殊字符,就是一些有特殊含义的字符,比如讲 runoo*b 中的 ,简单的说就是表示任何字符串的意思。如果要查找字符串中的 * 符号,则需要对 * 进行转义,即在其前加一个 \,runo*ob 匹配字符串 runo\*ob。

     许多元字符要求在试图匹配它们时特别对待。若要匹配这些特殊字符,必须首先使字符"转义",即,将反斜杠字符\ 放在它们前面。下表列出了正则表达式中的特殊字符:

    特别字符 描述
    $

    匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性,则 $ 也匹配 ‘\n’ 或 ‘\r’。要匹配 $ 字符本身,请使用 $。

    () 标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。要匹配这些字符,请使用 ( 和 )。
    * 匹配前面的子表达式零次或多次。要匹配 * 字符,请使用 *。
    + 匹配前面的子表达式一次或多次。要匹配 + 字符,请使用 +。
    . 匹配除换行符 \n 之外的任何单字符。要匹配 . ,请使用 . 。

     概念说了一大堆,大家可能也记不住,我直接说几个案例,大家就能明白其他的道理。

    这是某网的HTML,部分片段如下:

    §123
     
    §133
     
    §156
     
    §189

       大家会发现只有中间的一段不一样,而不一样的数据就是我们想要的,我们怎么用正则表达式提取出来呢.

    §(.*?)

    就可以了,我们看看效果吧。

    123
    133
    156
    189

    相关文章

    python速学教程(入门到精通)
    python速学教程(入门到精通)

    python怎么学习?python怎么入门?python在哪学?python怎么学才快?不用担心,这里为大家提供了python速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

    下载

    本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

    热门AI工具

    更多
    DeepSeek
    DeepSeek

    幻方量化公司旗下的开源大模型平台

    豆包大模型
    豆包大模型

    字节跳动自主研发的一系列大型语言模型

    通义千问
    通义千问

    阿里巴巴推出的全能AI助手

    腾讯元宝
    腾讯元宝

    腾讯混元平台推出的AI助手

    文心一言
    文心一言

    文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

    讯飞写作
    讯飞写作

    基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

    即梦AI
    即梦AI

    一站式AI创作平台,免费AI图片和视频生成。

    ChatGPT
    ChatGPT

    最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

    相关专题

    更多
    js正则表达式
    js正则表达式

    php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法,还有更多js正则表达式的相关文章、相关下载、相关课程,供大家免费下载体验。

    515

    2023.06.20

    正则表达式不包含
    正则表达式不包含

    正则表达式,又称规则表达式,,是一种文本模式,包括普通字符和特殊字符,是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式的文本。php中文网给大家带来了有关正则表达式的相关教程以及文章,希望对大家能有所帮助。

    251

    2023.07.05

    java正则表达式语法
    java正则表达式语法

    java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

    749

    2023.07.05

    java正则表达式匹配字符串
    java正则表达式匹配字符串

    在Java中,我们可以使用正则表达式来匹配字符串。本专题为大家带来java正则表达式匹配字符串的相关内容,帮助大家解决问题。

    215

    2023.08.11

    正则表达式空格
    正则表达式空格

    正则表达式空格可以用“s”来表示,它是一个特殊的元字符,用于匹配任意空白字符,包括空格、制表符、换行符等。本专题为大家提供正则表达式相关的文章、下载、课程内容,供大家免费下载体验。

    351

    2023.08.31

    Python爬虫获取数据的方法
    Python爬虫获取数据的方法

    Python爬虫可以通过请求库发送HTTP请求、解析库解析HTML、正则表达式提取数据,或使用数据抓取框架来获取数据。更多关于Python爬虫相关知识。详情阅读本专题下面的文章。php中文网欢迎大家前来学习。

    293

    2023.11.13

    正则表达式空格如何表示
    正则表达式空格如何表示

    正则表达式空格可以用“s”来表示,它是一个特殊的元字符,用于匹配任意空白字符,包括空格、制表符、换行符等。想了解更多正则表达式空格怎么表示的内容,可以访问下面的文章。

    236

    2023.11.17

    正则表达式中如何匹配数字
    正则表达式中如何匹配数字

    正则表达式中可以通过匹配单个数字、匹配多个数字、匹配固定长度的数字、匹配整数和小数、匹配负数和匹配科学计数法表示的数字的方法匹配数字。更多关于正则表达式的相关知识详情请看本专题下面的文章。php中文网欢迎大家前来学习。

    534

    2023.12.06

    2026赚钱平台入口大全
    2026赚钱平台入口大全

    2026年最新赚钱平台入口汇总,涵盖任务众包、内容创作、电商运营、技能变现等多类正规渠道,助你轻松开启副业增收之路。阅读专题下面的文章了解更多详细内容。

    54

    2026.01.31

    热门下载

    更多
    网站特效
    /
    网站源码
    /
    网站素材
    /
    前端模板

    精品课程

    更多
    相关推荐
    /
    热门推荐
    /
    最新课程
    最新Python教程 从入门到精通
    最新Python教程 从入门到精通

    共4课时 | 22.4万人学习

    Django 教程
    Django 教程

    共28课时 | 3.7万人学习

    SciPy 教程
    SciPy 教程

    共10课时 | 1.3万人学习

    关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
    php中文网:公益在线php培训,帮助PHP学习者快速成长!
    关注服务号 技术交流群
    PHP中文网订阅号
    每天精选资源文章推送

    Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号