0

0

如何用PHP将字符串按正则表达式转为数组?preg_split详解

星夢妙者

星夢妙者

发布时间:2025-08-30 11:53:01

|

886人浏览过

|

来源于php中文网

原创

preg_split函数通过正则表达式实现复杂字符串分割,支持模式化分隔符、限制分割数量、过滤空结果、捕获分隔符及获取子串偏移量,适用于灵活高效的字符串处理场景。

如何用php将字符串按正则表达式转为数组?preg_split详解

当需要在PHP中根据复杂的模式,而非简单的固定字符串来分割一个字符串时,

preg_split
函数是你的首选工具。它利用正则表达式的强大能力,将输入字符串拆解成一个数组,这比传统的
explode
函数灵活得多。

解决方案:

preg_split
函数的核心在于其能够识别并使用正则表达式作为分隔符。它的基本语法是
preg_split(string $pattern, string $subject, int $limit = -1, int $flags = 0): array

这里面几个参数都挺关键的:

  • $pattern
    : 这就是你的正则表达式。它定义了你希望在哪些地方将字符串“切开”。记住,正则表达式需要用分隔符(比如
    /
    )包裹起来。
  • $subject
    : 你要处理的那个原始字符串。
  • $limit
    : 一个可选参数,默认是
    -1
    。如果你指定了一个正整数,那么返回的数组最多只会有
    limit
    个元素,最后一个元素会包含
    subject
    字符串的剩余部分。如果设置为
    0
    ,效果和
    -1
    一样。
  • $flags
    : 这也是个可选参数,用来控制
    preg_split
    的行为。有几个常用的旗标,比如
    PREG_SPLIT_NO_EMPTY
    (不返回空字符串结果)、
    PREG_SPLIT_DELIM_CAPTURE
    (捕获分隔符)、
    PREG_SPLIT_OFFSET_CAPTURE
    (同时返回匹配项的偏移量)。

举个例子,假设我们有一个字符串 "apple,banana;orange-grape",我们想用逗号、分号或连字符来分割它。如果用

explode
,那就得写好几行代码循环处理,但
preg_split
一行就能搞定:

立即学习PHP免费学习笔记(深入)”;

<?php
$string = "apple,banana;orange-grape";
$parts = preg_split('/[,;-]/', $string);
print_r($parts);
/*
输出:
Array
(
    [0] => apple
    [1] => banana
    [2] => orange
    [3] => grape
)
*/

// 如果我们只想得到前两个元素,剩余的作为第三个元素
$limited_parts = preg_split('/[,;-]/', $string, 3);
print_r($limited_parts);
/*
输出:
Array
(
    [0] => apple
    [1] => banana
    [2] => orange-grape
)
*/
?>

在我看来,

preg_split
的真正威力在于它能处理那些非固定的、模式化的分隔符。比如,你可能需要根据一个或多个空白字符来分割,或者根据HTML标签来拆分文本,这些都是
explode
无法胜任的。

PHP中的
preg_split
explode
函数:何时选用?

这是一个很常见的问题,很多初学者都会在

preg_split
explode
之间犹豫。简单来说,它们的核心区别在于分隔符的类型。
explode
函数只能使用一个简单的字符串作为分隔符,而
preg_split
则可以使用复杂的正则表达式。

想象一下,你有一串用逗号分隔的商品名称,

explode(',', $string)
就能完美解决。但如果你的分隔符不总是逗号,有时候是逗号,有时候是分号,甚至是一串不确定的空白字符(比如一个或多个空格、制表符),这时候
explode
就显得力不从心了。你可能需要多次调用
explode
,或者先用
str_replace
统一分隔符,这无疑增加了代码的复杂度和维护成本。

preg_split
的优势就在于此。通过编写一个适当的正则表达式,你可以一次性匹配所有可能的分隔符。例如,
/[,;\s]+/
就能匹配一个或多个逗号、分号或空白字符。所以,我的建议是:如果你的分隔符是固定的、单一的字符串,用
explode
更高效、更简洁;但如果分隔符是变化的、复杂的模式,或者你需要更高级的分割逻辑,那么毫无疑问,
preg_split
是更强大的选择。过度使用
preg_split
来处理简单的分隔符,虽然功能上没问题,但可能会带来轻微的性能损耗,而且代码可读性也不一定比
explode
好。

如何在
preg_split
中有效处理空匹配项?

在使用

preg_split
时,一个常见的“陷阱”就是生成意料之外的空字符串元素。这通常发生在分隔符出现在字符串的开头、结尾,或者两个分隔符紧密相连时。比如,字符串 "apple,,banana" 用逗号分割,你会得到
['apple', '', 'banana']
。很多时候,我们并不希望这些空字符串出现在最终结果中。

为了解决这个问题,

preg_split
提供了一个非常实用的旗标:
PREG_SPLIT_NO_EMPTY
。顾名思义,这个旗标的作用就是告诉
preg_split
不要将空的匹配项添加到结果数组中。

B12
B12

B12是一个由AI驱动的一体化网站建设平台

下载

看个例子你就明白了:

<?php
$string_with_empty = "  apple   banana  ";
// 默认行为,会包含空字符串
$parts_default = preg_split('/\s+/', $string_with_empty);
print_r($parts_default);
/*
输出:
Array
(
    [0] =>
    [1] => apple
    [2] =>
    [3] => banana
    [4] =>
)
*/

// 使用 PREG_SPLIT_NO_EMPTY 旗标
$parts_no_empty = preg_split('/\s+/', $string_with_empty, -1, PREG_SPLIT_NO_EMPTY);
print_r($parts_no_empty);
/*
输出:
Array
(
    [0] => apple
    [1] => banana
)
*/
?>

显而易见,

PREG_SPLIT_NO_EMPTY
极大地简化了后处理的逻辑。你不再需要手动
array_filter
来去除空值。在实际开发中,尤其是在处理用户输入或者解析日志文件时,这个旗标几乎是必不可少的,它能让你的代码更健壮,结果更符合预期。

PHP
preg_split
如何捕获分隔符或获取子串的偏移量?

preg_split
的强大之处不仅在于它能按模式分割字符串,还在于它提供了额外的旗标来获取更多关于分割过程的信息,比如分隔符本身,或者每个分割出的子串在原字符串中的起始位置。这对于需要更精细控制和分析字符串的应用场景来说,简直是雪中送炭。

捕获分隔符:

PREG_SPLIT_DELIM_CAPTURE

有时候,我们不仅想知道分割后的内容是什么,还想知道具体是用哪个分隔符分割的。

PREG_SPLIT_DELIM_CAPTURE
旗标就能实现这一点。当你将这个旗标与
preg_split
一起使用时,如果你的正则表达式中包含捕获组(用圆括号
()
包裹的部分),那么这些被捕获的分隔符也会作为独立的元素包含在结果数组中。

<?php
$data_string = "Name:John;Age:30|City:New York";
// 尝试分割,并捕获分隔符
$parts_with_delims = preg_split('/(:|;|\|)/', $data_string, -1, PREG_SPLIT_DELIM_CAPTURE);
print_r($parts_with_delims);
/*
输出:
Array
(
    [0] => Name
    [1] => :
    [2] => John
    [3] => ;
    [4] => Age
    [5] => :
    [6] => 30
    [7] => |
    [8] => City
    [9] => :
    [10] => New York
)
*/
?>

可以看到,冒号、分号和竖线这些分隔符都被捕获并插入到了结果数组中。这在解析复杂的数据格式,需要同时处理数据和其上下文(即分隔符的类型)时非常有用。

获取子串偏移量:

PREG_SPLIT_OFFSET_CAPTURE

另一个非常强大的旗标是

PREG_SPLIT_OFFSET_CAPTURE
。它不仅仅返回分割后的子字符串,还会返回每个子字符串在原始输入字符串中的字节偏移量。这对于需要知道每个部分原始位置的场景(比如语法高亮、错误定位)来说,是不可或缺的。

当使用

PREG_SPLIT_OFFSET_CAPTURE
时,结果数组中的每个元素本身又是一个数组,其中包含两个值:第一个是匹配到的子字符串,第二个是它在原始字符串中的起始偏移量。

<?php
$sentence = "Hello world, this is a test.";
// 分割并获取偏移量
$words_with_offsets = preg_split('/\s+/', $sentence, -1, PREG_SPLIT_OFFSET_CAPTURE | PREG_SPLIT_NO_EMPTY);
print_r($words_with_offsets);
/*
输出:
Array
(
    [0] => Array
        (
            [0] => Hello
            [1] => 0
        )

    [1] => Array
        (
            [0] => world,
            [1] => 6
        )

    [2] => Array
        (
            [0] => this
            [1] => 12
        )

    [3] => Array
        (
            [0] => is
            [1] => 17

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
js正则表达式
js正则表达式

php中文网为大家提供各种js正则表达式语法大全以及各种js正则表达式使用的方法,还有更多js正则表达式的相关文章、相关下载、相关课程,供大家免费下载体验。

531

2023.06.20

正则表达式不包含
正则表达式不包含

正则表达式,又称规则表达式,,是一种文本模式,包括普通字符和特殊字符,是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串,通常被用来检索、替换那些符合某个模式的文本。php中文网给大家带来了有关正则表达式的相关教程以及文章,希望对大家能有所帮助。

258

2023.07.05

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

767

2023.07.05

java正则表达式匹配字符串
java正则表达式匹配字符串

在Java中,我们可以使用正则表达式来匹配字符串。本专题为大家带来java正则表达式匹配字符串的相关内容,帮助大家解决问题。

219

2023.08.11

正则表达式空格
正则表达式空格

正则表达式空格可以用“s”来表示,它是一个特殊的元字符,用于匹配任意空白字符,包括空格、制表符、换行符等。本专题为大家提供正则表达式相关的文章、下载、课程内容,供大家免费下载体验。

357

2023.08.31

Python爬虫获取数据的方法
Python爬虫获取数据的方法

Python爬虫可以通过请求库发送HTTP请求、解析库解析HTML、正则表达式提取数据,或使用数据抓取框架来获取数据。更多关于Python爬虫相关知识。详情阅读本专题下面的文章。php中文网欢迎大家前来学习。

293

2023.11.13

正则表达式空格如何表示
正则表达式空格如何表示

正则表达式空格可以用“s”来表示,它是一个特殊的元字符,用于匹配任意空白字符,包括空格、制表符、换行符等。想了解更多正则表达式空格怎么表示的内容,可以访问下面的文章。

245

2023.11.17

正则表达式中如何匹配数字
正则表达式中如何匹配数字

正则表达式中可以通过匹配单个数字、匹配多个数字、匹配固定长度的数字、匹配整数和小数、匹配负数和匹配科学计数法表示的数字的方法匹配数字。更多关于正则表达式的相关知识详情请看本专题下面的文章。php中文网欢迎大家前来学习。

548

2023.12.06

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

69

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13.6万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号