0

0

PHP语言如何实现字符串的拼接与截取操作 PHP语言字符串处理的入门方法指南​

雪夜

雪夜

发布时间:2025-08-01 18:51:01

|

163人浏览过

|

来源于php中文网

原创

php中字符串拼接最直接的方式是使用点号(.)操作符,也可用双引号实现变量解析;截取推荐使用mb_substr()处理多字节字符以避免乱码。1. 拼接可用.操作符或双引号内插变量,后者更简洁;2. 单引号不解析变量和转义,双引号会解析,性能差异在现代php中可忽略;3. 中文截取必须用mb_substr()并指定utf-8编码,防止substr()按字节截取导致乱码;4. 高级技巧包括sprintf()格式化、explode/implode数组转换、str_replace/preg_replace替换;5. 常见陷阱有编码不一致、sql注入、xss攻击、路径遍历及大字符串循环操作性能问题,需使用预处理、转义输出和流处理等方案规避。

PHP语言如何实现字符串的拼接与截取操作 PHP语言字符串处理的入门方法指南​

PHP语言实现字符串的拼接,最直接的方式就是使用点号(

.
)操作符,它能将两个或多个字符串变量或字面量连接起来。至于截取,我们通常会用到
substr()
函数,但在处理中文或其他多字节字符时,
mb_substr()
才是更稳妥的选择,这是个常常被忽视但又极其关键的细节。

PHP语言如何实现字符串的拼接与截取操作 PHP语言字符串处理的入门方法指南​

解决方案

谈到PHP里的字符串处理,拼接和截取无疑是两大基石,几乎每个项目都会用到。

字符串拼接

立即学习PHP免费学习笔记(深入)”;

PHP语言如何实现字符串的拼接与截取操作 PHP语言字符串处理的入门方法指南​

最常见也最直观的方法,就是用那个小小的点号

.
。它就像一根无形的线,把不同的字符串片段缝合在一起。

<?php
$firstName = "张";
$lastName = "三";
$fullName = $firstName . $lastName; // 拼接字符串
echo $fullName; // 输出:张三

$greeting = "你好," . $fullName . "!欢迎来到PHP的世界。";
echo $greeting; // 输出:你好,张三!欢迎来到PHP的世界。
?>

除了点号,双引号字符串内部的变量解析(interpolation)也是一种非常方便的拼接方式。我个人在构建简短、变量明确的字符串时,非常喜欢用这种方式,因为它看起来更简洁,可读性也高。

PHP语言如何实现字符串的拼接与截取操作 PHP语言字符串处理的入门方法指南​
<?php
$item = "苹果";
$price = 5.99;
$message = "你购买了{$item},价格是{$price}元。"; // 变量直接在双引号内解析
echo $message; // 输出:你购买了苹果,价格是5.99元。

// 甚至可以处理数组元素或对象属性
$user = ['name' => '李四', 'age' => 30];
echo "用户:{$user['name']},年龄:{$user['age']}。"; // 输出:用户:李四,年龄:30。
?>

当然,有些人会纠结于性能,觉得点号拼接比双引号解析快。在现代PHP版本中,这种性能差异微乎其微,几乎可以忽略不计。所以,选择哪种方式,更多时候取决于你的代码风格和可读性偏好。我倾向于“清晰胜于一切”的原则。

字符串截取

截取操作主要是通过

substr()
函数来完成的。它需要三个参数:原字符串、开始位置、以及截取长度。

<?php
$text = "PHP语言字符串处理入门指南";

// 从第0个字符开始,截取3个字符
$part1 = substr($text, 0, 3);
echo $part1; // 输出:PHP

// 从第7个字符开始,截取到字符串末尾
$part2 = substr($text, 6); // 注意:中文在substr下可能被误判为多字节,这里仅作英文示例
echo $part2; // 输出:符串处理入门指南 (如果按字节算,这里可能会乱码)

// 从倒数第5个字符开始,截取3个字符
$part3 = substr($text, -5, 3);
echo $part3; // 输出:入门指 (同样,中文需谨慎)
?>

然而,这里有个大坑,尤其是当你处理中文、日文、韩文这类多字节字符时。

substr()
是按照字节来截取的,一个中文字符通常占3个字节。这意味着如果你用
substr($text, 0, 1)
去截取一个中文字符,你很可能得到的是乱码,因为它只截取了那个中文字符的第一个字节。这就是为什么我们强烈推荐使用
mb_substr()
函数,它是多字节字符串函数库(MultiByte String Functions)的一部分,能够正确地按字符而不是字节进行截取。

<?php
$text_mb = "你好世界,PHP是最好的语言!";

// 使用mb_substr正确截取中文
$part_mb1 = mb_substr($text_mb, 0, 2, 'UTF-8'); // 从0开始,截取2个字符
echo $part_mb1; // 输出:你好

// 从第3个字符开始,截取到末尾
$part_mb2 = mb_substr($text_mb, 3, null, 'UTF-8'); // null表示到字符串末尾
echo $part_mb2; // 输出:世界,PHP是最好的语言!

// 从倒数第6个字符开始,截取4个字符
$part_mb3 = mb_substr($text_mb, -6, 4, 'UTF-8');
echo $part_mb3; // 输出:最好的语言
?>

使用

mb_substr()
时,指定编码(如
UTF-8
)非常重要,否则它可能会依赖于PHP内部的编码设置,导致不一致的行为。

PHP字符串拼接时,单引号与双引号有什么区别?性能考量与最佳实践

这个问题,我经常在代码审查时遇到,也常有人问我。最核心的区别在于:双引号字符串会解析变量和一些转义序列(比如

\n
换行符),而单引号字符串则不会,它会将内容几乎原样输出。

<?php
$name = "Alice";
echo "Hello, $name!\n"; // 输出:Hello, Alice! (并换行)
echo 'Hello, $name!\n'; // 输出:Hello, $name!\n (原样输出)
?>

从性能角度看,过去确实流传着“单引号比双引号快”的说法。这在PHP早期版本,或者说在某些极端微观场景下,或许成立。因为双引号需要额外的时间去扫描和解析内部的变量和转义序列。但随着PHP引擎的不断优化,特别是PHP 7及更高版本,这种性能差异已经变得非常小,在绝大多数实际应用中几乎可以忽略不计。你写1000个字符串,可能节省了几微秒,但牺牲了代码的清晰度和表达力,这在我看来是得不偿失的。

所以,我的最佳实践是:

  • 需要变量解析或特定转义序列时,使用双引号。 比如构建用户提示信息、HTML片段等。
  • 字符串内容是纯粹的字面量,不包含任何变量或需要解析的转义序列时,使用单引号。 这有助于明确意图,也避免了PHP引擎做不必要的解析工作(虽然现在很快)。例如,数据库查询中的字符串常量、数组键名、CSS选择器等。

选择哪种引号,更多是关于代码的可读性、维护性以及意图表达,而非单纯的性能微优化。

如何安全有效地处理包含中文或其他多字节字符的PHP字符串截取?

这真的是一个老生常谈,但又极其容易出错的问题。简单粗暴地使用

substr()
来截取包含中文的字符串,几乎必然会导致乱码。原因很简单:
substr()
不知道什么是“字符”,它只知道“字节”。而一个中文字符在UTF-8编码下,通常占用3个字节。如果你只想截取一个中文字符,
substr()
可能会截取到该字符的某个字节片段,结果自然就是一堆乱码。

Favird
Favird

极其棒且有价值的互联网资源目录!

下载

解决方案,正如前面提到的,是使用PHP的多字节字符串函数库(MBString)。具体到截取,就是

mb_substr()

<?php
$longText = "PHP语言字符串处理是Web开发中的核心技能,尤其是在处理多语言内容时,更需要谨慎。";

// 错误的示范:使用substr截取中文,可能导致乱码
$wrongSnippet = substr($longText, 0, 5); // 可能会截断一个中文字符的字节
echo "错误截取(substr):" . $wrongSnippet . "\n";

// 正确的示范:使用mb_substr截取中文
// 关键在于指定正确的字符编码,通常是'UTF-8'
$correctSnippet = mb_substr($longText, 0, 5, 'UTF-8');
echo "正确截取(mb_substr):" . $correctSnippet . "\n"; // 输出:PHP语言字

// 如果需要获取字符串的字符长度,而不是字节长度,也要用mb_strlen
$charLength = mb_strlen($longText, 'UTF-8');
echo "字符长度:" . $charLength . "\n"; // 输出:字符长度:44

// 截取最后几个字符
$lastChars = mb_substr($longText, -4, null, 'UTF-8');
echo "最后四个字符:" . $lastChars . "\n"; // 输出:需要谨慎。
?>

在使用

mb_substr()
时,指定第四个参数
encoding
'UTF-8'
是至关重要的
。虽然你也可以通过
mb_internal_encoding('UTF-8');
来全局设置内部编码,但我个人更倾向于在每次调用
mb_*
函数时明确指定编码,这样代码的意图更清晰,也避免了全局设置可能带来的潜在冲突或遗漏。

确保你的PHP环境已经启用了MBString扩展。在

php.ini
中,你需要确保
extension=mbstring
没有被注释掉。这通常是默认开启的,但遇到问题时值得检查一下。

除了基本的拼接与截取,PHP在字符串处理上还有哪些高级技巧或常见陷阱?

字符串处理远不止拼接和截取这么简单,PHP提供了非常丰富的函数来应对各种复杂的场景。

高级技巧:

  1. 格式化输出

    sprintf()
    当你需要按照特定格式组合字符串时,
    sprintf()
    简直是神器。它允许你定义一个格式模板,然后将变量按顺序填充进去。这比用点号拼接一大堆变量和固定文本要清晰得多。

    <?php
    $product = "笔记本电脑";
    $price = 7999.50;
    $quantity = 2;
    $total = $price * $quantity;
    
    $receipt = sprintf("您购买了 %d 台 %s,单价 %.2f 元,总计 %.2f 元。",
                       $quantity, $product, $price, $total);
    echo $receipt;
    // 输出:您购买了 2 台 笔记本电脑,单价 7999.50 元,总计 15999.00 元。
    ?>

    这种方式在生成报告、日志或复杂的用户提示时特别有用。

  2. 字符串与数组的转换:

    explode()
    implode()
    explode()
    可以根据指定的分隔符将字符串拆分成数组,而
    implode()
    (或
    join()
    ,它们是别名)则能将数组元素用指定的分隔符连接成一个字符串。

    <?php
    $tagsString = "PHP,Web开发,字符串,教程";
    $tagsArray = explode(",", $tagsString); // 字符串转数组
    print_r($tagsArray);
    // 输出:Array ( [0] => PHP [1] => Web开发 [2] => 字符串 [3] => 教程 )
    
    $users = ["张三", "李四", "王五"];
    $usersString = implode(" | ", $users); // 数组转字符串
    echo $usersString; // 输出:张三 | 李四 | 王五
    ?>

    这是处理标签、列表数据等常见场景的利器。

  3. 查找与替换:

    str_replace()
    preg_replace()
    str_replace()
    用于简单的字符串替换,而
    preg_replace()
    则支持正则表达式,功能更为强大和灵活。

    <?php
    $text = "Hello World, hello PHP.";
    $newText = str_replace("hello", "Hi", $text); // 简单替换
    echo $newText; // 输出:Hello World, Hi PHP. (注意大小写敏感)
    
    $textHtml = "<p>这是一个段落。</p><script>alert('XSS');</script>";
    // 使用正则表达式移除script标签
    $cleanHtml = preg_replace("/<script\b[^>]*>(.*?)<\/script>/is", "", $textHtml);
    echo $cleanHtml; // 输出:<p>这是一个段落。</p>
    ?>

    正则表达式是处理复杂文本模式匹配和替换的终极武器,但它也需要一定的学习成本。

常见陷阱:

  1. 编码问题反复出现: 我前面强调过

    mb_substr()
    ,但编码问题远不止于此。从数据库读取数据、接收用户输入、输出到浏览器,任何环节的编码不一致都可能导致乱码。始终保持UTF-8编码的一致性是最佳实践。

  2. 用户输入与安全: 当你将用户提供的字符串拼接进SQL查询、HTML输出或文件路径时,如果不进行适当的验证和转义,就可能面临严重的安全风险。

    • SQL注入: 绝不能直接将用户输入拼接到SQL查询中。请使用预处理语句(Prepared Statements),这是防止SQL注入最有效的方式。
    • XSS(跨站脚本攻击): 当你将用户输入直接输出到HTML页面时,恶意脚本可能会被注入。始终使用
      htmlspecialchars()
      htmlentities()
      对输出进行转义,或者使用专门的模板引擎(如Twig、Blade)来自动处理。
    • 文件路径遍历: 拼接文件路径时,用户输入
      ../
      等字符可能导致访问非预期文件。务必对路径进行严格验证和清理。
  3. 性能陷阱(大型字符串操作): 虽然PHP在字符串处理方面效率很高,但如果你在循环中对非常大的字符串进行频繁的拼接、截取或替换操作,仍然可能导致性能瓶颈。在处理海量文本时,考虑是否可以分批处理,或者使用更底层的流操作。不过,对于绝大多数Web应用场景,这通常不是一个需要过度担忧的问题。

字符串处理是Web开发的基石,理解并熟练运用这些技巧和规避陷阱,能让你的代码更健壮、更安全。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

1134

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

340

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

381

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

2174

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

380

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

1703

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

585

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

440

2024.04.29

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

37

2026.03.12

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13.4万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号