处理php换行符问题的背景
公司的一个业务要求用户上传CSV文件,这些文件内的数据是以逗号(,)分隔的,每一行表示一条数据。业务代码会读取这些数据,并根据特定的业务规则将其入库。然而,有用户反馈说,尽管他们上传的CSV文件符合规范,但上传后系统提示数据为空。
问题定位
在拿到用户的CSV文件后,我们使用Notepad++打开文件,发现文件的换行符与预期的\r\n不同,用户的CSV文件使用的是\r。经过与用户确认,了解到用户使用的是Mac电脑。由于Mac和Windows的换行符不同,导致了这个问题。业务代码是用PHP编写的,默认情况下无法识别\r,因此将CSV文件中的所有内容视为一行,从而导致业务错误。

立即学习“PHP免费学习笔记(深入)”;
解决方案
首先,紧急解决用户的问题。我们手动将用户的CSV文件中的\r替换为\r\n,并引导用户重新上传,从而解决了问题。
其次,为了彻底解决这个问题,我们考虑了两种修改PHP业务代码的方案:
-
修改php.ini文件,启用
auto_detect_line_endings配置,具体如下:auto_detect_line_endings = On
-
在业务代码中添加以下代码:
ini_set("auto_detect_line_endings", true);
原理说明
在不同操作系统中,换行符的使用有所不同:
- Unix系列使用
\n表示换行(New line),使光标移到行首。 - Windows系列使用
\r\n表示回车换行(Carriage return + New line),使光标下移一格并移到行首。 - Mac使用
\r表示回车(Carriage return),使光标下移一格。
在日常使用电脑时,我们习惯于通过按回车键同时实现回车和换行。Unix/Mac系统下的文件在Windows中打开时,所有文字会变成一行;而Windows中的文件在Unix/Mac下打开时,每行的结尾可能会多出一个^M符号。
auto_detect_line_endings是一个布尔值配置。当设置为On时,PHP会检查通过fgets()和file()获取的数据中的行结束符号是否符合Unix、MS-DOS还是Macintosh的习惯。这使得PHP可以与Macintosh系统交互操作,但默认值为Off,因为在检测第一行的EOL习惯时会有很小的性能损失,而且在Unix系统下使用回车符号作为项目分隔符的人们会遭遇向下不兼容的行为。
参考资料











