0

0

PHP 数组函数在数据清洗中的实战应用

舞夢輝影

舞夢輝影

发布时间:2026-03-05 19:54:01

|

877人浏览过

|

来源于php中文网

原创

php数组函数是数据清洗的核心工具:array_filter过滤脏数据,array_map批量转换格式,array_unique去重并需array_values重排索引,array_merge_recursive与array_replace_recursive分别用于递归合并与覆盖补全。

php 数组函数在数据清洗中的实战应用

PHP 数组函数是数据清洗过程中最常用、最高效的工具之一,尤其在处理表单提交、CSV 导入、API 响应等原始数据时,能快速完成去重、过滤、转换、结构重组等关键操作。

array_filter() 清理无效和脏数据

原始数据常含空值、零值、空白字符串或非法类型,array_filter() 可按自定义逻辑精准剔除。默认行为会移除所有“falsy”值(如 nullfalse0""),但需注意:若需保留 0"0",必须显式传入回调函数并明确判断。

  • 清除空字符串和 null,但保留 0 和 "0":
    array_filter($data, function($v) { return $v !== '' && $v !== null; })
  • 过滤非数字邮箱字段:
    array_filter($users, function($u) { return filter_var($u['email'], FILTER_VALIDATE_EMAIL); })

array_map() 统一格式与类型转换

清洗常需批量标准化,比如 trim 空格、转小写、强制转整型、HTML 实体解码等。array_map() 支持匿名函数或内置函数,一行代码即可作用于整个数组。

  • 批量清理字符串首尾空格并转小写:
    array_map('trim', array_map('strtolower', $names))
  • 将字符串数字转为整型,无效则设为 0:
    array_map(function($v) { return is_numeric($v) ? (int)$v : 0; }, $scores)
  • 对多维数组的某字段统一处理(配合 array_column + array_combine):
    $cleaned = array_map(function($row) { return ['id' => (int)$row['id'], 'name' => trim($row['name'])]; }, $raw_data);

array_unique() + array_values() 去重并重排索引

用户重复提交、日志合并或爬虫采集易产生重复记录。array_unique() 默认比较值,支持 SORT_REGULAR(默认)、SORT_STRING 等模式;但返回结果保留原始键名,需搭配 array_values() 重置为连续数字索引,避免后续 foreach 出现跳号或 JSON 编码成对象。

伴江行购物商城系统
伴江行购物商城系统

傻瓜式的程序安装和调试,用户无需考虑系统的安装维护,美观、友好的展示铺面,设计中应用了多种网络安全技术,顾客可以方便的查询并订购商品,用户可以方便的定义各种商品信息,系统选用强大的数据库保存各类信息,系统支持多种浏览器,功能模块清晰实用强大,系统有着良好的扩充性和升级性,强大的在线支付系统和订单系统登陆地址/admin/login.asp后台登陆账号:admin密码:admin

下载

立即学习PHP免费学习笔记(深入)”;

  • 去除二维数组中完全相同的记录(需先序列化):
    $unique = array_values(array_unique(array_map('serialize', $records)));<br>$clean = array_map('unserialize', $unique);
  • 按指定字段去重(如 email 唯一):
    利用临时键名去重:$seen = []; $filtered = []; foreach ($users as $u) { if (!isset($seen[$u['email']])) { $seen[$u['email']] = true; $filtered[] = $u; } }

array_merge_recursive()array_replace_recursive() 合并与覆盖配置/补全数据

清洗中常需将默认规则与用户输入合并,或把多个来源的数据按结构融合。array_merge_recursive() 会递归合并同名键(不覆盖,而是形成数组),适合收集多组标签或权限;array_replace_recursive() 则递归覆盖,更适合补全缺失字段(如用默认地址填充空的 user profile)。

  • 补全用户资料(仅覆盖空值,不破坏已有有效数据):
    $full_profile = array_replace_recursive($defaults, array_filter($input, function($v) { return $v !== null && $v !== ''; }));
  • 合并多批次导入的订单项(同 product_id 的 quantity 累加):
    先用 array_column($items, null, 'product_id') 建立索引,再遍历累加,比盲目 merge_recursive 更可控。

掌握这几个函数的边界行为和组合用法,就能应对 80% 以上的常规数据清洗场景。关键是理解每个函数的默认行为、键名处理逻辑和类型隐式转换风险——不复杂但容易忽略。

相关文章

PHP速学教程(入门到精通)
PHP速学教程(入门到精通)

PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

452

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

546

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

330

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

81

2025.09.10

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

252

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

1008

2024.03.01

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

839

2023.08.22

php中foreach用法
php中foreach用法

本专题整合了php中foreach用法的相关介绍,阅读专题下面的文章了解更多详细教程。

203

2025.12.04

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

4

2026.03.05

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PHP课程
PHP课程

共137课时 | 13万人学习

JavaScript ES5基础线上课程教学
JavaScript ES5基础线上课程教学

共6课时 | 11.3万人学习

PHP新手语法线上课程教学
PHP新手语法线上课程教学

共13课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号