0

0

C# 文件内容的数据质量验证 C#如何编写规则来校验文件内容是否符合规范

畫卷琴夢

畫卷琴夢

发布时间:2026-03-04 00:39:15

|

722人浏览过

|

来源于php中文网

原创

csv校验需用textfieldparser处理引号内逗号、tryparse防溢出、trim去bom/空行/注释,并用fieldrule类统一管理字段规则。

c# 文件内容的数据质量验证 c#如何编写规则来校验文件内容是否符合规范

校验 CSV 文件字段数量是否一致

字段数不一致是最常见的数据质量问题,比如某行多了一个逗号导致解析错位。直接用 string.Split(',') 容易误判,尤其当字段本身含逗号(在引号内)时。

实操建议用 Microsoft.VisualBasic.FileIO.TextFieldParser(.NET Framework / .NET 5+ 可用),它原生支持 RFC 4180 规范:

  • 启用 HasFieldsEnclosedInQuotes = true,正确处理带引号的字段
  • 逐行调用 ReadFields(),检查返回数组长度是否等于预期列数
  • 遇到 null 返回值说明解析失败(如引号不匹配),应立即报错

别自己写正则或手动计逗号——TextFieldParser 是微软封装好的、经过验证的方案。

检测数值字段是否超出业务范围

文件里写着“1234567890123”,但数据库字段是 int,直接 int.Parse() 会抛 OverflowException,而你可能只想要日志+跳过该行。

实操建议分两步走:

  • 先用 int.TryParse()decimal.TryParse() 判断是否可转为数字
  • 再比对业务规则:比如订单金额必须 ≥ 0 且 ≤ 1000000,用 if (value 1_000_000)
  • 避免用 Convert.ToInt32() —— 它在 null 或格式错误时直接抛异常,不利于容错处理

注意:浮点类字段(如 double)要额外防 NaNInfinitydouble.IsNaN()double.IsInfinity() 得显式检查。

识别并跳过空行、注释行和 BOM 头

用户导出的 Excel 转 CSV 常带 UTF-8 BOM(\uFEFF),首行可能是 # 导出时间:2024-05-01,或纯空行。这些不报错但会干扰字段对齐。

镝数图表
镝数图表

简单好用的数据可视化工具

下载

实操建议在读取每行后立刻清洗:

  • line.TrimStart('\uFEFF', '\ufeff') 去掉 BOM(大小写都得覆盖)
  • string.IsNullOrWhiteSpace(line) 过滤空行
  • line.TrimStart().StartsWith("#") 跳过注释行(注意前导空格)
  • 别依赖 File.ReadAllLines() 后统一处理——内存压力大,且无法在读到坏行时及时中断

BOM 不是字符编码问题,是字节序标记;不清理就可能导致第一列字段名开头多出不可见字符,后续所有 .Equals("ID") 都失败。

用自定义规则类组织校验逻辑

硬编码 if/else 校验很快会失控,比如“手机号必须 11 位数字”“邮箱需匹配正则”“日期格式为 yyyy-MM-dd”。把规则散落在循环里,改一个就得翻三处。

实操建议定义一个轻量规则类:

public class FieldRule
{
    public string ColumnName { get; set; }
    public Func<string, bool> Validator { get; set; }
    public string ErrorMessage { get; set; }
}

然后按列注册:

  • new FieldRule { ColumnName = "Phone", Validator = s => s.Length == 11 && long.TryParse(s, out _), ErrorMessage = "手机号必须为11位数字" }
  • 校验时遍历规则列表,!rule.Validator(value) 就记录错误,不 throw
  • 规则可从 JSON 配置加载,避免每次改代码

关键点:规则函数必须是纯函数(无副作用),否则并发读文件时容易出竞态;也不要让规则里去查数据库——校验阶段只做本地判断。

真正难的不是写单条规则,是设计好字段名到规则的映射方式,以及当某行触发多个规则失败时,如何合并错误信息又不淹没关键线索。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

452

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

546

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

328

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

81

2025.09.10

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

910

2023.08.02

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

252

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

988

2024.03.01

if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

839

2023.08.22

Swift iOS架构设计与MVVM模式实战
Swift iOS架构设计与MVVM模式实战

本专题聚焦 Swift 在 iOS 应用架构设计中的实践,系统讲解 MVVM 模式的核心思想、数据绑定机制、模块拆分策略以及组件化开发方法。内容涵盖网络层封装、状态管理、依赖注入与性能优化技巧。通过完整项目案例,帮助开发者构建结构清晰、可维护性强的 iOS 应用架构体系。

3

2026.03.03

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 10.6万人学习

C 教程
C 教程

共75课时 | 5.1万人学习

C++教程
C++教程

共115课时 | 20.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号