0

0

C# SearchValues文件搜索 C#如何用.NET 8新特性高效在文件中查找多个字符串

畫卷琴夢

畫卷琴夢

发布时间:2026-02-20 08:58:03

|

443人浏览过

|

来源于php中文网

原创

searchvalues.create 比 contains 更快,因其将多个关键词预处理为位图或哈希索引,单次扫描即可定位所有匹配项,避免重复遍历;适用于日志解析、配置提取等多关键词场景。

c# searchvalues文件搜索 c#如何用.net 8新特性高效在文件中查找多个字符串

SearchValues.Create 为什么比 Contains 更快

因为 SearchValues<char></char> 把多个待查字符串预处理成位图或哈希索引,避免每次扫描都重复遍历所有目标词。普通 ContainsIndexOfAny 在查 5 个关键词时,每行要调 5 次;而 SearchValues 一次扫描就能标记出所有匹配位置。

适用场景:日志解析、配置文件关键词提取、CSV/TSV 行内多字段定位。

  • 只支持 charstring 两种泛型参数,查子串必须用 SearchValues<string></string>,不能混用
  • SearchValues.Create(new[] { "ERROR", "WARN", "INFO" }) 会自动去重并优化内部结构,但传入 null 或空字符串会抛 ArgumentException
  • 在 .NET 8 中,SearchValues<string></string> 对短字符串(≤ 16 字节)启用 SIMD 加速,长字符串回退到高效哈希匹配

File.ReadLines + SearchValues.FindFirstCharacterOrValue 怎么配合用

直接对大文件逐行读取 + 检查首字符或关键词存在性,是内存友好且能 early-exit 的组合。别用 File.ReadAllLines 加载全量再查 —— 即使文件只有 100MB,也可能触发 GC 压力。

常见错误:把 FindFirstCharacterOrValue 当成“找完整子串”,其实它只返回第一个匹配的起始索引(或 -1),不区分是单字符还是整个字符串命中。

  • 先用 SearchValues<string>.Create(new[] { "StatusCode:", "UserAgent:", "X-Request-ID:" })</string>
  • 对每行调 values.FindFirstCharacterOrValue(line),返回 ≥ 0 表示该行含任一关键词
  • 若需定位具体是哪个词,再用 line.AsSpan().IndexOfAnyValues(values) 获取详细偏移和匹配值
  • 注意:如果某行含 "Status" 和 "StatusCode:",FindFirstCharacterOrValue 只返回第一个匹配位置,不会告诉你匹配的是哪个

IndexOfAnyValues 返回值怎么解读才不踩坑

IndexOfAnyValues 返回的是 Range 类型(.NET 8 新增),不是整数索引。直接打印或比较会得到类似 [12..19] 的结果,不是你想要的起始位置。

NexChatGPT
NexChatGPT

火爆全网的IDEA插件,支持IDEA全家桶

下载

使用场景:需要精确提取匹配关键词前后上下文,比如截取 HTTP header 值、提取 JSON key 对应的 value 片段。

  • 正确解包方式:var range = line.AsSpan().IndexOfAnyValues(values); int start = range.Start;
  • 如果没匹配,rangeRange.Empty,此时 range.Start == 0range.Length == 0,不能只判 start == 0
  • 搭配 line.AsSpan()[range] 可直接拿到匹配到的原始字符串(如 "UserAgent:"),无需额外 Substring
  • 性能提示:反复调用 IndexOfAnyValues 时,确保 values 是复用对象,不要每行都 Create 新实例

跨平台文件路径和编码问题怎么绕开

SearchValues 本身不处理编码,它只操作 ReadOnlySpan<char></char>。所以真正出错的地方往往在读文件这一步 —— 比如用默认编码读 UTF-8 BOM 文件,导致第一行乱码,关键词永远匹配不上。

Windows 上常见现象:File.ReadLines("log.txt") 返回的行开头多出 \uFEFF,让 "ERROR" 查不到。

  • 统一用 File.ReadLines(path, Encoding.UTF8),显式指定编码,尤其处理日志、配置等文本文件
  • 路径分隔符不用自己替换,Path.JoinPath.DirectorySeparatorChar 在 .NET 8 已足够健壮
  • 如果文件可能含 BOM,用 StreamReader 构造时传 detectEncodingFromByteOrderMarks: true 更稳妥
  • 别依赖 File.Exists 做前置判断 —— 它在某些容器环境或网络路径下可能不准,直接 try/catch FileNotFoundException 更实际

最麻烦的其实是混合编码日志:一部分是 GBK,一部分是 UTF-8。这时候 SearchValues 再快也没用,得先做编码探测。那已经不是查找问题,而是输入清洗问题了。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
json数据格式
json数据格式

JSON是一种轻量级的数据交换格式。本专题为大家带来json数据格式相关文章,帮助大家解决问题。

442

2023.08.07

json是什么
json是什么

JSON是一种轻量级的数据交换格式,具有简洁、易读、跨平台和语言的特点,JSON数据是通过键值对的方式进行组织,其中键是字符串,值可以是字符串、数值、布尔值、数组、对象或者null,在Web开发、数据交换和配置文件等方面得到广泛应用。本专题为大家提供json相关的文章、下载、课程内容,供大家免费下载体验。

544

2023.08.23

jquery怎么操作json
jquery怎么操作json

操作的方法有:1、“$.parseJSON(jsonString)”2、“$.getJSON(url, data, success)”;3、“$.each(obj, callback)”;4、“$.ajax()”。更多jquery怎么操作json的详细内容,可以访问本专题下面的文章。

322

2023.10.13

go语言处理json数据方法
go语言处理json数据方法

本专题整合了go语言中处理json数据方法,阅读专题下面的文章了解更多详细内容。

81

2025.09.10

string转int
string转int

在编程中,我们经常会遇到需要将字符串(str)转换为整数(int)的情况。这可能是因为我们需要对字符串进行数值计算,或者需要将用户输入的字符串转换为整数进行处理。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

790

2023.08.02

c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

246

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

806

2024.03.01

scripterror怎么解决
scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

371

2023.10.18

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

660

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 9.8万人学习

C 教程
C 教程

共75课时 | 4.8万人学习

C++教程
C++教程

共115课时 | 18.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号