0

0

初级实战:如何用Java写一个简单的控制台博客搜索器_字符串匹配

P粉602998670

P粉602998670

发布时间:2026-03-03 09:26:46

|

799人浏览过

|

来源于php中文网

原创

string.contains() 不适合博客搜索,因其仅支持严格子串匹配,无法处理大小写、空格、标点、拼写错误、同义词及模糊查询;预处理+tolowercase()+indexof() 或转义通配正则匹配(如 .*java.*config.*)是更实用的轻量替代方案。

初级实战:如何用java写一个简单的控制台博客搜索器_字符串匹配

为什么 String.contains() 不适合做博客搜索器

它只能判断子串存在,没法处理大小写、空格差异、标点干扰,更别说模糊匹配了。比如用户搜 "java setup",但文章里写的是 "Java Setup Guide""java-setup"contains() 直接返回 false

真实博客内容杂:有中英文混排、多余空格、HTML 实体残留(如  ),甚至用户输错一个字母就搜不到——这不是功能缺陷,是设计起点错了。

  • toLowerCase().contains() 是最常见补救,但治标不治本:无法解决拼写错误、同义词、缩写(如 "jdk" vs "Java Development Kit"
  • 如果博客数据量超过几百条,每次遍历全文调用 contains() 会明显卡顿,尤其在老旧笔记本或 CI 环境里
  • 别提前用正则——Pattern.compile() 每次新建开销大,且用户输入含 . * ? 时会意外触发异常

String.indexOf() + 预处理能撑多久

contains() 多一点控制权:可以跳过前导空格、统一空白符、忽略常见标点。但它仍是精确匹配,只是“更干净的精确”。适合单机小项目、原型验证、或你明确知道用户只会输完整关键词。

关键在预处理逻辑,不是函数本身:

立即学习Java免费学习笔记(深入)”;

DALL·E 2
DALL·E 2

OpenAI基于GPT-3模型开发的AI绘图生成工具,可以根据自然语言的描述创建逼真的图像和艺术。

下载
  • 对每篇博客正文,先执行 text.replaceAll("[\p{Punct}\s]+", " ").trim(),把所有标点和连续空白换成单个空格
  • 用户输入也走同样清洗,再转小写,再用 indexOf() 查找
  • 避免用 split(" ") 后逐词比对——中文没空格分词,"Java教程" 会被切碎,搜 "教程" 就失效
  • 注意 indexOf() 返回 -1 表示未找到,别直接拿这个值当布尔用,容易漏判

简单又不太丢体验的折中方案:String.matches() 加基础通配

不用引入 Lucene 或 SQLite 全文索引,也能让搜索像那么回事。核心是把用户输入转成宽松正则,只支持 * 通配(表示任意字符序列),其余字符原样转义。

示例:用户输 "java * config" → 转成正则 java.*config,再用 text.toLowerCase().matches(pattern) 判断。

  • 必须对用户输入做 Pattern.quote() 处理非 * 部分,否则 "j.d" 会被当成 j.任意字符d
  • matches() 默认全字符串匹配,所以要把 * 替换为 .*,并在首尾加 .*,即 .*java.*config.*
  • 性能上比 contains() 略差,但用户无感;别用 find(),那需要额外编译 Pattern 对象,重复创建很伤
  • 别支持 ? 或正则元字符——用户不是开发者,输错一个 [ 就崩,日志里全是 PatternSyntaxException

控制台输出结果时最容易被忽略的细节

搜索出 5 篇匹配文章,但用户扫一眼根本分不清哪篇更相关。光打印标题和前 50 字不够,尤其当多篇文章标题雷同(比如都叫 "Spring Boot 入门")。

  • 给每条结果加行号,用 System.out.printf("%2d. %s%n", index, title),避免手算对齐错位
  • 高亮匹配关键词:把原文中首次命中部分用 [关键词] 包裹,而不是全篇替换——否则中文里“配置”和“配置项”会互相污染
  • 如果博客数据来自文件,记得检查编码:Files.readAllLines(path, StandardCharsets.UTF_8),Windows 上默认 GBK 读出来全是乱码,错误信息是 MalformedInputException
  • 别在循环里反复调用 System.out.println() 输出长文本,合起来用一次 printf 或构建 StringBuilder,否则控制台滚动卡顿明显

真正难的不是匹配算法,是让用户在没 GUI 的情况下,三秒内确认“这正是我要找的”。匹配准不准,一半看逻辑,一半看输出是不是把关键信息推到了他眼睛底下。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
spring框架介绍
spring框架介绍

本专题整合了spring框架相关内容,想了解更多详细内容,请阅读专题下面的文章。

149

2025.08.06

Java Spring Security 与认证授权
Java Spring Security 与认证授权

本专题系统讲解 Java Spring Security 框架在认证与授权中的应用,涵盖用户身份验证、权限控制、JWT与OAuth2实现、跨站请求伪造(CSRF)防护、会话管理与安全漏洞防范。通过实际项目案例,帮助学习者掌握如何 使用 Spring Security 实现高安全性认证与授权机制,提升 Web 应用的安全性与用户数据保护。

87

2026.01.26

spring boot框架优点
spring boot框架优点

spring boot框架的优点有简化配置、快速开发、内嵌服务器、微服务支持、自动化测试和生态系统支持。本专题为大家提供spring boot相关的文章、下载、课程内容,供大家免费下载体验。

138

2023.09.05

spring框架有哪些
spring框架有哪些

spring框架有Spring Core、Spring MVC、Spring Data、Spring Security、Spring AOP和Spring Boot。详细介绍:1、Spring Core,通过将对象的创建和依赖关系的管理交给容器来实现,从而降低了组件之间的耦合度;2、Spring MVC,提供基于模型-视图-控制器的架构,用于开发灵活和可扩展的Web应用程序等。

407

2023.10.12

Java Spring Boot开发
Java Spring Boot开发

本专题围绕 Java 主流开发框架 Spring Boot 展开,系统讲解依赖注入、配置管理、数据访问、RESTful API、微服务架构与安全认证等核心知识,并通过电商平台、博客系统与企业管理系统等项目实战,帮助学员掌握使用 Spring Boot 快速开发高效、稳定的企业级应用。

73

2025.08.19

Java Spring Boot 4更新教程_Java Spring Boot 4有哪些新特性
Java Spring Boot 4更新教程_Java Spring Boot 4有哪些新特性

Spring Boot 是一个基于 Spring 框架的 Java 开发框架,它通过 约定优于配置的原则,大幅简化了 Spring 应用的初始搭建、配置和开发过程,让开发者可以快速构建独立的、生产级别的 Spring 应用,无需繁琐的样板配置,通常集成嵌入式服务器(如 Tomcat),提供“开箱即用”的体验,是构建微服务和 Web 应用的流行工具。

137

2025.12.22

Java Spring Boot 微服务实战
Java Spring Boot 微服务实战

本专题深入讲解 Java Spring Boot 在微服务架构中的应用,内容涵盖服务注册与发现、REST API开发、配置中心、负载均衡、熔断与限流、日志与监控。通过实际项目案例(如电商订单系统),帮助开发者掌握 从单体应用迁移到高可用微服务系统的完整流程与实战能力。

268

2025.12.24

Spring Boot企业级开发与MyBatis Plus实战
Spring Boot企业级开发与MyBatis Plus实战

本专题面向 Java 后端开发者,系统讲解如何基于 Spring Boot 与 MyBatis Plus 构建高效、规范的企业级应用。内容涵盖项目架构设计、数据访问层封装、通用 CRUD 实现、分页与条件查询、代码生成器以及常见性能优化方案。通过完整实战案例,帮助开发者提升后端开发效率,减少重复代码,快速交付稳定可维护的业务系统。

31

2026.02.11

Golang 测试体系与代码质量保障:工程级可靠性建设
Golang 测试体系与代码质量保障:工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链(如go test)、单元测试、集成测试及端到端测试实践,结合代码覆盖率分析、静态代码扫描(如go vet)和动态分析工具,建立全链路质量监控机制。通过自动化测试框架、持续集成(CI)流水线配置及代码审查规范,实现测试用例管理、缺陷追踪与质量门禁控制,确保代码健壮性与可维护性,为高可靠性工程系统提供质量保障。

48

2026.02.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4万人学习

C# 教程
C# 教程

共94课时 | 10.5万人学习

Java 教程
Java 教程

共578课时 | 75.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号