SQL 全文搜索的 tsvector / tsquery vs LIKE ‘%xx%’ vs trigram 索引性能对比

舞夢輝影

发布时间：2026-02-11 21:16:03

550人浏览过

来源于php中文网

原创

tsvector+GIN是语义搜索唯一合理选择，支持词干提取、停用词过滤和语言学处理；pg_trgm+GIN/GiST适用于错别字和模糊匹配；LIKE '%xx%'仅限调试或补救，性能差且索引失效。

$sql 全文搜索的 tsvector / tsquery vs like \'%xx%\' vs trigram 索引性能对比$

tsvector + GIN 索引：真正为语义搜索设计的方案

当你要查“数据库性能优化”，而用户输入的是 performance & database，tsvector 能自动忽略停用词、统一大小写、还原词干（如 optimizing → optimize），再通过 GIN 索引在倒排表里快速定位——这才是语义级匹配。

它不是字符串匹配，是语言学处理后的检索。所以如果你的场景涉及自然语言输入（比如后台内容管理系统的搜索框、文档库关键词查找），tsvector 是唯一合理选择。

必须配合 to_tsvector('english', column) 显式指定配置，否则默认 simple 不做词干提取和停用词过滤
content_vector TSVECTOR GENERATED ALWAYS AS (...) STORED 是最稳写法，避免触发器漏更新或函数重复计算
中文必须额外装插件（如 zhparser），原生不支持分词；别指望 to_tsvector('chinese', ...) 能跑起来
索引体积约是原文本的 30–40%，但查询耗时从 1200ms 降到 10–15ms（100 万行实测）

LIKE '%xx%'：只适合极轻量、低频、开发调试用

它不做任何预处理，就是逐字节扫字符串。哪怕字段上有 B-tree 索引，只要开头带 %（如 '%error%'），索引就完全失效——这是硬性限制，不是优化能绕开的。

它的存在意义，仅限于临时查日志字段、补救没建全文索引的老表、或者验证数据是否存在某段固定文本。

'error%' 可走 B-tree 索引，但 '%error' 和 '%error%' 都不行
字段长度越长、行数越多，性能断崖式下跌；10 万行以上基本不可用于线上查询
无法表达“包含 A 且不含 B”“A 和 B 相距不超过 5 个词”这类逻辑

pg_trgm + GIN/GiST：模糊拼写/错别字/中英文混输的折中解

当你需要查 'postgessql'（少了个 r）也能命中 PostgreSQL，或者用户搜 '微信支付' 但数据库存的是 '微信支付'（中间有空格），pg_trgm 就派上用场了。它把字符串切成三元组（trigram），靠相似度打分匹配。

Colourlab.ai

好莱坞内容创作者依赖的AI色彩分级软件

下载

但它不是语义搜索：不会理解“run”和“running”是一回事，也不懂“database”和“DB”是否等价。

启用前必须 CREATE EXTENSION pg_trgm，否则 GIN 索引会报错“operator does not exist”
USING gin(column gin_trgm_ops) 和 USING gist(column gist_trgm_ops) 效果不同：GIN 更快但写入略重；GiST 支持 % 查询外的相似度排序
SELECT * FROM t WHERE col % 'postgessql' 这种写法依赖 pg_trgm 的相似度阈值（默认 0.3），太低易误召，太高漏结果
对纯英文短词（如 'api'）效果差：三元组太少，区分度低

选哪个？看你的 query pattern 和数据特征

没有银弹。如果用户搜的是完整单词、带逻辑关系（“Java 并发”但不要 “Spring”）、且你能控制分词语言，tsvector 是首选。如果用户常打错、粘连、缺字，或者字段里塞了大量非结构化短文本（如标签、用户名、商品标题），pg_trgm 更实在。而 LIKE '%...%' 应该被当成最后手段，上线前务必 grep 掉。

最容易被忽略的一点：三者不能混用索引。你建了 GIN on tsvector，再对同一列加 pg_trgm 索引，不仅空间翻倍，查询计划还可能选错索引——PostgreSQL 不会自动判断“这次该用语义还是三元组”。得靠 SET enable_seqscan = off 测试，或用 EXPLAIN (ANALYZE, BUFFERS) 看实际走哪条路。

数码产品性能查询

该软件包括了市面上所有手机CPU，手机跑分情况，电脑CPU，电脑产品信息等等，方便需要大家查阅数码产品最新情况，了解产品特性，能够进行对比选择最具性价比的商品。

下载

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL PostgreSQL 的 GIN / GiST / SP-GiST / BRIN / Bloom 索引类型决策树下一篇：SQL 慢查询日志的开启阈值与 long_query_time / log_queries_not_using_indexes 设置

作者最新文章

oppo国行官网入口地址_OPPO中国官网国行手机首页入口

2026-02-09 10:41

GitHub 仓库怎么搭建？从零创建仓库详细教程

2026-02-09 13:14

劳动仲裁需要多长时间详解_劳动仲裁从受理起45日内结束复杂延15日

2026-02-10 00:17

苹果手机参数对比表型号大全_苹果手机型号参数对比大全表

2026-02-10 00:27

苹果手机闹钟为什么不响修复_苹果手机闹钟不响勿扰模式检查

2026-02-10 02:15

苹果黑屏按哪三个键恢复？iPhone 组合键恢复说明

2026-02-10 09:09

小米红米手机怎么样质量_小米红米手机质量口碑对比详解

2026-02-10 09:20

全球半导体年销售额上看1兆美元 AI资料中心投资成最大推力

2026-02-10 09:48

华硕电脑查看配置方法

2026-02-10 09:58

中文简繁体转换功能在哪里_中文简繁体转换工具教程

2026-02-10 10:16

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

900

2023.10.12