0

0

调整 Elasticsearch 查询结果数量限制:最佳实践与替代方案

聖光之護

聖光之護

发布时间:2025-10-17 10:39:19

|

733人浏览过

|

来源于php中文网

原创

调整 elasticsearch 查询结果数量限制:最佳实践与替代方案

本文旨在探讨在 Java Spring Boot 应用中调整 Elasticsearch 查询结果数量限制的最佳实践。直接修改 `index.max_result_window` 可能会影响性能,因此,本文将重点介绍使用 `Search After` 进行分页查询,以及启用 `track_total_hits` 来获取准确的总命中数,从而避免潜在的性能问题,并提供代码示例和注意事项。

在 Elasticsearch 中,默认情况下,单个查询返回的结果数量限制为 10000。虽然可以通过修改 index.max_result_window 参数来提高这个限制,但这可能会对性能产生负面影响,尤其是在处理大型索引时。本文将介绍更安全、更高效的方法来处理需要返回大量结果的场景。

避免直接修改 index.max_result_window

Elasticsearch 官方文档强烈建议不要随意增加 index.max_result_window 的值。 增加此值会增加 Elasticsearch 需要维护的内存资源,可能导致性能下降甚至集群不稳定。

使用 Search After 进行分页

Search After 是一种高效的分页方式,它避免了使用 from 和 size 进行深度分页时可能遇到的性能问题。 Search After 基于前一页的结果进行排序,并使用排序值作为下一页查询的起始点。

以下是一个使用 Java High Level REST Client 实现 Search After 的示例:

import org.elasticsearch.action.search.SearchRequest;
import org.elasticsearch.action.search.SearchResponse;
import org.elasticsearch.client.RequestOptions;
import org.elasticsearch.client.RestHighLevelClient;
import org.elasticsearch.index.query.QueryBuilders;
import org.elasticsearch.search.SearchHit;
import org.elasticsearch.search.sort.FieldSortBuilder;
import org.elasticsearch.search.sort.SortOrder;
import org.elasticsearch.search.builder.SearchSourceBuilder;

import java.io.IOException;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;

public class SearchAfterExample {

    public static void main(String[] args) throws IOException {
        // 假设已经初始化了 RestHighLevelClient elsRestClient
        RestHighLevelClient elsRestClient = new RestHighLevelClient(
                // Replace with your Elasticsearch client configuration
        );

        String indexName = "your_index_name";
        int pageSize = 100; // 每页返回的结果数量
        Object[] searchAfter = null; // 第一次查询时为 null

        List<SearchHit> allHits = new ArrayList<>();

        while (true) {
            SearchRequest searchRequest = new SearchRequest(indexName);
            SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
            searchSourceBuilder.query(QueryBuilders.matchAllQuery()); // 替换为你的查询条件
            searchSourceBuilder.size(pageSize);
            searchSourceBuilder.sort(new FieldSortBuilder("_id").order(SortOrder.ASC)); // 使用 _id 进行排序,确保结果的唯一性

            if (searchAfter != null) {
                searchSourceBuilder.searchAfter(searchAfter);
            }

            searchRequest.source(searchSourceBuilder);

            SearchResponse searchResponse = elsRestClient.search(searchRequest, RequestOptions.DEFAULT);

            SearchHit[] hits = searchResponse.getHits().getHits();
            if (hits.length == 0) {
                break; // 没有更多结果
            }

            allHits.addAll(Arrays.asList(hits));

            // 获取最后一个结果的排序值,作为下一次查询的 search_after
            searchAfter = hits[hits.length - 1].getSortValues();
        }

        System.out.println("Total hits: " + allHits.size());
        // 处理 allHits 中的结果
        elsRestClient.close();
    }
}

代码解释:

  1. 初始化客户端: RestHighLevelClient 用于与 Elasticsearch 集群进行通信。
  2. 构建 SearchRequest: 指定要查询的索引名称,并使用 SearchSourceBuilder 构建查询条件。
  3. 设置排序: 使用 _id 字段进行排序,确保结果的唯一性和一致性。 也可以使用其他合适的字段进行排序。
  4. 设置 search_after: 在后续查询中,将前一页最后一个结果的排序值设置为 search_after,从而实现分页。
  5. 循环查询: 循环执行查询,直到没有更多结果为止。
  6. 收集结果: 将每次查询的结果添加到 allHits 列表中。

注意事项:

OmniAudio
OmniAudio

OmniAudio 是一款通过 AI 支持将网页、Word 文档、Gmail 内容、文本片段、视频音频文件都转换为音频播客,并生成可在常见 Podcast ap

下载
  • 必须选择一个具有唯一值的字段进行排序,例如 _id 或其他具有唯一约束的字段。
  • 第一次查询时,searchAfter 必须为 null。
  • Search After 不适用于实时性要求高的场景,因为它不能反映数据变化。

启用 track_total_hits

默认情况下,Elasticsearch 返回的总命中数可能是不准确的,尤其是在命中数超过 10000 时。 为了获取准确的总命中数,可以启用 track_total_hits 参数。

以下是一个启用 track_total_hits 的示例:

import org.elasticsearch.action.search.SearchRequest;
import org.elasticsearch.action.search.SearchResponse;
import org.elasticsearch.client.RequestOptions;
import org.elasticsearch.client.RestHighLevelClient;
import org.elasticsearch.index.query.QueryBuilders;
import org.elasticsearch.search.builder.SearchSourceBuilder;
import org.elasticsearch.search.SearchHits;

import java.io.IOException;

public class TrackTotalHitsExample {

    public static void main(String[] args) throws IOException {
        // 假设已经初始化了 RestHighLevelClient elsRestClient
        RestHighLevelClient elsRestClient = new RestHighLevelClient(
                // Replace with your Elasticsearch client configuration
        );

        String indexName = "your_index_name";

        SearchRequest searchRequest = new SearchRequest(indexName);
        SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder();
        searchSourceBuilder.query(QueryBuilders.matchAllQuery()); // 替换为你的查询条件
        searchSourceBuilder.trackTotalHits(true); // 启用 track_total_hits
        searchRequest.source(searchSourceBuilder);

        SearchResponse searchResponse = elsRestClient.search(searchRequest, RequestOptions.DEFAULT);

        SearchHits hits = searchResponse.getHits();
        long totalHits = hits.getTotalHits().value;

        System.out.println("Total hits: " + totalHits);

        elsRestClient.close();
    }
}

代码解释:

  1. 启用 trackTotalHits: 通过 searchSourceBuilder.trackTotalHits(true) 启用 track_total_hits 参数。
  2. 获取总命中数: 从 SearchHits 对象中获取准确的总命中数。

注意事项:

  • 启用 track_total_hits 可能会增加查询的开销,尤其是在处理大型索引时。 可以根据实际情况选择是否启用。
  • Elasticsearch 7.0 及更高版本支持更精确的总命中数跟踪。

总结

在 Java Spring Boot 应用中调整 Elasticsearch 查询结果数量限制时,应优先考虑使用 Search After 进行分页,并根据需要启用 track_total_hits。 避免直接修改 index.max_result_window,以防止潜在的性能问题。 通过合理使用这些技术,可以有效地处理需要返回大量结果的场景,并确保 Elasticsearch 集群的稳定性和性能。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
spring框架介绍
spring框架介绍

本专题整合了spring框架相关内容,想了解更多详细内容,请阅读专题下面的文章。

161

2025.08.06

Java Spring Security 与认证授权
Java Spring Security 与认证授权

本专题系统讲解 Java Spring Security 框架在认证与授权中的应用,涵盖用户身份验证、权限控制、JWT与OAuth2实现、跨站请求伪造(CSRF)防护、会话管理与安全漏洞防范。通过实际项目案例,帮助学习者掌握如何 使用 Spring Security 实现高安全性认证与授权机制,提升 Web 应用的安全性与用户数据保护。

89

2026.01.26

spring boot框架优点
spring boot框架优点

spring boot框架的优点有简化配置、快速开发、内嵌服务器、微服务支持、自动化测试和生态系统支持。本专题为大家提供spring boot相关的文章、下载、课程内容,供大家免费下载体验。

139

2023.09.05

spring框架有哪些
spring框架有哪些

spring框架有Spring Core、Spring MVC、Spring Data、Spring Security、Spring AOP和Spring Boot。详细介绍:1、Spring Core,通过将对象的创建和依赖关系的管理交给容器来实现,从而降低了组件之间的耦合度;2、Spring MVC,提供基于模型-视图-控制器的架构,用于开发灵活和可扩展的Web应用程序等。

410

2023.10.12

Java Spring Boot开发
Java Spring Boot开发

本专题围绕 Java 主流开发框架 Spring Boot 展开,系统讲解依赖注入、配置管理、数据访问、RESTful API、微服务架构与安全认证等核心知识,并通过电商平台、博客系统与企业管理系统等项目实战,帮助学员掌握使用 Spring Boot 快速开发高效、稳定的企业级应用。

73

2025.08.19

Java Spring Boot 4更新教程_Java Spring Boot 4有哪些新特性
Java Spring Boot 4更新教程_Java Spring Boot 4有哪些新特性

Spring Boot 是一个基于 Spring 框架的 Java 开发框架,它通过 约定优于配置的原则,大幅简化了 Spring 应用的初始搭建、配置和开发过程,让开发者可以快速构建独立的、生产级别的 Spring 应用,无需繁琐的样板配置,通常集成嵌入式服务器(如 Tomcat),提供“开箱即用”的体验,是构建微服务和 Web 应用的流行工具。

152

2025.12.22

Java Spring Boot 微服务实战
Java Spring Boot 微服务实战

本专题深入讲解 Java Spring Boot 在微服务架构中的应用,内容涵盖服务注册与发现、REST API开发、配置中心、负载均衡、熔断与限流、日志与监控。通过实际项目案例(如电商订单系统),帮助开发者掌握 从单体应用迁移到高可用微服务系统的完整流程与实战能力。

271

2025.12.24

Spring Boot企业级开发与MyBatis Plus实战
Spring Boot企业级开发与MyBatis Plus实战

本专题面向 Java 后端开发者,系统讲解如何基于 Spring Boot 与 MyBatis Plus 构建高效、规范的企业级应用。内容涵盖项目架构设计、数据访问层封装、通用 CRUD 实现、分页与条件查询、代码生成器以及常见性能优化方案。通过完整实战案例,帮助开发者提升后端开发效率,减少重复代码,快速交付稳定可维护的业务系统。

34

2026.02.11

TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

49

2026.03.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 4.4万人学习

C# 教程
C# 教程

共94课时 | 11.3万人学习

Java 教程
Java 教程

共578课时 | 82.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号