解决 Hibernate 6 大量数据查询性能瓶颈：深入解析与优化方案

花韻仙語

发布时间：2025-11-14 19:23:02

878人浏览过

来源于php中文网

原创

解决 Hibernate 6 大量数据查询性能瓶颈：深入解析与优化方案

hibernate 6 升级后，在处理大量数据查询时可能出现显著的性能下降，尤其体现在 `listresultsconsumer.withduplicationcheck()` 方法上。本文将深入分析这一问题，并提供两种有效的优化策略：利用 `getresultstream()` 进行流式处理，或通过选择元组来规避重复检查，从而显著提升查询效率。

在将应用程序从 Hibernate 5 升级到 Hibernate 6 后，开发者可能会遇到查询性能急剧下降的问题，尤其是在处理返回大量记录的 SELECT 操作时。这种性能退化可能导致查询耗时增加十倍甚至更多，严重影响用户体验和系统效率。通过性能分析，发现主要瓶颈集中在 Hibernate 6 内部的 org.hibernate.sql.results.spi.ListResultsConsumer.withDuplicationCheck() 方法，这表明 Hibernate 在结果集后处理阶段引入了额外的开销，尤其是在进行重复性检查时。

为了具体说明这一问题，考虑一个简单的场景：一个应用向内存数据库中持久化 500,000 个 MyEntity 实例，然后尝试查询并获取所有这些实例。

以下是用于演示的 Java 代码示例：

package com.me;

import java.text.MessageFormat;
import java.time.Duration;
import java.time.Instant;
import java.util.Properties;
import java.util.stream.IntStream;

import org.h2.Driver;
import org.hibernate.Session;
import org.hibernate.cfg.Configuration;
import org.hibernate.tool.schema.Action;

public class MyApplication {
    public static void main(final String[] args) {
        Instant start = Instant.now();

        final Properties jpaProperties = new Properties();
        jpaProperties.put("hibernate.connection.url", "jdbc:h2:mem:");
        jpaProperties.put("jakarta.persistence.jdbc.driver", Driver.class.getName());
        jpaProperties.put("jakarta.persistence.schema-generation.database.action", Action.CREATE);

        try (Session session = new Configuration().addAnnotatedClass(MyEntity.class).addProperties(jpaProperties)
                .buildSessionFactory().openSession()) {
            session.beginTransaction();
            IntStream.range(0, 500000).mapToObj(i -> new MyEntity()).forEach(session::persist);
            session.getTransaction().commit(); // 确保数据已提交
            printTiming(start, "Setup / Publish");

            start = Instant.now();
            session.createQuery("FROM MyEntity", MyEntity.class).getResultList();
            printTiming(start, "Get");
        }
    }

    private static void printTiming(final Instant startTime, final String label) {
        System.out.println(MessageFormat.format("{0} took {1}", label, Duration.between(startTime, Instant.now())));
    }
}

MyEntity.java：

package com.me;

import jakarta.persistence.Entity;
import jakarta.persistence.GeneratedValue;
import jakarta.persistence.GenerationType;
import jakarta.persistence.Id;

@Entity
public class MyEntity {
    @Id
    @GeneratedValue(strategy = GenerationType.AUTO)
    protected Long id;
}

pom.xml 配置（示例中展示了 Hibernate 6 的依赖）：

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <groupId>com.me</groupId>
    <modelVersion>4.0.0</modelVersion>
    <artifactId>hibernate-test</artifactId>
    <version>0.0.1-SNAPSHOT</version>
    <dependencies>
        <dependency>
            <groupId>com.h2database</groupId>
            <artifactId>h2</artifactId>
            <version>2.1.214</version>
        </dependency>
        <dependency>
            <groupId>jakarta.xml.bind</groupId>
            <artifactId>jakarta.xml.bind-api</artifactId>
            <version>3.0.1</version>
        </dependency>
        <dependency>
            <groupId>org.hibernate.orm</groupId>
            <artifactId>hibernate-core</artifactId>
            <version>6.1.5.Final</version>
        </dependency>
        <!-- 如需与 Hibernate 5 对比，可切换以下依赖 -->
        <!--<dependency>
            <groupId>org.hibernate</groupId>
            <artifactId>hibernate-core-jakarta</artifactId>
            <version>5.6.14.Final</version>
        </dependency>-->
    </dependencies>
</project>

性能对比：

ImgGood

免费在线AI照片编辑器

下载

在上述示例中，分别使用 Hibernate 5.6.14.Final 和 Hibernate 6.1.5.Final 运行，性能对比如下：

Hibernate 6.1.5.Final:

Setup / Publish took PT2.6288547S
Get took PT35.0881315S

Hibernate 5.6.14.Final:
```
Setup / Publish took PT3.486003S
Get took PT2.3955987S
```
从结果可以看出，Hibernate 6 在查询阶段（"Get"）的耗时显著增加，从约 2.4 秒飙升至 35 秒，性能下降超过 10 倍。这验证了 ListResultsConsumer.withDuplicationCheck() 导致的性能瓶颈。

优化策略

针对 Hibernate 6 中 ListResultsConsumer.withDuplicationCheck() 引入的性能瓶颈，目前存在两种有效的规避和优化策略。这些策略旨在减少或绕过 Hibernate 在处理结果集时的额外开销。

1. 使用流式查询 getResultStream()

当查询返回大量实体时，getResultList() 会尝试将所有结果一次性加载到内存中，并可能在此过程中执行重复性检查。相比之下，getResultStream() 方法返回一个 Stream 对象，允许以流式方式处理结果，按需加载，从而避免了将所有数据一次性加载到内存并进行批量后处理的开销。这对于大数据集尤其有效，因为它

Apache POI 填充 Word 文档表单域（.docx）的完整实践指南

Java 中的原子性操作不保证可见性：volatile 的不可替代性

Java 文件读取中正确过滤注释行与空行的实践指南

如何在 Java 中递归获取对象的所有子节点（包括子孙节点）

Java 文件读取中跳过注释、空行与节标题的正确实现方法

数码产品性能查询

该软件包括了市面上所有手机CPU，手机跑分情况，电脑CPU，电脑产品信息等等，方便需要大家查阅数码产品最新情况，了解产品特性，能够进行对比选择最具性价比的商品。

下载

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

1135

2023.10.12