
1. 理解需求与Prisma模型结构
在许多数据管理场景中,我们需要对关联数据进行分组聚合。例如,在一个包含“管理员(admins)”和“支付(payment)”的模型系统中,我们可能需要统计每位管理员的总支付金额,并同时在结果中包含管理员的姓名等基本信息。
以下是示例的Prisma模型定义:
model admins {
id Int @id @default(autoincrement())
name String
last_name String
phone String @unique
email String? @unique
nic String? @unique
image String?
payments payment[] // 管理员可以有多个支付记录
}
model payment {
id Int @id @default(autoincrement())
amount Int
description String?
date DateTime? @db.Date
admin_id Int // 外键,关联到admins表的id
admins admins @relation(fields: [admin_id], references: [id]) // 关联到admins模型
}我们的目标是获取每个管理员的总支付金额,并且在结果中包含该管理员的name和last_name字段。
2. Prisma groupBy 的基本使用与限制
Prisma提供了 groupBy 方法用于对数据进行分组聚合。例如,要获取每个管理员的总支付金额,可以这样查询:
const paymentTotals = await prisma.payment.groupBy({
by: ["admin_id"],
_sum: {
amount: true,
},
});
console.log(paymentTotals);执行上述查询,Prisma会返回一个数组,其中每个元素包含 admin_id 和该管理员对应的支付总额,例如:
[
{ _sum: { amount: 1650 }, admin_id: 1 },
{ _sum: { amount: 2000 }, admin_id: 2 }
]然而,groupBy 方法存在一个重要的限制:它不支持直接使用 include 或 select 来包含关联模型的字段。这意味着我们无法在一次 groupBy 查询中同时获取 admin 的 name 和 last_name。如果尝试这样做,Prisma会抛出错误。
我们期望的最终结果是每个聚合项都能包含管理员的姓名信息,例如:
[
{
_sum: { amount: 1650 },
admin_id: 1,
name: "admin-name",
last_name: "admin-last-name"
},
// ... 其他管理员
]3. 解决方案:分步查询与数据映射
鉴于 groupBy 的限制,最常见的解决方案是执行两次查询并进行数据映射。这种方法既高效又灵活,能够满足在聚合结果中扩展关联字段的需求。
3.1 步骤一:执行分组聚合查询
首先,我们像之前一样,使用 groupBy 查询获取每个 admin_id 对应的支付总额:
const paymentData = await prisma.payment.groupBy({
by: ["admin_id"],
_sum: {
amount: true,
},
});
// paymentData 示例:
// [
// { _sum: { amount: 1650 }, admin_id: 1 },
// { _sum: { amount: 2000 }, admin_id: 2 }
// ]3.2 步骤二:获取关联实体信息并合并
接下来,我们需要遍历 paymentData 数组。对于数组中的每一个 admin_id,我们执行一次 prisma.admins.findUnique 查询来获取对应的管理员信息(name 和 last_name),然后将这些信息合并到聚合结果中。
为了提高效率,特别是当 paymentData 数组较大时,我们应该使用 Promise.all 来并行执行所有 findUnique 查询,而不是串行执行,以避免潜在的性能瓶颈(N+1查询问题)。
const dataWithAdminInfo = await Promise.all(paymentData.map(async (item) => {
// 根据admin_id查询对应的管理员信息
const admin = await prisma.admins.findUnique({
where: { id: item.admin_id },
select: { // 仅选择需要的字段,减少数据传输
name: true,
last_name: true
}
});
// 将管理员信息合并到聚合结果中
return {
...item, // 包含 _sum 和 admin_id
name: admin?.name, // 使用可选链操作符以防admin为null
last_name: admin?.last_name
};
}));
console.log(dataWithAdminInfo);通过上述代码,dataWithAdminInfo 将包含我们期望的结构:
[
{
_sum: { amount: 1650 },
admin_id: 1,
name: "Admin Name 1",
last_name: "Admin Last Name 1"
},
{
_sum: { amount: 2000 },
admin_id: 2,
name: "Admin Name 2",
last_name: "Admin Last Name 2"
}
// ...
]4. 注意事项与性能考量
- N+1 查询问题缓解: 虽然这种方法本质上是“N+1”查询模式(一次 groupBy 查询,N次 findUnique 查询),但通过使用 Promise.all,我们将这N次查询并行化,大大减少了总的等待时间,使其在多数情况下都能接受。
- 字段选择: 在 findUnique 查询中,使用 select 语句只选择 name 和 last_name 字段。这有助于减少从数据库传输的数据量,优化性能。
- 索引: 确保 payment 表的 admin_id 字段和 admins 表的 id 字段上都有合适的索引。这将极大地提高 groupBy 和 findUnique 查询的性能。
-
大数据量处理: 对于拥有数百万甚至更多记录的超大型数据集,如果并行查询的开销仍然过高,可能需要考虑更高级的策略,例如:
- 在数据库层面创建视图(View)来预聚合数据。
- 使用原始 SQL 查询(prisma.$queryRaw)来执行复杂的联接和聚合操作。
- 在数据仓库或ETL流程中进行离线聚合。 但对于大多数常见的应用场景,上述的分步查询加 Promise.all 策略是完全足够且高效的。
5. 总结
尽管Prisma的 groupBy 方法在聚合时不支持直接 include 或 select 关联字段,但通过“分步查询与数据映射”的策略,我们可以优雅地解决这一问题。首先执行 groupBy 聚合,然后利用 Promise.all 并行查询关联数据并进行合并。这种方法兼顾了代码的清晰性、可维护性以及在多数情况下的良好性能,是处理此类需求时的推荐实践。










