
本文介绍如何在 Laravel ORM 中基于多个列的值来删除重复记录。通过使用 SQL 的窗口函数 `ROW_NUMBER()`,可以为具有相同 `username` 和 `discipline` 列值的记录分配一个序号,然后选择序号为 1 的记录,从而实现去重的目的。同时,本文还提供了 Laravel 中的具体实现代码,方便读者参考。
在处理需要记录历史版本的数据时,可能会出现基于某些字段的重复数据。例如,用户可以重复提交比赛结果,系统需要保存历史结果以供回溯,但同时需要保证在特定时间段内,基于某些关键字段的结果是唯一的。 Laravel 的 ORM 提供的 distinct() 方法在处理多列去重时可能无法满足需求。本文将介绍一种使用原生 SQL 查询配合窗口函数 ROW_NUMBER() 来实现多列去重的方案。
使用 SQL 窗口函数 ROW_NUMBER() 去重
核心思路是使用 ROW_NUMBER() 函数为每个分组(基于需要去重的列)内的记录分配一个序号,然后只选择序号为 1 的记录。 以下是一个 SQL 示例,用于从 results 表中删除基于 username 和 discipline_one 到 discipline_six 列的重复记录,并保留 id 值最大的记录:
WITH cte AS (
SELECT *, ROW_NUMBER() OVER
(PARTITION BY username, discipline_one, discipline_two, discipline_three,
discipline_four, discipline_five, discipline_six ORDER BY id DESC) rn
FROM results
)
SELECT id, username, discipline_one, discipline_two, discipline_three,
discipline_four, discipline_five, discipline_six, created_at, updated_at
FROM cte
WHERE rn = 1这段 SQL 代码的逻辑如下:
- CTE (Common Table Expression) cte: 定义一个名为 cte 的公共表表达式。
-
ROW_NUMBER() OVER (...): 这是窗口函数的核心。
- PARTITION BY username, discipline_one, ..., discipline_six: 指定分区规则。 ROW_NUMBER() 会为每个具有相同 username 和 discipline 列值的记录集合分配一个序号。
- ORDER BY id DESC: 指定排序规则。 在每个分区内,记录会按照 id 降序排列。 这意味着 id 最大的记录会被分配到序号 1。
- rn: 将 ROW_NUMBER() 函数的结果(即序号)赋值给名为 rn 的列。
- SELECT ... FROM cte WHERE rn = 1: 从 cte 中选择 rn 等于 1 的记录。 由于 rn 是按照 id 降序排列的,因此这会选择每个分组中 id 最大的记录,从而实现去重的目的。
在 Laravel 中实现多列去重
在 Laravel 中,可以使用 DB::select() 方法执行原生 SQL 查询。 以下是一个示例,展示如何在 Laravel 中实现上述 SQL 查询:
public static function waybackWhen($result)
{
$username = $result->username;
config()->set('database.connections.mysql.strict', false);
DB::reconnect(); // Important as the existing connection if any would be in strict mode.
$resultSet = DB::select("
WITH cte AS (
SELECT *, ROW_NUMBER() OVER
(PARTITION BY username, discipline_one, discipline_two, discipline_three,
discipline_four, discipline_five, discipline_six ORDER BY id DESC) rn
FROM results
)
SELECT id, username, discipline_one, discipline_two, discipline_three,
discipline_four, discipline_five, discipline_six, created_at, updated_at
FROM cte
WHERE rn = 1 AND username = ?
", [ $username ]);
// Now changing back the strict ON.
config()->set('database.connections.mysql.strict', true);
DB::reconnect();
return $resultSet;
}这段代码的逻辑如下:
- config()->set('database.connections.mysql.strict', false);: 关闭 MySQL 的严格模式。 在某些情况下,MySQL 的严格模式可能会导致 SQL 查询失败。
- DB::reconnect();: 重新连接数据库。 这是为了确保连接使用新的配置。
- DB::select(...): 执行原生 SQL 查询。 SQL 查询与前面介绍的 SQL 示例相同。
- [ $username ]: 将 $username 变量作为参数传递给 SQL 查询,以防止 SQL 注入。
- config()->set('database.connections.mysql.strict', true);: 重新启用 MySQL 的严格模式。
- DB::reconnect();: 再次重新连接数据库,使配置生效。
- return $resultSet;: 返回查询结果。
注意事项:
- 关闭和重新启用 MySQL 的严格模式可能不是必需的,具体取决于你的 MySQL 配置和 SQL 查询。 建议在测试环境中进行验证。
- 使用参数化查询(例如,[ $username ])来防止 SQL 注入。
- 确保 results 表中存在 username 和 discipline_one 到 discipline_six 列。
总结
本文介绍了一种使用 SQL 窗口函数 ROW_NUMBER() 在 Laravel 中实现多列去重的方案。 通过使用原生 SQL 查询,可以灵活地处理复杂的去重需求。 在实际应用中,可以根据具体情况调整 SQL 查询和 Laravel 代码。 使用此方法能够有效地清理重复数据,并保证数据的唯一性和准确性。










