
本文介绍一种简洁、高效且可读性强的 JavaScript 方法,用于从格式固定的字符串数组(如 "code1-code2-id-")中按 id 字段去重,保留每个 ID 首次出现的元素。
本文介绍一种简洁、高效且可读性强的 javascript 方法,用于从格式固定的字符串数组(如 `"code1-code2-id-"`)中按 `id` 字段去重,保留每个 id 首次出现的元素。
在处理结构化字符串数据时,常需根据某一段子字符串(如 ID)对数组去重。例如,给定数组 ["13989664-34-1-", "3588867-34-1-", "4757546-34-2-", "72469424-34-2-"],所有字符串均符合 code1-code2-id- 格式,其中 code2 固定,而 id 位于第三个 - 分隔段(即索引 2)。目标是保留每个唯一 id 对应的第一个字符串,剔除其余重复 id 的项。
推荐使用 Array.prototype.filter() 配合 Array.prototype.findIndex() 实现——这是一种函数式、无副作用、语义清晰的方案:
const links = [
"13989664-34-1-",
"3588867-34-1-",
"4757546-34-2-",
"72469424-34-2-"
];
// 提取 id 的纯函数:安全解析,兼容末尾可能存在的多余 '-' 或空段
const getId = (str) => {
const parts = str.split('-');
return parts[2] || ''; // 取第三段(索引为2),避免越界
};
const uniqueLinks = links.filter((item, index) =>
links.findIndex(other => getId(other) === getId(item)) === index
);
console.log(uniqueLinks);
// 输出: ["13989664-34-1-", "4757546-34-2-"]✅ 原理说明:
对每个元素 item,findIndex 在整个数组中查找第一个与其 id 相同的元素的索引;仅当该索引恰好等于当前 item 的位置 index 时,才保留它——这天然保证了每个 id 仅保留首次出现项。
⚠️ 注意事项:
- 该方法时间复杂度为 O(n²),适用于中小型数组(< 10,000 项)。若数据量极大,建议改用 Set + 单次遍历(见下方优化版);
- split('-')[2] 假设格式严格;如存在不合规字符串,建议增加校验(如正则 /^[\w]+-[\w]+-(\d+)-$/ 提取 id);
- 若需保留最后一个而非第一个重复项,可将 filter 替换为 reduceRight,或反转数组后处理再反转结果。
? 高性能替代方案(推荐用于大数据集):
const uniqueLinksOptimized = links.reduce((acc, item) => {
const id = getId(item);
if (!acc.seen.has(id)) {
acc.seen.add(id);
acc.result.push(item);
}
return acc;
}, { seen: new Set(), result: [] }).result;该方案为 O(n) 时间复杂度,内存开销略增但性能更稳定,适合生产环境大规模数据处理。
总结:filter + findIndex 是语义最直观、代码最简练的标准解法;而 reduce + Set 则在性能与健壮性上更进一步。根据实际场景选择即可。










