在Java里如何开发一个简易的音乐推荐系统_Java数据存储与推荐算法解析

P粉602998670

发布时间：2026-02-08 09:18:16

366人浏览过

来源于php中文网

原创

用纯Java内存实现简易音乐推荐系统，核心是基于用户的协同过滤：用HashMap存用户-歌曲评分，Integer作ID，评分归一化至[0.0,5.0]；先求共同评过分的歌曲交集再算相似度；预测时用小顶堆维护Top-K，注意NaN和空值处理；调试聚焦commonItems.size()、similarity、predictedRating三处日志。

在java里如何开发一个简易的音乐推荐系统_java数据存储与推荐算法解析

Java 里做简易音乐推荐系统，不靠 Spark 或 Flink 这类大数据框架，用纯 Java + 内存计算 + 简单协同过滤就能跑通核心逻辑。关键不是“多准”，而是“能动、可调、易 debug”。

用 `HashMap` 存用户-歌曲评分数据，别急着上数据库

冷启动阶段，硬编码或读取 CSV 后存进内存结构最省事。用 Map> 表示 “用户ID → {歌曲ID → 评分}”，比一上来连 MySQL 或 Redis 快得多，也方便你随时打印、断点、改值。

用户 ID 和歌曲 ID 建议统一用 Integer，避免 String 带来的哈希不一致或空格问题
评分建议归一化到 [0.0, 5.0] 区间，后续皮尔逊相关系数计算更稳定
如果某用户没评过歌，对应 value 是 null 或空 Map，算法里得判空，否则 NullPointerException 直接炸

实现基于用户的协同过滤：`userSimilarity` 函数要先算共同评分项

两个用户相似度不能只看总分接近，得找他们共同评过分的歌曲交集。直接套公式前，务必先过滤出共现集合——这是最容易漏掉、导致相似度虚高或 NaN 的地方。

用 Set.retainAll() 求用户 A 和 B 都评过的歌曲 ID 集合
若交集大小
计算皮尔逊时，对每个用户先算自己评分均值（仅在共现歌曲子集上），不是全量平均

示例片段：

double sum1 = 0.0, sum2 = 0.0;
for (int sid : commonItems) {
    sum1 += ratingsA.get(sid);
    sum2 += ratingsB.get(sid);
}
double meanA = sum1 / commonItems.size();
// ……后续代入协方差公式

推荐结果生成：用 `PriorityQueue` 控制 Top-K，别用 `Arrays.sort`

给用户 A 推荐时，要遍历所有其他用户，预测其对未评分歌曲的喜好值，再取前 N。如果把全部预测分存进 List 再排序，内存和时间都浪费——尤其歌曲数 > 1000 时。

立即学习“Java免费学习笔记（深入）”；

定义 PriorityQueue>，按预测分小顶堆，容量设为 K
每算出一个新预测分，offer() 后检查 size > K 就 poll() 掉最小的
注意：堆里比较器必须处理 Double.NaN 和 Double.NEGATIVE_INFINITY，否则 compareTo 报异常
最终导出结果记得反转顺序（堆是小顶，你要高分在前）

调试时必打的三个日志点：`commonItems.size()`、`similarity`、`predictedRating`

推荐不准？八成卡在中间某步静默失败。协同过滤链条长，但真正影响输出的就这三处：

打印每个目标用户与其他用户的 commonItems.size()，确认有没有足够邻居（比如全是 0 或 1）
把相似度 similarity 输出到控制台，看是否大量集中在 [−0.1, 0.1] ——说明用户行为太稀疏，该加热度平滑或换物品协同
对某个待预测歌曲，手动挑 2–3 个高相似邻居，打印他们各自的 predictedRating，验证公式代入是否正确（均值偏移、权重累加逻辑）

协同过滤看着简单，但共同项为空、除零、NaN 传播、整数除法截断这些坑，全藏在看似平淡的 for 循环里。先让 userSimilarity 和 predictRating 能稳定吐出非 NaN 数字，再谈准确率。

在Java中如何开发简单的新闻发布系统_JavaWeb项目解析

在Java里如何配置MySQL数据库连接_Java数据库连接设置解析

在Java中如何实现学生信息管理系统_Java学生管理项目实战解析

在Java里如何实现小型博客评论系统_JavaWeb初级项目说明

在Java中如何实现学生考勤管理功能_Java考勤项目实战解析

相关标签:

mysql java redis 编码大数据 csv ai 音乐 red mysql String Integer NULL sort for double 循环堆 map 算法 redis spark flink 数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Firebase Storage 中批量获取图片元数据的高效实践下一篇：在Java里如何初始化数组_Java数组赋值方式说明

作者最新文章

四库一平台官方页面直达地址四库一平台权威查询平台说明

2026-02-06 17:37

四库一平台官方网站访问方式四库一平台官方平台入口指引

2026-02-06 17:39

DeepSeek生成代码时缺少必要的注释说明_在指令中要求每一行复杂代码必须附带解释

2026-02-06 17:42

Win11怎么修复音频服务未运行_Windows11疑难解答修复

2026-02-06 17:46

番茄音乐离线听歌怎么操作歌曲下载与本地播放教程

2026-02-06 17:47

Win11怎么开启Linux子系统WSL2_Windows11命令行安装教程

2026-02-06 17:48

夸克浏览器清理缓存失败夸克浏览器缓存清理方法

2026-02-06 17:48

搜狗浏览器缓存清理不了怎么办搜狗浏览器缓存清理教程

2026-02-06 17:50

米侠浏览器无法保存网页米侠浏览器网页保存操作

2026-02-06 17:51

四库一平台官方平台入口说明四库一平台官方网站访问方法

2026-02-06 17:53

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

mysql修改数据表名

MySQL修改数据表：1、首先查看数据库中所有的表，代码为：‘SHOW TABLES；’；2、修改表名，代码为：‘ALTER TABLE 旧表名 RENAME [TO] 新表名；’。php中文网还提供MySQL的相关下载、相关课程等内容，供大家免费下载使用。

672

2023.06.20

MySQL创建存储过程

存储程序可以分为存储过程和函数，MySQL中创建存储过程和函数使用的语句分别为CREATE PROCEDURE和CREATE FUNCTION。使用CALL语句调用存储过程智能用输出变量返回值。函数可以从语句外调用(通过引用函数名)，也能返回标量值。存储过程也可以调用其他存储过程。php中文网还提供MySQL创建存储过程的相关下载、相关课程等内容，供大家免费下载使用。

329

2023.06.21

mongodb和mysql的区别

mongodb和mysql的区别：1、数据模型；2、查询语言；3、扩展性和性能；4、可靠性。本专题为大家提供mongodb和mysql的区别的相关的文章、下载、课程内容，供大家免费下载体验。

283

2023.07.18

mysql密码忘了怎么查看

MySQL是一个关系型数据库管理系统，由瑞典MySQL AB 公司开发，属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一，在 WEB 应用方面，MySQL是最好的 RDBMS 应用软件之一。那么mysql密码忘了怎么办呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

518

2023.07.19

mysql创建数据库

MySQL是一个关系型数据库管理系统，由瑞典MySQL AB 公司开发，属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一，在 WEB 应用方面，MySQL是最好的 RDBMS 应用软件之一。那么mysql怎么创建数据库呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

260

2023.07.25