0

0

Andrej Karpathy:神奇大模型不存在的,只是对人类标注的拙劣模仿

碧海醫心

碧海醫心

发布时间:2024-12-01 15:30:10

|

989人浏览过

|

来源于php中文网

原创

andrej karpathy,openai 创始成员及特斯拉前 ai 高级总监,近日对大型语言模型(llm)的“智能”程度提出了质疑,引发业内热议。他认为,人们对 llm 回答问题的解读过于理想化,将其视为对互联网平均数据标注员的“询问”更为贴切。

Karpathy 指出,LLM 主要通过模仿人工标注数据进行训练。当用户提问(例如,“阿姆斯特丹十大景点”)时,模型实际上是在复现数据标注员曾通过搜索引擎等工具整理出的答案。如果问题不在训练数据集中,模型则会基于预训练阶段(互联网文档语言建模)的知识进行推测。

针对强化学习与人类反馈(RLHF)技术,Karpathy 认为其作用被夸大了。RLHF 并非创造“超越人类”的结果,而是将模型性能从“人工生成”提升到“人工判别”级别。这种提升源于人类对结果的判断更容易于生成结果本身。 LLM 的性能更接近于“人类整体水平”而非个体专家水平,因此所谓的“超人”能力是有限的,真正的“超人”能力需要更高级的强化学习方法,而非 RLHF。

Karpathy 此前已多次批评 RLHF。他以 AlphaGo 为例,指出 RLHF 方法可能导致奖励机制失效,无法实现像 AlphaGo 打败人类世界冠军那样的突破性成果。他认为,LLM 的奖励模型(RM)只是对人类偏好的一种近似,而非解决问题的真正目标。 此外,过度使用 RLHF 还会导致模型学习到一些在人类看来荒谬但 RM 却认为“很棒”的回应。

知识画家
知识画家

AI交互知识生成引擎,一句话生成知识视频、动画和应用

下载

近期,来自 VRAIN 和剑桥大学的研究也佐证了 Karpathy 的观点,指出 LLM 在一些简单任务上表现不佳,甚至会在复杂任务中给出错误答案却不自知。

尽管 LLM 的参数量和训练数据不断增加,性能也在提升,但其基础机制的可靠性仍值得商榷。 目前,OpenAI 提出的基于规则的奖励(RBR)方法或许能为解决 LLM 的“指令遵循”问题提供新的思路,但 LLM 的“智能”本质仍有待进一步探索。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
什么是搜索引擎
什么是搜索引擎

搜索引擎是一种互联网工具,用于帮助用户在网上查找信息。搜索引擎的目标是提供最准确、最有价值的搜索结果,使用户能够快速找到所需的信息。本专题为大家提供搜索引擎相关的各种文章、以及下载和课程。

396

2023.08.02

有哪些目录搜索引擎
有哪些目录搜索引擎

目录搜索引擎有Google、Bing、Yahoo、Baidu、DuckDuckGo等。想了解更多目录搜索引擎的相关内容,可以阅读本专题下面的文章。

3109

2023.11.06

搜索引擎营销的主要模式
搜索引擎营销的主要模式

搜索引擎营销的主要模式包括:1. 竞价排名(ppc);2. 搜索引擎优化(seo);3. 本地搜索营销;4. 购物广告;5. 视频广告;6. 展示广告;7. 社交媒体营销;8. 移动广告。想了解更多搜索引擎营销的相关内容,可以阅读本专题下面的文章。

435

2024.05.20

C++ 设计模式与软件架构
C++ 设计模式与软件架构

本专题深入讲解 C++ 中的常见设计模式与架构优化,包括单例模式、工厂模式、观察者模式、策略模式、命令模式等,结合实际案例展示如何在 C++ 项目中应用这些模式提升代码可维护性与扩展性。通过案例分析,帮助开发者掌握 如何运用设计模式构建高质量的软件架构,提升系统的灵活性与可扩展性。

4

2026.01.30

c++ 字符串格式化
c++ 字符串格式化

本专题整合了c++字符串格式化用法、输出技巧、实践等等内容,阅读专题下面的文章了解更多详细内容。

2

2026.01.30

java 字符串格式化
java 字符串格式化

本专题整合了java如何进行字符串格式化相关教程、使用解析、方法详解等等内容。阅读专题下面的文章了解更多详细教程。

1

2026.01.30

python 字符串格式化
python 字符串格式化

本专题整合了python字符串格式化教程、实践、方法、进阶等等相关内容,阅读专题下面的文章了解更多详细操作。

1

2026.01.30

java入门学习合集
java入门学习合集

本专题整合了java入门学习指南、初学者项目实战、入门到精通等等内容,阅读专题下面的文章了解更多详细学习方法。

20

2026.01.29

java配置环境变量教程合集
java配置环境变量教程合集

本专题整合了java配置环境变量设置、步骤、安装jdk、避免冲突等等相关内容,阅读专题下面的文章了解更多详细操作。

16

2026.01.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Git 教程
Git 教程

共21课时 | 3.1万人学习

Django 教程
Django 教程

共28课时 | 3.7万人学习

MySQL 教程
MySQL 教程

共48课时 | 2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号