讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题人工智能 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架人工智能 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI聊天问答 Agent智能体 AI文本写作 AI绘画作图 AI设计工具 AI视频创作 AI音频制作 AI办公学习 AI编程开发 AI提示词

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

ChatGPT爆火，LeCun心态崩了！称大语言模型是邪路，Meta模型3天惨遭下线

王林

发布时间：2023-04-12 18:58:01

|

1439人浏览过

|

来源于51CTO.COM

转载

这两天，图灵奖得主Yann LeCun心态有些崩了。

自从ChatGPT大火之后，微软凭着OpenAI腰板挺得很直。

被啪啪打脸的谷歌，也不说什么「声誉风险」了。

所有旗下的语言模型，无论是LaMDA，还是DeepMind的Sparrow，以及Apprentice Bard，是能加快的加快，能上架的上架。然后再狂投近4亿美元给Anthropic，想赶快扶出自己的OpenAI。（微软有的我也要）

然而，有一个人看着微软谷歌各领风骚，却只能急得原地跳脚。

这个人就是Meta的首席AI科学家——Yann LeCun。

他在推特中十分意难平：「ChatGPT满嘴胡诌，你们却对它如此宽容，但我家的Galactica，才出来三天，就被你们骂到下线了。」

是谁酸到了，我不说

作为深度学习三巨头之一、图灵奖得主，LeCun的一举一动，都十分引人注意。

1月27日，在Zoom的媒体和高管小型聚会上，LeCun对ChatGPT给出了一段令人惊讶的评价：「就底层技术而言，ChatGPT并不是多么了不得的创新。虽然在公众眼中，它是革命性的，但是我们知道，它就是一个组合得很好的产品，仅此而已。」

「除了谷歌和Meta之外，还有六家初创公司，基本上都拥有非常相似的技术。」

另外他还说，ChatGPT用的Transformer架构是谷歌提出的，而它用的自监督方式，正是他自己提倡的，那时OpenAI还没诞生呢。

此番言论一出，公众哗然。Open AI的CEO Sam Altman疑似因为这句话直接取关了LeCun。

随后，LeCun继续舌战众位推友。

1月28日，LeCun发推称，「大型语言模型并没有物理直觉，它们是基于文本训练的。如果它们能从庞大的联想记忆中检索到类似问题的答案，他们可能会答对物理直觉问题。但它们的回答，也可能是完全错误的。」

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

2月4日，LeCun再次发推，更加直白地表示「在通往人类级别AI的道路上，大型语言模型就是一条歪路」。

他这话一说，网友们可high了，纷纷冲到评论区留言。

LeCun随后补充说：「依靠自动回归和响应预测下一个单词的LLM是条歪路，因为它们既不能计划也不能推理。」

「但是SSL预训练的Transformer是解决方案，因为它所处的现实系统有推理、计划和学习的能力。」

LeCun举了个有趣的例子：自己在参加播客节目时，展示过ChatGPT的回答，它看上去很有道理，却错得离谱。然而主持人在读完ChatGPT的回答后，却没有第一时间发现它错了。

LeCun对此解释道：「我们的思维方式和对世界的感知让我们能预想即将发生的事物。这是我们获得常识的基础，而LLM并没有这种能力。」

他再次发推称：「在我们做出人类级别的AI之前，我们需要先做出猫猫/狗狗级别的AI。而现在我们甚至连这都做不到。我们缺失了十分重要的东西。要知道，连一只宠物猫都比任何大型语言模型有更多的常识，以及对世界的理解。」

在留言区，有网友毫不客气地怼起LeCun：「你说得不对吧，本人亲测，Galactica的错误率接近100%，而ChatGPT的错误率差不多在15%左右。」

对于网友的痛击，LeCun再次发推表明态度：「我从来没说大型语言模型没用，其实我们Meta也推出过Galactica模型，只是它不像ChatGPT那么好命罢了。ChatGPT满嘴胡诌，你们却对它如此宽容，但我家的Glacatica，才出来三天，就被你们骂到下线了。」

对此，评论区有网友讽刺道：「你可真棒棒啊。不如回实验室去，把你说的东西给做出来。」

LeCun回复：「今天可是周日，推特大辩论是我周末最爱的消遣了。」

自家的模型只活了3天

LeCun如此意难平，可以理解。

去年11月中旬，Meta的FAIR实验室曾提出一个Galactica模型，它可以生成论文、生成百科词条、回答问题、完成化学公式和蛋白质序列的多模态任务等等。

Galactica生成的论文

LeCun也很开心地发推盛赞，称这是一个基于学术文献训练出的模型，给它一段话，它就能生成结构完整的论文。

然而，由于Galactica满嘴跑火车，它才上线短短三天，就被网友喷到下线。

LeCun转发了Papers with Code的通知，像个「大怨种」一样说道：「现在我们再也不能和Galactica一起愉快地玩耍了，你们开心了？」

虽然Galactica的demo才上线几天，但当时的用户都感觉如临大敌。

有网友警示道：想想这个「写论文」神器会被学生们拿来做什么吧。

有网友表示，「Galactica这个模型的回答错漏百出，充满偏见，可是它的语气却十分自信权威。这太恐怖了。」

马库斯也表示，这种大型语言模型可能会被学生用来愚弄老师，非常令人担心。

这熟悉的配方，熟悉的味道，真是令人感慨万千：曾经Galactica引起的恐慌和质疑，不正是ChatGPT后来所经历吗？

看着这段历史的重演，却有着截然不同的结局，LeCun这么酸，确实不能说是毫无来由。

那为什么ChatGPT就能在质疑的声浪中人气愈发高涨，Galactica却只能惨兮兮地被骂到下线呢？

首先，Galactica由Meta提出，大公司确实比OpenAI这样的小初创公司，面临更多的「声誉风险」。

另外，OpenAI的产品定位策略十分聪明，从ChatGTP的名字就可以看出，它主打的概念是聊天。

你可以和它聊知识、聊论文，但既然是「chat」，自然可以放飞一些，谁规定聊天一定要聊「准确」「严谨」的东西呢？

但Glactica则不同，它的官方定义是：「这是一个用于科研的模型。」「这是一个受过人类科学知识训练的人工智能。您可以将它用作一个新界面，来访问和操作我们对宇宙的知识。」

这当然就给自己埋了大雷了。

虽然从技术层面来看，ChatGPT的确没有太多创新，但是从产品运营的角度，OpenAI这一招，打得十分出色。

LLM为什么会满嘴胡话？

所以，大语言模型为什么会满嘴胡话呢？

在LeCun点赞的一篇文章中，作者做出了解释：「我曾尝试用ChatGPT来帮忙写博客文章，但都以失败告终。原因很简单：ChatGPT经常会整出很多虚假的『事实』」。

自然语言不等于知识

要知道，LLM是为了在与其他人类的对话中听起来像一个人，而且它们也很好地实现了这个目标。但问题是，听起来自然与评估信息的准确性是两种完全不同的事情。

那么，这个问题该如何解决呢？

举个例子，我们可以借助已经对物理学理解进行了编码的机器——物理学引擎：

修改LLM，使它能识别出自己被问到的是一个关于物理的问题
将问题转换为一个物理场景
用一个物理引擎来模拟这个场景
用文字描述该场景的输出

而对于「假论文问题」，我们同样也可以采用类似的修正。

也就是让ChatGPT认识到它被问到了关于科学论文的问题，或者它正在写关于论文的东西，并强迫它在继续之前查阅一个可信的数据库。

但是请注意，如果真的这样做了，那就意味着你把一种特定的额外「思维」嫁接到了LLM身上。而且还必须考虑到一大堆特殊的情况。这时，人类工程师知道真相来自哪里，但LLM却不知道。

此外，随着工程师们把越来越多的这样的修复方法嫁接在一起，越来越明显的是，LLM不是一种人工通用智能的形式。

不管人类的智能是什么，我们都知道它不仅仅是能说会道的能力。

人类语言的多种用途

为什么人类要互相交谈，或为对方写下东西？

其中一个目的是直接传达事实信息，比如「我在商店」、「它没有插电」等，但这远不是我们使用语言的唯一原因：

劝说、请求、命令、指示
传达情感
娱乐他人（包括小说、笑话等）、自娱自乐
欺骗（撒谎）
建立关系（与朋友建立联系，调情）

……

看得出来，人类交流的目的是非常多样化的。而且，我们通常也不会在写作的内容中表明它的目的是什么，作者和读者也对这些内容的作用有着不同的认知。

如果ChatGPT想要成为一个值得信赖的事实传播者，它可能要学会如何区分它所训练的人类写作的各种目的。

也就是说，它将不得不学会不认真对待废话，区分说服和宣传与客观分析，独立判断一个来源的可信度与它的受欢迎程度，等等。

即使对于人类，这也是一个非常困难的技巧。有研究表明，虚假信息在推特上的传播速度是准确信息的数倍——往往更具有煽动性、娱乐性或看起来很新颖。

那么问题来了，为什么生成式人工智能在计算机代码上表现很好？为什么编写功能代码的准确性不能转化为传达事实的准确性？

对此可能的回答是，计算机代码是功能性的，而不是交流性的。以正确的语法编写某段代码会自动执行一些任务，而编写一个语法正确的句子却不一定能达到任何目的。

此外，我们很容易将计算机代码的训练语料库限制在「好」的代码上，也就是完美地执行其预期目的的代码。相比之下，要制作一个成功实现其目的的文本语料库几乎是不可能的。

因此，为了将自己训练成可信赖的事实传播者，LLLM必须完成一项比训练自己提出功能性计算机代码更难的任务。

虽然不知道对于工程师来说，建立一个能够区分事实和废话的LLM有多难，但这即便对于人类来说，都是一项困难的任务。

马库斯：世纪大和解

ADHD Reading

ADHD Reading

面向ADHD群体的浏览器阅读增强扩展

下载

LeCun的一大串言论，让大家纷纷疑惑：这不是马库斯会说的话吗？

热（chi）情（gua）的网友纷纷@马库斯，期待他对此事的锐评。

苦GPT久矣的马库斯自然喜出望外，立刻转发LeCun的帖子，还评论道「100昏」。

马库斯还在自己的博客上发文，回顾自己与LeCun的「爱恨情仇」。

马库斯称，自己与LeCun本是多年老友，因为嘴了Galactica几句使得两人交恶。

实际上，马库斯与LeCun的嘴仗打了好几年了，可不是光只因为Galactica下线的事情。

与另外两位图灵奖得主Bengio和Hinton的相对低调不同，近几年，LeCun在社交媒体上的活跃在AI圈子里也是出了名的。不少工作在挂了Arxiv之后就第一时间在推特上宣传一波。

同样高调的马库斯也是一向视推特为自己的主场，当LeCun的宣传和马库斯的看法产生矛盾时，双方都不打算憋着。

在社交媒体上，两人可以说达到了有架必吵的地步，彼此间话讲的毫不客气，见面说不定都能直接掐起来那种。

而且要说梁子，2019年LeCun与Hinton和Bengio一起获得图灵奖后，有一张合影，原本马库斯站在LeCun的边上，但在LeCun分享的照片中，Marcus被无情地剪掉了。

然而，ChatGPT的诞生改变了一切。

ChatGPT爆火，Galactica三天后便落魄下架。在LeCun对LLM疯狂输出时，马库斯自然乐于看到此景。

正所谓敌人的敌人就是朋友，不论LeCun的言论是自家产品失败后的大彻大悟，还是对竞品顶流现状的眼红，马库斯都愿意添一把火。

马库斯认为，他和LeCun达成一致的，不仅是关于LLM的炒作和局限性。他们都认为Cicero应该得到更多的关注。

最后，马库斯@了懂的都懂的那个人，并说「该给家人们福利了」。

可以说，LeCun在推特上掀起的骂战，不仅让马库斯的反GPT军团多了一员猛将，还给了两人握手言和的契机。

这么看来，或许马库斯才是最终赢家。

相关文章

什么是 Gemini 学习社区？加入全球 AI 玩家的交流圈教程

实战项目：构建一个基于图片理解的智能家庭装修建议平台

海螺AI生成视频如何避免闪烁海螺AI画面帧数稳定技巧

NemoClaw— 英伟达开源的企业级AI Agent框架

如何优化长文本的检索性能？针对 Gemini 1.5 Pro 的 RAG 加速方案

相关标签:

chatgpt

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：AI 模型第一次有了国家标准：华为、百度、北大、鹏城实验室等编制，辐射 AMD 下一篇：Nature封面：科学颠覆性进步明显「降速」，物理研究下跌100%

作者最新文章

微信朋友圈定时发送神器微信自动发朋友圈软件推荐与使用

2026-01-04 12:22

抖音火山版免费下载电脑版抖音火山版电脑版免费下载入口

2026-01-04 14:33

必应搜索怎样结合演员名找其主演电视剧_必应搜索用演员搜剧技巧【精要】

2026-01-07 17:31

微信自动发朋友圈怎么设置微信朋友圈一键定时发送方法

2026-01-16 12:58

微信小程序怎么定时发朋友圈免费微信朋友圈定时发送工具

2026-02-01 08:25

mysql如何进行子查询_mysql嵌套查询实现方法

2026-03-03 10:56

mysql如何注释SQL语句_mysql单行与多行注释规范

2026-03-04 09:49

mysql如何插入或忽略_mysql insert ignore用法

2026-03-10 03:53

mysql如何查看字段信息_mysql desc与describe

2026-03-11 10:25

mysql如何获取最后插入ID_mysql last_insert_id函数

2026-03-13 11:33

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

更多

Go Web框架Gin接口开发与中间件设计实践

Go Web框架Gin接口开发与中间件设计实践

本专题围绕 Go 在 Web 后端开发中的主流框架 Gin 展开，系统讲解高性能接口开发与中间件机制设计。内容涵盖路由分组、请求绑定、参数校验、统一响应封装、日志与鉴权中间件实现，以及接口限流与异常处理策略。通过实战项目案例，帮助开发者构建结构清晰、性能优良的 Go Web 服务体系，提升接口开发效率与系统可维护性。

7

2026.03.19

bootstrap安装教程

bootstrap安装教程

本专题整合了bootstrap安装相关教程，阅读专题下面的文章了解更多详细操作教程。

27

2026.03.18

bootstrap框架介绍

bootstrap框架介绍

本专题整合了bootstrap框架相关介绍，阅读专题下面的文章了解更多详细内容。

169

2026.03.18

vscode 格式化

vscode 格式化

本专题整合了vscode格式化相关内容，阅读专题下面的文章了解更多详细内容。

14

2026.03.18

vscode设置中文教程

vscode设置中文教程

本专题整合了vscode设置中文相关内容，阅读专题下面的文章了解更多详细教程。

8

2026.03.18

vscode更新教程合集

vscode更新教程合集

本专题整合了vscode更新相关内容，阅读专题下面的文章了解更多详细教程。

13

2026.03.18

Gemini网页版零基础入门：5分钟上手Gemini聊天指南

Gemini网页版零基础入门：5分钟上手Gemini聊天指南

本专题专为零基础用户打造，5分钟快速掌握Gemini网页版核心用法。从账号登录到界面布局，详解如何发起对话、优化提示词及利用多模态功能。通过实战案例，教你高效获取信息、创作内容与分析数据。无论学习还是工作，轻松开启AI辅助新时代，让Gemini成为你的得力智能助手。

62

2026.03.18

Python WebSocket实时通信与异步服务开发实践

Python WebSocket实时通信与异步服务开发实践

本专题聚焦 Python 在实时通信场景中的开发实践，系统讲解 WebSocket 协议原理、长连接管理、消息推送机制以及异步服务架构设计。内容包括客户端与服务端通信实现、连接稳定性优化、消息队列集成及高并发处理策略。通过完整案例，帮助开发者构建高效稳定的实时通信系统，适用于聊天应用、实时数据推送等场景。

33

2026.03.18

Java Spring Security权限控制与认证机制实战

Java Spring Security权限控制与认证机制实战

本专题围绕 Java 后端安全体系建设展开，重点讲解 Spring Security 在权限控制与认证机制中的应用实践。内容涵盖用户认证流程、权限模型设计、JWT 鉴权方案、OAuth2 集成以及接口安全防护策略。通过实际项目案例，帮助开发者构建安全可靠的后端认证体系，提升系统安全性与可扩展能力。

35

2026.03.18

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

【web前端】Node.js快速入门

【web前端】Node.js快速入门

共16课时 | 2.1万人学习

swoole进程树解析

swoole进程树解析

共4课时 | 0.2万人学习

ThinkPHP6.x 微实战--十天技能课堂

ThinkPHP6.x 微实战--十天技能课堂

共26课时 | 1.9万人学习

最新文章

更多

结果导向：教你如何申请 Gemini 3.1 系列模型的预览版访问权

什么是 AIGC？如何利用生成式人工智能重塑你的工作流

MuleRun如何生成产品上新预告_MuleRun营销预热内容创作

Minimax提示词修改技巧 Minimax微调视频效果

为什么 AI 总是答非所问？教你避开提示词中的语意模糊坑点

痛点解决：AI 输出太乱？教你用 XML 标签规范输出结构

Minimax视频生成怎么做出纸片人效果 Minimax 2D转动效

WorkBuddy如何批量修改Excel单元格格式_WorkBuddy表格自动化处理教程【干货】

骡子快跑怎么登录多个账号骡子快跑多账号管理

Minimax怎么生成二次元风格视频

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部