讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

GPT-4王者加冕！读图做题性能炸天，凭自己就能考上斯坦福

WBOY

发布时间：2023-04-11 19:58:01

|

2119人浏览过

|

来源于51CTO.COM

转载

果然，能打败昨天的OpenAI的，只有今天的OpenAI。

刚刚，OpenAI震撼发布了大型多模态模型GPT-4，支持图像和文本的输入，并生成文本结果。

号称史上最先进的AI系统！

GPT-4不仅有了眼睛可以看懂图片，而且在各大考试包括GRE几乎取得了满分成绩，横扫各种benchmark，性能指标爆棚。

OpenAI 花了 6 个月的时间使用对抗性测试程序和 ChatGPT 的经验教训对 GPT-4 进行迭代调整，从而在真实性、可控性等方面取得了有史以来最好的结果。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

大家都还记得，2月初时微软和谷歌鏖战三天，2月8日微软发布ChatGPT必应时，说法是必应「基于类ChatGPT技术」。

今天，谜底终于解开了——它背后的大模型，就是GPT-4！

图灵奖三巨头之一Geoffrey Hinton对此赞叹不已，「毛虫吸取了营养之后，就会化茧为蝶。而人类提取了数十亿个理解的金块，GPT-4，就是人类的蝴蝶。」

顺便提一句，ChatGPT Plus用户现在可以先上手了。

考试几乎满分，性能跃迁炸天

在随意谈话中，GPT-3.5和GPT-4之间的区别是很微妙的。只有当任务的复杂性达到足够的阈值时，差异就出现了，GPT-4比GPT-3.5 更可靠、更有创意，并且能够处理更细微的指令。

为了了解这两种模型之间的差异，OpenAI在各种基准测试和一些为人类设计的模拟考试上进行了测试。

GPT-4在各种考试中，有几个测试几乎接近了满分：

USABO Semifinal 2020（美国生物奥林匹克竞赛）
GRE Writing

以美国 BAR律师执照统考为例，GPT3.5可以达到 10%水平，GPT4可以达到90%水平。生物奥林匹克竞赛从GPT3.5的31%水平，直接飙升到 99%水平。

此外，OpenAI 还在为机器学习模型设计的传统基准上评估了 GPT-4。从实验结果来看，GPT-4 大大优于现有的大型语言模型，以及大多数 SOTA 模型：

另外，GPT-4在不同语种上的能力表现：中文的准确度大概在 80% 左右，已经要优于GPT-3.5的英文表现了。

许多现有的 ML 基准测试都是用英语编写的。为了初步了解GPT-4其他语言的能力，研究人员使用 Azure翻译将 MMLU 基准（一套涵盖57个主题的14000个多项选择题）翻译成多种语言。

在测试的 26 种语言的 24 种中，GPT-4 优于 GPT-3.5 和其他大语言模型（Chinchilla、PaLM）的英语语言性能：

OpenAI表示在内部使用 GPT-4，因此也关注大型语言模型在内容生成、销售和编程等方面的应用效果。另外，内部人员还使用它来帮助人类评估人工智能输出。

对此，李飞飞高徒、英伟达AI科学家Jim Fan点评道：「GPT-4最强的其实就是推理能力。它在GRE、SAT、法学院考试上的得分，几乎和人类考生没有区别。也就是说，GPT-4可以全靠自己考进斯坦福了。」

（Jim Fan自己就是斯坦福毕业的！）

网友：完了，GPT-4一发布，就不需要我们人类了……

读图做题小case，甚至比网友还懂梗

GPT-4此次升级的亮点，当然就是多模态。

GPT-4不仅能分析汇总图文图标，甚至还能读懂梗图，解释梗在哪里，为什么好笑。从这个意义上说，它甚至能秒杀许多人类。

OpenAI称，GPT-4比以往模型都更具创造力和协作性。它可以生成、编辑和迭代用户进行创意和技术写作任务，例如创作歌曲、编写剧本或学习用户的写作风格。

GPT-4可以将图像作为输入，并生成标题、分类和分析。比如给它一张食材图，问它用这些食材能做什么。

另外，GPT-4能够处理超过25,000字的文本，允许用长形式的内容创建、扩展会话、文档搜索和分析。

GPT-4在其先进的推理能力方面超过了ChatGPT。如下：

梗图识别

比如，给它看一张奇怪的梗图，然后问图中搞笑在哪里。

GPT-4拿到之后，会先分析一波图片的内容，然后给出答案。

比如，逐图分析下面这个。

GPT-4立马反应过来：图里的这个「Lighting充电线」，看起来就是个又大又过气的VGA接口，插在这个又小又现代的智能手机上，反差强烈。

再给出这么一个梗图，问问GPT-4梗在哪里？

它流利地回答说：这个梗搞笑的地方在于「图文不符」。

文字明明说是从太空拍摄的地球照片，然而，图里实际上只是一堆排列起来像地图的鸡块。

GPT-4还能看懂漫画：为什么要给神经网络加层数？

它一针见血地点出，这副漫画讽刺了统计学习和神经网络在提高模型性能方法上的差异。

图表分析

格鲁吉亚和西亚的平均每日肉类消费量总和是多少？在给出答案前，请提供循序渐进的推理。

果然，GPT-4清楚地列出了自己的解题步骤——

1. 确定格鲁吉亚的平均每日肉类消费量。

2. 确定西亚的平均每日肉类消费量。

3. 添加步骤1和2中的值。

做物理题

要求GPT-4解出巴黎综合理工的一道物理题，测辐射热计的辐射检测原理。值得注意的是，这还是一道法语题。

GPT-4开始解题：要回答问题 I.1.a，我们需要每个点的温度 T(x)，用导电棒的横坐标x表示。

随后解题过程全程高能。

你以为这就是GPT-4能力的全部？

老板Greg Brockman直接上线进行了演示，通过这个视频你可以很直观的感受到 GPT-4的能力。

最惊艳的是，GPT-4对代码的超强的理解能力，帮你生成代码。

Greg直接在纸上画了一个潦草的示意图，拍个照，发给 GPT说，给我按照这个布局写网页代码，就写出来了。

另外，如果运行出错了把错误信息，甚至错误信息截图，扔给GPT-4都能帮你给出相应的提示。

网友直呼：GPT-4发布会，手把手教你怎么取代程序员。

顺便提一句，用GPT-4还可以进行报税。要知道，每年美国人要花好多时间金钱在报税上面。

训练过程

和以前的GPT模型一样，GPT-4基础模型的训练使用的是公开的互联网数据以及OpenAI授权的数据，目的是为了预测文档中的下一个词。

这些数据是一个基于互联网的语料库，其中包括对数学问题的正确/错误的解决方案，薄弱/强大的推理，自相矛盾/一致的声明，足以代表了大量的意识形态和想法。

当用户给出提示进行提问时，基础模型可以做出各种各样的反应，然而答案可能与用户的意图相差甚远。

因此，为了使其与用户的意图保持一致，OpenAI使用基于人类反馈的强化学习（RLHF）对模型的行为进行了微调。

不过，模型的能力似乎主要来自于预训练过程，RLHF并不能提高考试成绩（如果不主动进行强化，它实际上会降低考试成绩）。

基础模型需要提示工程，才能知道它应该回答问题，所以说，对模型的引导主要来自于训练后的过程。

GPT-4模型的一大重点是建立了一个可预测扩展的深度学习栈。因为对于像GPT-4这样的大型训练，进行广泛的特定模型调整是不可行的。

因此，OpenAI团队开发了基础设施和优化，在多种规模下都有可预测的行为。

为了验证这种可扩展性，研究人员提前准确地预测了GPT-4在内部代码库（不属于训练集）上的最终损失，方法是通过使用相同的方法训练的模型进行推断，但使用的计算量为1/10000。

现在，OpenAI 可以准确地预测在训练过程中优化的指标损失。例如从计算量为1/1000的模型中推断并成功地预测了HumanEval数据集的一个子集的通过率：

还有些能力仍然难以预测。比如，Inverse Scaling竞赛旨在找到一个随着模型计算量的增加而变得更糟的指标，而 hindsight neglect任务是获胜者之一。但是GPT-4 扭转了这一趋势：

OpenAI认为能够准确预测未来的机器学习能力对于技术安全来说至关重要，但它并没有得到足够的重视。

而现在，OpenAI正在投入更多精力开发相关方法，并呼吁业界共同努力。

贡献名单

就在GPT-4发布的同时，Open AI还公开了GPT-4这份组织架构及人员清单。

上下滑动查看全部

北大陈宝权教授称，

再好看的电影，最后的演职员名单也不会有人从头看到尾。Open AI的这台戏连这个也不走寻常路。毫无疑问这将是一份不仅最被人阅读，也被人仔细研究的「演职员」(贡献者) 名单，而最大的看头，是详细的贡献分类，几乎就是一个粗略的部门设置架构了。

Andi

Andi

智能搜索助手，可以帮助解决详细的问题

下载

这个很「大胆」的公开其实意义挺深远的，体现了Open AI背后的核心理念，也一定程度预示了未来进步的走向。

相关文章

DeepSeek提示对话长度超出最大限制_开启新对话或要求AI总结前文并继续当前话题

Suno AI怎么用？输入文字免费生成原创歌曲教程

豆包AI生成的二次元头像比例失调_要求其按1:1比例生成并强调脸部细节描写

AI辅助学习提示词怎么写_定制学习计划与答疑指令【教育】

AI写小说如何避免情节套路化？提升故事原创性的方法

数码产品性能查询

数码产品性能查询

该软件包括了市面上所有手机CPU，手机跑分情况，电脑CPU，电脑产品信息等等，方便需要大家查阅数码产品最新情况，了解产品特性，能够进行对比选择最具性价比的商品。

下载

相关标签:

ai gpt chatgpt

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：黄仁勋专访：经济不景气又怎样？未来元宇宙将「全民免费」！下一篇：跑ChatGPT体量模型，从此只需一块GPU：加速百倍的方法来了

作者最新文章

玩转夸克浏览器的AI搜索模式_夸克AI搜索新手入门操作指南

2025-10-20 09:50

夸克浏览器AI搜索最新版教学_探索夸克AI搜索的隐藏功能

2025-10-24 20:48

夸克浏览器怎么用AI搜索_夸克AI搜索正确提问方式教学

2025-10-25 23:12

微信朋友圈怎么设置定时发布微信朋友圈定时发送图文教程

2026-01-02 09:14

微信朋友圈怎么定时发送微信朋友圈定时发布设置方法【教程】

2026-01-06 09:59

苹果手机怎么定时发朋友圈 iPhone微信朋友圈自动发布方法【步骤】

2026-01-08 11:11

微信朋友圈能定时发送吗微信朋友圈定时发送功能开启方法

2026-01-09 08:15

微信朋友圈草稿箱怎么用微信朋友圈定时发送隐藏技巧

2026-01-10 08:41

微信朋友圈定时发送是真的吗微信朋友圈预约发布实现方法

2026-01-15 10:19

微信定时发朋友圈怎么弄微信朋友圈自动推送设置流程

2026-01-21 04:27

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI大模型

PC软件

相关专题

更多

c++ 根号

c++ 根号

本专题整合了c++根号相关教程，阅读专题下面的文章了解更多详细内容。

22

2026.01.23

c++空格相关教程合集

c++空格相关教程合集

本专题整合了c++空格相关教程，阅读专题下面的文章了解更多详细内容。

24

2026.01.23

yy漫画官方登录入口地址合集

yy漫画官方登录入口地址合集

本专题整合了yy漫画入口相关合集，阅读专题下面的文章了解更多详细内容。

99

2026.01.23

漫蛙最新入口地址汇总2026

漫蛙最新入口地址汇总2026

本专题整合了漫蛙最新入口地址大全，阅读专题下面的文章了解更多详细内容。

132

2026.01.23

C++ 高级模板编程与元编程

C++ 高级模板编程与元编程

本专题深入讲解 C++ 中的高级模板编程与元编程技术，涵盖模板特化、SFINAE、模板递归、类型萃取、编译时常量与计算、C++17 的折叠表达式与变长模板参数等。通过多个实际示例，帮助开发者掌握如何利用 C++ 模板机制编写高效、可扩展的通用代码，并提升代码的灵活性与性能。

15

2026.01.23

php远程文件教程合集

php远程文件教程合集

本专题整合了php远程文件相关教程，阅读专题下面的文章了解更多详细内容。

65

2026.01.22

PHP后端开发相关内容汇总

PHP后端开发相关内容汇总

本专题整合了PHP后端开发相关内容，阅读专题下面的文章了解更多详细内容。

61

2026.01.22

php会话教程合集

php会话教程合集

本专题整合了php会话教程相关合集，阅读专题下面的文章了解更多详细内容。

63

2026.01.22

宝塔PHP8.4相关教程汇总

宝塔PHP8.4相关教程汇总

本专题整合了宝塔PHP8.4相关教程，阅读专题下面的文章了解更多详细内容。

33

2026.01.22

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

10分钟--Midjourney创作自己的漫画

10分钟--Midjourney创作自己的漫画

共1课时 | 0.1万人学习

Midjourney 关键词系列整合

Midjourney 关键词系列整合

共13课时 | 0.9万人学习

AI绘画教程

AI绘画教程

共2课时 | 0.2万人学习

最新文章

更多

DeepSeek生成的逻辑流程图不清晰_要求其输出Mermaid代码并指定从上到下的布局

ChatGPT生成的正则表达式不匹配特殊字符_提供具体的报错字符串并要求AI重新调试

手机上最好用的AI绘画App是哪个？移动端AI工具评测

谷歌Gemini AI模型使用教程，和ChatGPT有何不同？

怎样让AI绘画更符合想象_精细调整Midjourney参数指南【实战】

ChatGPT生成的翻译内容有歧义_使用双语对照模式并要求AI解释特定词汇的选词原因

DeepSeek提示对话长度超出最大限制_开启新对话或要求AI总结前文并继续当前话题

Suno AI怎么用？输入文字免费生成原创歌曲教程

GravitDesignerAI怎样叠多层渐变_GravitDesignerAI多层渐变法【做法】

豆包AI生成的二次元头像比例失调_要求其按1:1比例生成并强调脸部细节描写

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部