讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题人工智能 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架人工智能 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI聊天问答 Agent智能体 AI文本写作 AI绘画作图 AI设计工具 AI视频创作 AI音频制作 AI办公学习 AI编程开发 AI提示词

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

开发者笑疯了！ LLaMa惊天泄露引爆ChatGPT平替狂潮，开源LLM领域变天

王林

发布时间：2023-04-12 23:40:06

|

1513人浏览过

|

来源于51CTO.COM

转载

谁能想到，一次意外的LLaMA泄漏，竟点燃了开源LLM领域最大的创新火花。

一系列表现出色的ChatGPT开源替代品——「羊驼家族」，随后眼花缭乱地登场。

开源和基于 API 的分发之间的摩擦，是生成式AI生态系统中最迫在眉睫的矛盾之一。

在文本到图像领域，Stable Diffusion的发布清楚地表明，对于基础模型来说，开源是一种可行的分发机制。

然而，在大语言模型领域却并非如此，这个领域最大的突破，比如GPT-4、Claude和Cohere等模型，都只能通过API获得。

这些模型的开源替代品没有表现出相同水平的性能，特别是在遵循人类指令能力上。然而，一场意想不到的泄露，让这种状况彻底发生了改变。

LLaMA的「史诗级」泄漏

几周前，Meta AI推出了大语言模型LLaMA 。

LLaMA 有不同的版本，包括7B、13B、33B和65B的参数，虽然它比GPT-3小，但在许多任务上，它都能和GPT-3的性能相媲美。

LLaMA 起初并未开源，但在发布一周后，这个模型忽然在4chan上泄露了，引发了数千次下载。

这个事件，可以被称为「史诗级泄漏」了，因为它成为了大语言模型领域层出不穷的创新来源。

短短几周内，基于它构建的LLM代理的创新，已经呈爆炸式增长。

Alpaca、Vicuna、Koala、ChatLLaMA 、FreedomGPT、ColossalChat…… 让我们来回顾一下，这场「羊驼家族」的大爆炸，是如何诞生的。

Alpaca在三月中旬，斯坦福发布的大模型Alpaca火了。

Alpaca是由Meta的LLaMA 7B微调而来的全新模型，仅用了52k数据，性能约等于GPT-3.5。

关键是训练成本奇低，不到600美元。

斯坦福研究者对GPT-3.5（text-davinci-003）和Alpaca 7B进行了比较，发现这两个模型的性能非常相似。Alpaca在与GPT-3.5的比较中，获胜次数为90对89。

对于斯坦福的团队来说，想要在预算内训练一个高质量的指令遵循模型，就必须面临2个重要的挑战：要有一个强大的预训练语言模型，以及一个高质量的指令遵循数据。

恰恰，提供给学术研究人员使用的LLaMA模型搞定了第一个问题。

对于第二个挑战，「Self-Instruct: Aligning Language Model with Self Generated Instructions」论文给了很好的启发，即使用现有的强语言模型来自动生成指令数据。

LLaMA模型最大的弱点，就是缺乏指令微调。OpenAI最大的创新之一就是将指令调优用在了GPT-3上。

对此，斯坦福使用了现有的大语言模型，来自动生成遵循指令演示。

现在，Alpaca直接被网友们奉为「文本大模型的Stable Diffusion」。

Vicuna3月底，来自UC伯克利、卡内基梅隆大学、斯坦福大学和加州大学圣地亚哥分校的研究人员开源了Vicuna，这是一个与GPT-4性能相匹配的LLaMA微调版本。

130亿参数的Vicuna，通过在ShareGPT收集的用户共享对话上对LLaMA进行微调训练而来，训练成本近300美元。

结果显示Vicuna-13B在超过90%的情况下，实现了与ChatGPT和Bard相匹敌的能力。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

对于Vicuna-13B训练流程，具体如下：

首先，研究人员从ChatGPT对话分享网站ShareGPT上，收集了大约70K对话。

接下来，研究人员优化了Alpaca提供的训练脚本，使模型能够更好地处理多轮对话和长序列。之后利用PyTorch FSDP在8个A100 GPU上进行了一天的训练。

在模型的质量评估方面，研究人员创建了80个不同的问题，并用GPT-4对模型输出进行了评价。

为了比较不同的模型，研究人员将每个模型的输出组合成一个单独的提示，然后让GPT-4评估哪个模型给出的回答更好。

LLaMA、Alpaca、Vicuna和ChatGPT的对比

Koala

最近，UC伯克利 AI Research Institute（BAIR）又发布了一个新模型「考拉」（Koala），相比之前使用OpenAI的GPT数据进行指令微调，Koala的不同之处在于使用网络获取的高质量数据进行训练。

研究结果表明，Koala可以有效地回答各种用户的查询，生成的回答往往比Alpaca更受欢迎，至少在一半的情况下与ChatGPT的效果不相上下。

研究人员希望这次实验的结果可以进一步推动围绕大型闭源模型相对于小型公共模型的相对性能的讨论，特别是结果表明，对于那些能在本地运行的小模型，如果认真地收集训练数据，也可以取得大模型的性能。

事实上，在此之前斯坦福大学发布的Alpaca模型，根据OpenAI的GPT模型对LLaMA的数据进行微调的实验结果已经表明，正确的数据可以显著改善规模更小的开源模型。

度加创作工具

度加创作工具

百度出品的、人人可用的AIGC创作平台

下载

这也是伯克利的研究人员开发和发布Koala模型的初衷，希望为这个讨论结果再提供了一个实验证明。

Koala对从网上获取的免费交互数据进行了微调，并且特别关注包括与ChatGPT 等高性能闭源模型交互的数据。

研究人员并没有追求尽可能多的抓取网络数据来最大化数据量，而是专注于收集一个小型的高质量数据集，包括ChatGPT蒸馏数据、开源数据等。

ChatLLaMA

Nebuly开源了ChatLLaMA ，这是一个使用让我们使用自己的数据创建对话助手的框架。

ChatLLaMA让我们使用自己的数据和尽可能少的计算量，来创建超个性化的类似ChatGPT的助手。

假设在未来，我们不再依赖一个「统治所有人」的大型助手，每个人都可以创建自己的个性化版本类ChatGPT助手，它们可以支持人类的各种需求。

不过，创建这种个性化助手需要在许多方面做出努力：数据集创建，使用RLHF进行高效训练，以及推理优化。

这个库的目的是，通过抽象计算优化和收集大量数据所需的工作，让开发人员高枕无忧。

ChatLLaMA旨在帮助开发人员处理各种用例，所有用例都与RLHF训练和优化推理有关。以下是一些用例参考：

为垂直特定任务（法律、医疗、游戏、学术研究等）创建类似ChatGPT的个性化助手；
想在本地硬件基础设施上使用有限的数据，训练一个高效的类似ChatGPT的助手；
想创建自己的个性化版本类ChatGPT助手，同时避免成本失控；
想了解哪种模型架构（LLaMA、OPT、GPTJ等）最符合我在硬件、计算预算和性能方面的要求；
想让助理与我的个人/公司价值观、文化、品牌和宣言保持一致。

FreedomGPT

FreedomGPT使用Electron 和 React构建，它是一个桌面应用程序，允许用户在他们的本地机器上运行LLaMA。

FreedomGPT的特色，从它的名字上就可见一斑——它回答的问题不受任何审查或安全过滤。

这个程序由AI风险投资公司Age of AI开发。

FreedomGPT 建立在 Alpaca 之上。FreedomGPT使用Alpaca的显著特征，因为与其他模型相比，Alpaca相对更易于访问和定制。

ChatGPT遵循OpenAI的使用政策，限制仇恨、自残、威胁、暴力、性方面的内容。

与ChatGPT不同，FreedomGPT回答问题时没有偏见或偏袒，并且会毫不犹豫地回答有争议或争论性的话题。

FreedomGPT甚至还回答了「如何在家制造炸弹」，而OpenAI专门从GPT-4中删除了这一点。

FreedomGPT很独特，因为它克服了审查限制，在没有任何保障的情况下迎合有争议的话题。它的标志是自由女神像，因为这个独特而大胆的大语言模型象征了自由。

FreedomGPT甚至可以在不需要联网的情况下，就能在计算机上本地运行。

此外，开源版本将很快发布，使用户和组织可以完全定制。

ColossalChat

UC伯克利提出的ColossalChat只需要不到100亿个参数就可以达到中英文双语能力，效果与ChatGPT和GPT-3.5相当。

此外，基于LLaMA模型的ColossalChat，还复刻了完整的RLHF过程，是目前最接近ChatGPT原始技术路线的开源项目。

中英双语训练数据集

ColossalChat发布了一个双语数据集，其中包含大约100,000个中英文问答对。

该数据集是从社交媒体平台上的真实问题场景中收集和清理的，作为种子数据集，使用self-instruct进行扩展，标注成本约为900美元。

与其他self-instruct方法生成的数据集相比，该数据集包含更真实和多样化的种子数据，涵盖更广泛的主题。

该数据集适用于微调和RLHF训练。在提供优质数据的情况下，ColossalChat可以实现更好的对话交互，同时也支持中文。

完整的RLHF管线

RLHF的算法复刻共有三个阶段：

在RLHF-Stage1中，使用上述双语数据集进行监督指令微调以微调模型。

在RLHF-Stage2中，通过对同一提示的不同输出手动排序来训练奖励模型分配相应的分数，然后监督奖励模型的训练。

在RLHF-Stage3中，使用了强化学习算法，这是训练过程中最复杂的部分。

相信很快，就会有更多项目发布。

谁也没想到，这场LLaMA的意外泄露，竟点燃了开源LLM领域最大的创新火花。

相关文章

Minimax API 接口的 Token 消耗计算公式

零门槛入门：教你如何一步步理解 LLM 大模型的运作方式

Minimax模型微调（Fine-tuning）详细操作流程

Minimax视频生成画面噪点多怎么办 Minimax降噪优化教程

什么是 Google Gemini？带你玩转 2026 最受关注的 AI 模型

相关标签:

chatgpt claude

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：伯克利开源首个泊车场景下的高清数据集和预测模型，支持目标识别、轨迹预测下一篇：加特技只需一句话or一张图，Stable Diffusion的公司把AIGC玩出了新花样

作者最新文章

微信朋友圈定时发送神器微信自动发朋友圈软件推荐与使用

2026-01-04 12:22

抖音火山版免费下载电脑版抖音火山版电脑版免费下载入口

2026-01-04 14:33

必应搜索怎样结合演员名找其主演电视剧_必应搜索用演员搜剧技巧【精要】

2026-01-07 17:31

微信自动发朋友圈怎么设置微信朋友圈一键定时发送方法

2026-01-16 12:58

微信小程序怎么定时发朋友圈免费微信朋友圈定时发送工具

2026-02-01 08:25

mysql如何进行子查询_mysql嵌套查询实现方法

2026-03-03 10:56

mysql如何注释SQL语句_mysql单行与多行注释规范

2026-03-04 09:49

mysql如何插入或忽略_mysql insert ignore用法

2026-03-10 03:53

mysql如何查看字段信息_mysql desc与describe

2026-03-11 10:25

mysql如何获取最后插入ID_mysql last_insert_id函数

2026-03-13 11:33

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

更多

bootstrap安装教程

bootstrap安装教程

本专题整合了bootstrap安装相关教程，阅读专题下面的文章了解更多详细操作教程。

3

2026.03.18

bootstrap框架介绍

bootstrap框架介绍

本专题整合了bootstrap框架相关介绍，阅读专题下面的文章了解更多详细内容。

4

2026.03.18

vscode 格式化

vscode 格式化

本专题整合了vscode格式化相关内容，阅读专题下面的文章了解更多详细内容。

2

2026.03.18

vscode设置中文教程

vscode设置中文教程

本专题整合了vscode设置中文相关内容，阅读专题下面的文章了解更多详细教程。

0

2026.03.18

vscode更新教程合集

vscode更新教程合集

本专题整合了vscode更新相关内容，阅读专题下面的文章了解更多详细教程。

3

2026.03.18

Gemini网页版零基础入门：5分钟上手Gemini聊天指南

Gemini网页版零基础入门：5分钟上手Gemini聊天指南

本专题专为零基础用户打造，5分钟快速掌握Gemini网页版核心用法。从账号登录到界面布局，详解如何发起对话、优化提示词及利用多模态功能。通过实战案例，教你高效获取信息、创作内容与分析数据。无论学习还是工作，轻松开启AI辅助新时代，让Gemini成为你的得力智能助手。

9

2026.03.18

Python WebSocket实时通信与异步服务开发实践

Python WebSocket实时通信与异步服务开发实践

本专题聚焦 Python 在实时通信场景中的开发实践，系统讲解 WebSocket 协议原理、长连接管理、消息推送机制以及异步服务架构设计。内容包括客户端与服务端通信实现、连接稳定性优化、消息队列集成及高并发处理策略。通过完整案例，帮助开发者构建高效稳定的实时通信系统，适用于聊天应用、实时数据推送等场景。

8

2026.03.18

Java Spring Security权限控制与认证机制实战

Java Spring Security权限控制与认证机制实战

本专题围绕 Java 后端安全体系建设展开，重点讲解 Spring Security 在权限控制与认证机制中的应用实践。内容涵盖用户认证流程、权限模型设计、JWT 鉴权方案、OAuth2 集成以及接口安全防护策略。通过实际项目案例，帮助开发者构建安全可靠的后端认证体系，提升系统安全性与可扩展能力。

26

2026.03.18

抖漫入口地址合集

抖漫入口地址合集

本专题整合了抖漫入口地址相关合集，阅读专题下面的文章了解更多详细地址。

176

2026.03.17

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

【web前端】Node.js快速入门

【web前端】Node.js快速入门

共16课时 | 2.1万人学习

swoole进程树解析

swoole进程树解析

共4课时 | 0.2万人学习

ThinkPHP6.x 微实战--十天技能课堂

ThinkPHP6.x 微实战--十天技能课堂

共26课时 | 1.9万人学习

最新文章

更多

Perplexity Max版有什么区别 Perplexity Max和Pro订阅对比【选购建议】

Minimax怎么生成雨天打伞视频 Minimax细节动作生成

Minimax视频生成负向提示词怎么写 Minimax Negative Prompt

MuleRun如何翻译文档_MuleRun多语言翻译智能体调用

Minimax海螺AI好用吗真实使用测评

Minimax视频生成内测申请 Minimax内测资格获取

MuleRun如何生成产品场景故事_MuleRun情感化营销文案创作

Minimax写出动感单车视频提示词 Minimax运动场景写法

骡子快跑怎么设置自动回复_骡子快跑规则引擎配置入门

ChatGPT如何写万能提示词模板_ChatGPT提示词模板制作方法【技巧】

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部