0

0

让机器拟人化,从“人工智障”到“人工智能”

王林

王林

发布时间:2023-06-03 11:34:45

|

1218人浏览过

|

来源于搜狐

转载

5月27日,创业黑马在北京举办 “2023跃迁•黑马AIGC峰会”。此次大会的主题为“预见新世界,构建新格局”。有“AI专家”之称的卡耐基梅隆大学计算机学院前副院长、达沃斯世界经济论坛(WEF)计算机全球未来理事会前主席贾斯汀•卡塞尔,以及360集团、智源研究院、昆仑万维、云知声、蓝色光标、万兴科技、知道创宇等众多行业内企业高层到场,与上千位参会者进行了深入交流。

在峰会现场,云知声创始人、CEO 黄伟分享了 《通向智享未来之路》主题。

以下为分享内容整理:

开始我们希望按照专家的方式去做,希望交给机器一些方法论,十年前,机器开始从错误反馈里学习。这都是在过去人工智能技术里的大概阶段和路径。

今天OpenAI推出了ChatGPT和预训练模型,整个智能变得更加拟人化,首先我们用非常强大的算力阅读了全世界已知的所有文本,训练形成了大模型。它特别像婴儿大脑,可能有几百亿、上千亿的参数,和人脑不同的是,婴儿最多只是遗传了父母的外表和性格等,但大模型的大脑遗传了知识,这只是初始状态,接下来会通过微调等各种方式,像小孩在成长过程中会有各种教育,整个大模型的演进更加拟人化。

这是整个人工智能的变化。

今天的AGI和之前有什么本质变化?2022年12月份之前,整个人工智能还是一种鉴别式人工智能,做判断题、专用系统和智能模块,做一些特定任务。一方面人工智能的表现并不是那么智能,常被别人诟病“你们提供的是人工智障”,以至于过去人工智能的能力天花板较低。

第二,在很多场景里,客户的需求是千差万别的,但人工智能的能力没那么强,很多公司和团队用各种定制去满足。人工智能企业并不像高科技公司,在过去十年里,只能做鉴别式AI是手工作坊的时代。但现在有了大模型,有更加强大的通用能力,人工智能开始进入工业化时代。

有了新的生成能力、涌现能力,用一个模型就能解决很多场景下的不同问题。今天这个时代,人工智能大模型就是发电机,在发动机没有发明之前,中东国家并没有那么富裕,石油的价值没那么大。就像今天可以把数据变成燃料和能力,用这个能力赋能千行百业。

云知声为什么能够在短时间推出自研大模型?

2016年看到AlphaGo,我们把医疗产品在医院里落地,帮助北京协和医院的医生,极大提高工作效率。在医院这个场景里,只是效率工具是不够的,人工智能真正的智能是认知智能,Transformer是2017年提出来的,认知智能的背后需要比较强大的算力。

有了这些铺垫,无论从学术还是工程化方面,积累了很多经验。这个经验对于个人来讲是你谋生的能力,但是对于公司来说是在市场上胜出的核心竞争力。把ChatGPT框架看了之后,发现没有一项是新的,都是一些已有的工程化组合,我们很快把这种能力结合,投入到大模型研发中。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

让机器拟人化,从“人工智障”到“人工智能”

我们在三天前,发布了商业大模型,名字叫山海。把预训练、指令微调、基于人反馈的增强学习全部跑通,看到了期待已久的涌现能力。那时候团队就在想是不是要给它起个名字,那段时间我在频繁出差,觉得名字还挺好的。海是波澜壮阔,有容乃大,体现出大模型的无限生成能力,山是高山仰止,我们知道什么能说、什么不能说,这恰恰是既要强调大模型的生成能力,又要强调大模型的安全合规问题。

有一个很有意思的现象,大家都在谈大模型,国内对大模型的关注是在春节后,但大家都不谈这个事,心里都没底。到今天为止,有一种观点这件事情只有技术还不能做,哪怕人都到位了,但训练成本很大,是极其烧钱的。大模型不是科学革命、不是发明了新的算法,是把已有的算法组合在一起做大,大都是有代价的,当然还有很多工程在里面。观点是对的。

反过来讲,如果认为未来10-20年大模型是很大的机会,BAT投不进去了,就放弃了,我认为还是有机会的。

云知声在过去的几年里,并不需要特别牛的科学家,我甚至认为这个事就不是科学家干的事情,科学家没有玩过那么多算力,也不知道场景在哪里,所以结果一定是不好的。有场景的厂商反而是最有可能成功的。

起山海这个名字,还有一个意思,所爱隔山海,山海皆可平。

山海之力是十项全能。生成能力是非常主观的,真正在场景落地的时候,语言理解能力很重要,为什么以前觉得是人工智障,因为缺乏理解和代码能力。代码能力的提升能够有助提升大模型的推理能力,输出结果一定要符合国内的法律法规甚至道德价值观等。我们还采用GPT-4 插件的架构,帮助企业和客户,从数据的优选、模型训练、模型部署等一条龙服务。

为什么大模型具备复杂的逻辑推理能力?我们今天做到了,但不知道为什么,到底是500亿参数还是1000亿参数更好,却不好说,可能1000亿参数里面神经元还没有被激活。

另外还有医疗,一开始我们在做大模型,很多人以为云知声做的是垂直行业模型,并不是,我们是做行业应用。挑战了一个最严肃的场景——医疗,通过预训练阶段,收集了很多医学的文献、专著、书籍,病案,积累了几千万真实标注的数据,这些数据可以转化成我们的微调数据。

另外在2019年还获得了北京市科技进步一等奖,获奖项目就是大规模知识图谱构建关键技术及应用,我们有国内最大规模之一的医疗知识图谱,我们把知识图谱分解成知识插件嵌入到大语言模型中,使得大模型变成医疗领域的专家。

MedQA是一个非常权威的医疗知识问答测试集,包括谷歌的Med-PaLM,ChatGPT和GPT-4都在这个测试集上公布了它们的评测结果,山海前不久的评测中做到了81分,大大超过了GPT-4的71分。通过领域增强以后,能够把大模型变成某个领域的专家。还有一个数字可以做横向对比,医学院毕业生要通过临床执业医师考试目前已知的AI最高分数是456分,山海大概考了511分,这就是大模型通过领域增强以后获得的超强能力。

想做大模型还是挺难的,门槛非常高,除了需要很多钱之外、优秀的算法工程师和算法之外,还需要很多能力,我们把它总结为山海之功。直观来讲,大模型本身就是大数据集,大模型是工程师的活儿,云知声为什么能够用几个月的时间就能做出一个非常权威的客观的评测数据,我们内部去评,不只在医疗,在通用领域方面,云知声都是最好之一。

算力平台不是买多少卡来插就行了,云知声差不多有200P算力,利用集群的效率达到业内最顶尖的水平,可以用相对比较少的卡,很快速地训练出我们的模型。

我们目前GPU集群的利用率能做到50%,大模型需要多卡,目前业内的水平大概是42%。大模型还要做到3D混合并行训练。什么是3D?就是模型的并行化、数据的并行化、流水线的并行化,要把任务分离到很多不同机器的不同卡里分别计算,最后能快速得到响应的结果。另外在模型推理里得到了很多优化,推理的速度提高了5倍,怎么样把训练卡和推理卡分开,训练卡是A800,推理卡是在一张单卡A6000上就可以实现快速推理。

另外数据很重要,数据规模、数据多样性、数据高质量,我们现在能做到支持10T级别的快速去重,ChatGPT的训练数去是45T,但是优选之后用了几百G的数据来训练。

有了这些能力之后,就能够基于Atlas和UniDataOps的能力,可以把山海的能力和行业客户更好地提供服务。

智慧物联也是公司的一块重要业务,我们有很多落地,过去用的效果确实不太好,希望有了山海之后,用大模型把已有的物联网的产品全部做一遍。

医疗是我们看好的方向。以前的医疗方向,产品主要有两个方面,一是不用手敲键盘,直接拿麦克风说话,极大提升了医生的工作效率,把病历输入时间从3个小时缩短到了1个小时;二是有了病历之后,还有一套系统,通过AI大脑审核病历,审核病历有没有错误,现在有了AI大模型能力之后能够做什么呢?

山海的愿景是通过人工智能打造互联、直观的世界,以前对人工智能的定义是让机器服从人,今天希望机器更加拟人。人和物的沟通交流会变的更加直观,新的能力会带来新的产品、新的商业模式,非常愿意和在座各位共同迎接大模型的新时代。

扫码加入黑马创业者交流群

↓↓↓

MusicLM
MusicLM

谷歌平台的AI作曲工具,用文字生成音乐

下载

扫描下方二维码

加入黑马AIGC产业营

读懂AIGC底层逻辑,一步接入产业未来

↓↓↓

分享、赞和在看,完成三连击,把好的内容传递给更多需要的人。

更多精彩内容,尽在i黑马视频号

↓↓↓

关注黑马传播矩阵,get更多精彩内容

↓↓ ↓

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

76

2026.03.13

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

117

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

350

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

63

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

109

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

108

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

243

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

684

2026.03.04

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

179

2026.03.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
光速学会docker容器
光速学会docker容器

共33课时 | 2.1万人学习

AI绘画教程
AI绘画教程

共2课时 | 0.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号