0

0

特稿|AI大模型热潮下算力需求爆发:临港欲建百亿产业,商汤当“链主”

WBOY

WBOY

发布时间:2023-06-04 12:07:46

|

1566人浏览过

|

来源于搜狐

转载

商汤科技于2022年1月24日在上海自贸区临港新片区启动了人工智能计算中心aidc的运营。当时这家人工智能公司未必能精准预测,2022年即成为了所谓的aigc(ai generated content)元年。

“今天,我们的临港AIDC已经有接近3万块的GPU(图形处理器),我们目前的算力已经达到5000 PetaFLOPS(1 PetaFLOPS等于每秒1千万亿次浮点运算),在这之上我们相信未来可以有更好的开发者效率,并且都能够支持更多千亿规模的大模型算力训练。”在6月2日的“AI引领时代,算力驱动未来”——临港新片区智算大会上,商汤科技董事长兼CEO 徐立如是表示。

商汤方面告诉澎湃新闻(www.thepaper.cn)记者,仍有许多需求排成长队等待处理。而在商汤科技联合创始人、大装置事业群总裁杨帆看来,人工智能对于更大数据、更大规模、更大算力的追求并不是“始于今天”,“整个人工智能技术迭代、进步的历史,我们可以把它看成是一个对于‘暴力美学’的追求,以及算法、算力、数据三要素由量变产生质变的一个技术迭代的过程。”

聚焦前沿产业的临港新片区对这种新的热潮迅速做出了响应。6月2日当天,临港新片区党工委副书记吴晓华在上述大会上发布了《临港新片区加快构建算力产业生态行动方案》。该《方案》的蓝图之下,至2025年,临港将成为具有全国影响力的算力产业集聚区,含相关硬件、软件、应用、服务等的算力产业总体规模将突破100亿元。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

特稿|AI大模型热潮下算力需求爆发:临港欲建百亿产业,商汤当“链主”

临港新片区党工委副书记吴晓华发布《临港新片区加快构建算力产业生态行动方案》。

“我们看到AI大爆发的时代已经来临了,AI进入到我们生产和生活的各个领域,那么随着 AI应用的大爆发,它其实也驱动了算力需求的大爆发。”对于上述《方案》的出台,临港新片区管委会高科处处长陆瑜对澎湃新闻(www.thepaper.cn)在内的媒体表示,临港前期已具备了很好的优势,“就是我们的算力资源非常丰富。”

更为重要的是,在人工智能公司选择是否落地临港时,算力资源已经成为尤为重要的决策因素。

算力是新时代的能源,而成功又不仅仅在于“暴力美学”

何谓算力?徐立认为,算力其实是整个模型能力的表达,“算力等于算法或者说大模型的参数,去乘上它所处理的数据量。大模型时代参数越大,乘上的数据量越大,所需要的算力就越大。”算力已然成为新时代的能源,“某种程度上,算力决定了市场的竞争力。”

杨帆也谈到,从去年到今年整个人工智能领域非常火的一个概念叫内容生成,同时大家都熟悉了一个名词即大模型。简单来看,这是一种“暴力美学”,例如,GPT-3模型使用了超过1750亿个参数,需要高性能的处理器来支持训练,使用V100训练耗卡量为10000张卡训练14.8天,整体算力需求约625 PetaFLOPS。

杨帆认为,这种“暴力美学”也可以理解为量变产生质变,“其实人工智能从它诞生的第一天起到今天,一直都在追求通过规模化带来更强的智能化。”他提到,实际上就人工智能领域来说,在过去的5-6年时间里,业内最顶级的人工智能模型对算力的消耗量,“每4-6个月就要翻一番,也就是说过去的这几年时间里翻了近30万倍。”

当然,“暴力”和“智能”并不是完全成正比,“拥有更大的资源、更大的规模,它仅仅是一个必要而非充分的条件。”杨帆强调,真正在“暴力美学”背后支撑产生重大的技术创新和成果的,恰恰又是在于对每一个环节的持续性的优化和改进。

以数据为例,“GPT-4所用的数据其实只是OpenAI收集到的所有数据的1%,因为他发现当把更多的数据去灌给机器人的时候,有可能反而不那么聪明,应该把更加有效、更加高价值的数据提供给这个算法,然后才能去创造出一个更加聪明的大脑。”

其认为,至少在今天,数据的有效性远比数据的总量更加重要。而如何定义有效的数据,“这其实就需要数据科学家大量的努力,OpenAI其实让他们最优秀的科学家去做数据了,并非大家觉得的去搞算法了。”

这种每个环节的优化同样包括算力,在英伟达缺货的情况下,为什么没人在用国产芯片做商业化的大规模训练?为什么最新这波浪潮到来后,第一时间钱都被英伟达挣走了?这些问句背后的解释是,“并不是我们把算力量堆到一个数值就能够产生最终的价值,1000张卡100台服务器放在一起跑同一个任务,这中间还需要大量的配套软件、通信网络,它是一系列软硬件联合调优的过程,这样的工作积累我们过去没有做,我们今天就需要去补课。”

特稿|AI大模型热潮下算力需求爆发:临港欲建百亿产业,商汤当“链主”

顺势而为,临港加快形成多元算力供给体系

据吴晓华介绍,临港新片区算力产业已在上游软硬件、中游的数据中心、调度平台,下游应用进行了相应布局,目前临港总算力超过3EFLOPS(FP32,1 EFLOPS等于每秒1百亿亿次浮点运算),其中智能算力占比近80%,总算力规模约占上海市近20%。

前述《方案》提出,目标到2025年,新片区将形成以智算算力为主、基础算力和超算算力协同的多元算力供给体系,总算力超过5EFLOPS(FP32),AI算力占比达到80%,算力产业总体规模(含相关硬件、软件、应用、服务等)突破100亿元,建成公共算力服务平台,规范算力交易机制,实现区域算力调度,打造具有全国影响力的算力产业集聚区,建设一批算力示范应用标杆场景。

“智能算力也就是当下最为火热的AI企业所需要的,我们也发现,AI企业落地到临港来,他们不再是仅仅关注给他他多少政策支持,给他多少补贴,他会关注落地在这边,能不能解决他的算力需求,因为现在市场上算力是非常紧缺的。”陆瑜提到了这一显著变化。

商汤方面说,截至今年5月,商汤大装置已为40多个核心客户提供过服务。“特别是在大模型的浪潮之下,我们现在支撑了10家以上的单位机构在临港的智能计算中心中去训练他们的大模型。”杨帆也提及。

特稿|AI大模型热潮下算力需求爆发:临港欲建百亿产业,商汤当“链主”

Magician
Magician

Figma插件,AI生成图标、图片和UX文案

下载

成立于2018年的深势科技是算力需求方之一。该公司核心团队由中国科学院院士鄂维南等人领衔,是“AI+Science”科学研究范式的先行者,其首创的“多尺度建模+机器学习+高性能计算”范式,突破性地实现了多尺度分子模拟中精度与效率的统一。

据澎湃新闻(www.thepaper.cn)记者此前报道,深势科技已推出Lebesgue科学计算平台、Hermite药物设计平台以及Bohrium微观计算与设计平台等。例如在医药领域,深势科技与多家客户携手,将物理建模+AI的计算范式与临床前药物研发更广泛的结合,通过Hermite Uni-FEP、Uni-Fold、RiD等模块,将自由能微扰理论、分子动力学、增强采样算法与高性能计算相结合,精准预测蛋白质结构及构象变化,并以化学精度高效评估蛋白与配体的结合自由能,为药物研发人员提供高效精准的理论指导,提升药物设计与优化效率。

去年12月29日,总部位于北京的深势科技在临港注册成立了深度势能生物科技(上海)有限公司。深势科技政企事务副总裁刘会师在接受澎湃新闻(www.thepaper.cn)记者采访时表示,公司在临港布局新一代分子模拟算法研发中心和AI辅助药物设计业务中心,主要也是因为看到临港正在大力发展算力,“我们在训练模型过程中,对算力是有需求的,另外临港尤其是要大力发展国产化算力,我们也想为这方面添砖加瓦。”

我们主要在临港进行药物研发业务的布局,包括自有药品管线的研发工作。”刘会师提到,深势科技的业务和临港甚至上海的人工智能、生物医药这样的先导产业有正相关的直接合作关系,“我们愿意把我们的研发以及产品纳入到临港的大的生态圈里来。”

上述《方案》同时提及,临港新片区也制定了一系列保障措施,包括加强人才保障、完善支持政策、推动开放合作等。据陆瑜介绍,如果AI企业到临港来,将优先提供临港的智能算力,同时通过发放算力券等形式,让企业优惠使用算力,“甚至对重点的AI企业,政府对它的算力成本直接可以给予不超过30%的补贴,这些政策我们都会出来。”

在这次大会上,中国电信临港公共智算服务平台和国产GPU联合创新基地也正式推出,值得注意。中国电信成立临港算力(上海)科技有限公司,将开展临港算力园区建设,并将分批次投放4万个适用于智算、超算的高功率机架。

上海市经济和信息化委员会副主任汤文侃当天表示,当前,以“网络为基础、数据为核心、算力为关键、安全为底线”的新一代信息基础设施已成为建设现代化产业的重要基础支撑。上海已提出构建“2+(3+6)+(4+5)”的现代化产业架构,这对以算力为代表的新型信息基础设施建设提出了更高需求。

而就在5月16日,上海市经济和信息化委员会公布了通过 《上海市数据中心建设导则》符合性评估的数据中心项目名单,共支持了16个项目,其中位于临港的项目有2个。“截至目前,我委共支持新片区包括,商汤AIDC、有孚网络、信息飞鱼等8个项目,合计2.8万个6kW标准机柜,占全市已批机柜数量近1/5。”

汤文侃建议充分利用临港的算力资源,建立公共算力服务。“目前,临港的商汤AIDC已经接入了公共算力服务平台。在此也希望今天参会的各单位,特别是电信运营商,结合临港的网络特点,积极在临港建设极速算力承载网,助力实现网络无所不达、算力无所不在、智能无所不及,推动算力成为与水电一样的公共服务。”

成立智算产业联盟,商汤当产业链链主

临港的目标是创建一个上中下游一体化的算力产业联盟,该联盟能够以协同式、体系化的方式满足当前和未来的需求,利用现有优势实现发展。

陆瑜将临港的算力供给视作整条产业链的“中间一段”,一端为落地到临港的AI企业提供算力保障,另一端则涉及到对算力来说极为关键的“芯片、软件、系统”,“我们希望有了需求端,也有了这样一个平台端,那么我们把计算的芯片企业、软件企业、系统企业集聚在这里,让他们深度地参与到这样一个系统的建设过程当中。”

杨帆也强调,“今天看到的大模型所有的成绩的发展,它既是暴力出奇迹,通过人工智能三要素的持续规模上升带来的技术价值的提升,同时也是基础的研发能力和系统的工程化能力之间的深度结合,算法优化、数据的整理和选取、平台性算力的优化提供,这三者往往是互相连通的,很难把它变成割裂的环节独自去做。”

他表示,智能算力产业链的重要价值在于,“只有链上有更多的企业,大家去促进彼此的交流思考,更深度地去进行一些合作,才能够在这样新的关键性的重大技术浪潮中,去做到更好的技术进步和支持。”

特稿|AI大模型热潮下算力需求爆发:临港欲建百亿产业,商汤当“链主”

在大会现场,新片区智算产业联盟正式成立,并任命联通为联盟首任轮值理事长单位。据悉,未来联通将在新片区成立长三角创新研究院,进一步助力新片区智算产业发展。

新片区智算产业联盟成员代表由智算算力、基础算力和超算算力中心等算力提供企业,GPU、FPGA、ASIC等算力芯片企业,以及大模型、AI for science等算力需求企业,共计25家企业,以及中国信通院华东分院、西安电子科技大学、电子科技大学共计3所高校与科研院所共同组成,后续将开展资源共享、技术交流和项目合作。商汤科技则被授予“新片区智算产业链链主”。

GPU芯片厂商沐曦当天即表示,分别满足AI推理计算、AI训练/通用计算、高性能渲染功能的三类GPU产品,应用于AI推理、AI训练、数据中心、元宇宙、云游戏等领域,将赋能各领域转型发展。

汤文侃也对临港新片区此次智算产业联盟的成立寄予厚望,“依托商汤科技这样的链主企业,结合自身优势,探索产业链上下游全要素协同,形成数字经济新的爆发点。”

特稿|AI大模型热潮下算力需求爆发:临港欲建百亿产业,商汤当“链主”

12家企业在当天的大会上共同签署了新片区智能计算产业上下游企业协同采购协议。陆瑜提到,新片区也将出台协同采购正面清单,“如果企业在建设国产化算力平台的过程当中,购买国产GPU等上游产品,我们就会给予补贴,这样也是鼓励上下游企业去更好地合作。”

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

387

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

571

2023.08.10

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

400

2023.08.14

人工智能在生活中的应用
人工智能在生活中的应用

人工智能在生活中的应用有语音助手、无人驾驶、金融服务、医疗诊断、智能家居、智能推荐、自然语言处理和游戏设计等。本专题为大家提供人工智能相关的文章、下载、课程内容,供大家免费下载体验。

408

2023.08.17

人工智能的基本概念是什么
人工智能的基本概念是什么

人工智能的英文缩写为AI,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

300

2024.01.09

人工智能不能取代人类的原因是什么
人工智能不能取代人类的原因是什么

人工智能不能取代人类的原因包括情感与意识、创造力与想象力、伦理与道德、社会交往与沟通能力、灵活性与适应性、持续学习和自我提升等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

628

2024.09.10

Python 人工智能
Python 人工智能

本专题聚焦 Python 在人工智能与机器学习领域的核心应用,系统讲解数据预处理、特征工程、监督与无监督学习、模型训练与评估、超参数调优等关键知识。通过实战案例(如房价预测、图像分类、文本情感分析),帮助学习者全面掌握 Python 机器学习模型的构建与实战能力。

33

2025.10.21

aigc查重率多少合格
aigc查重率多少合格

AIGC 查重率合格标准不统一,因场景而异。学术领域要求严格,多在 10% - 20% 以下;商业写作、新闻报道稍宽松,在 20% - 30% 左右;自媒体要求差异大,个人账号或达 30% - 40%,专业平台则严控在 20% - 30% 。想了解更多相关内容,请阅读专题下面的文章。

602

2025.04.09

Java 桌面应用开发(JavaFX 实战)
Java 桌面应用开发(JavaFX 实战)

本专题系统讲解 Java 在桌面应用开发领域的实战应用,重点围绕 JavaFX 框架,涵盖界面布局、控件使用、事件处理、FXML、样式美化(CSS)、多线程与UI响应优化,以及桌面应用的打包与发布。通过完整示例项目,帮助学习者掌握 使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

36

2026.01.14

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
【web前端】Node.js快速入门
【web前端】Node.js快速入门

共16课时 | 2万人学习

手把手实现数据传输编码
手把手实现数据传输编码

共1课时 | 725人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号