0

0

CPU被「卡脖子」,中国企业纷纷换赛道:国产GPU这条路能走通吗?

PHPz

PHPz

发布时间:2023-04-11 20:37:13

|

1578人浏览过

|

来源于51CTO.COM

转载

根据技术市场研究机构Jon Peddie Research的一份新报告,中国的GPU初创企业数量非同寻常,因为该国试图获得人工智能的优势以及半导体主权。

随着人工智能(AI)、高性能计算(HPC)和图形处理的需求以前所未有的速度增长,近年来全球GPU制造商的数量也在增长。谈到个人电脑的独立显卡,AMD和Nvidia保持领先,而英特尔正在努力追赶。

在上世纪八九十年代,全球一度有多达数十家公司在开发了显卡和独立图形处理器,但为了在3D游戏中获得最高性能而进行的残酷竞争,其中绝大多数公司被淘汰。

到大约2010年时,只有AMD和Nvidia能够为游戏和计算提供有竞争力的独立GPU,而其他公司则专注于集成GPU或GPU IP。

从2015年左右开始,中国的PC GPU开发商数量开始迅速增加,这得益于中国对技术自给自足的推动,以及AI和高性能计算作为高科技大趋势的出现。

根据Jon Peddie Research的数据,目前总共有18家公司在开发和生产GPU。有两家公司主要针对智能手机和笔记本电脑开发SoC绑定的GPU,有6家开发GPU IP,有11家GPU开发商专注于PC和数据中心的GPU,包括AMD、英特尔和英伟达。

事实上,如果在名单中加入其他中国公司,如壁仞科技和天枢智信,那么GPU企业数量将更多。不过,壁仞科技和天枢智信目前只专注于AI和高性能计算,所以JPR不认为他们是传统意义上的GPU开发商。

中国的技术救国之路:GPU开发

作为世界第二大经济体,中国不可避免地与美国和其他发达的国家在几乎所有方面进行竞争。中国竭尽所能地吸引世界各地的工程师。

事实上,在中国,每年都有数百家新的IC设计公司成立。他们开发的产品种类繁多,从微小的传感器到复杂的通信芯片均由涉猎,力图实现对西方国家供应商的自给自足。

但要真正跳上人工智能和高性能计算的浪潮,需要CPU、GPU和特殊用途的计算加速技术。

谈到CPU,中国面临美国在制造设备和技术上的越来越严密的技术封锁,不可能很快赶上全球先进水平。然而在另一个赛道上,可以说,开发和生产一款像样的GPU,比试图造出一款有竞争力的CPU更容易出成果。

「对于中国公司来说,人工智能训练是自主研发GPU的主要驱动力,一方面是因为英伟达的GPU太贵了,另外也是出于对自给自足的渴望。」JPR的负责人Jon Peddie说。

GPU本质上是并行设备,其内部有大量的计算单元可以用于冗余,这使得GPU更容易启动和运行,单位晶体管的成本相对较低,整体产量也不错。此外,GPU的并行性质使其更容易以扩展的方式实现部署。

与CPU相比,GPU在设计和制造上对制程工艺的要求没有那么苛刻,即使目前中国最先进的芯片制造商中芯国际并没有像台积电那样先进的生产工艺,仍然可以利用GPU性能扩展的方式实现足够可观的性能。

事实上,即使中国的GPU开发商失去了使用台积电先进节点(N7及以下)的机会,至少他们中的一些人仍然可以在中芯国际生产更简单的GPU设计,并满足AI、HPC和部分游戏/娱乐市场的需求。

而且,从国家的角度来看,具有AI和HPC能力的GPU可能也可以说比CPU更重要,因为AI和HPC可以实现全新的应用,如自动驾驶汽车和智能城市等应用。

尽管美国政府大力限制向中国出口以超级计算机为基础的CPU和GPU,但比起CPU,GPU在设计和制造上的相对较低的门槛,使得这种限制的效果远没有CPU来的明显 。

GPU微架构相对容易,硬件设计却很昂贵

不过,应该注意的是,虽然目前有很多GPU开发商,但只有两家能真正为PC打造有竞争力的独立GPU。这也许是因为,开发一个GPU架构相对容易,但要正确实现它并设计适当的驱动程序确实很难。

CPU和GPU微架构基本上是「科学和艺术的交汇」。这些架构是一组复杂的算法,开发这些架构的团队规模可能相当小,但可能需要长达几年的时间。

可以这么理解,微架构是在餐巾纸和白板上完成的。至于成本,如果只是架构师自己,团队规模可以只有一个人,也许是三四个人。但是任何类型的建筑,建筑、火箭飞船、网络或处理器都是一个复杂的棋局。

比如,试图预测五年后的制造工艺和标准,性价比的权衡,增加什么功能,放弃或忽略什么功能,这些都是非常棘手和耗时的工作。

架构师们花了很多时间在头脑中进行假设,比如如果把缓存做大25%,如果有6000个FPU,是否应该做一个PCIe 5.0 I/O总线?这么做能不能按时完成?诸如此类。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

图片

由于微架构的开发可能需要数年时间,而且需要有才华的设计师,在这个上市时间至关重要的世界里,许多公司就干脆从Arm或Imagination Technologies等公司授权使用现成的微架构,或者是是经过验证的GPU IP。

例如,中国的芯动科技(Innosilicon)就从英国的Imagination公司授权GPU微架构IP用于其Fantasy GPU。

还有一家中国的GPU开发商,使用了Imagination的PowerVR架构。同时,另一家GPU制造商兆芯(Zhaoxin)使用的是Via Technologies获得的GPU微架构。

开发一个微架构的成本可能有所不同,但与现代高端GPU的物理实现成本相比,它的开发成本相对较低。

多年来,苹果和英特尔这两家拥有大量工程人才的公司都依赖Img进行GPU设计。联发科和其他小型SoC供应商依靠Arm。高通公司在很长一段时间内使用ATI/AMD,而三星在尝试设计自己的图形引擎数年后,也转向了AMD。

最近,两家新的中国GPU公司聘请了前AMD和英伟达的架构师,另外两家使用Img。进入市场的时间和学习作为一个架构师的技能,要担心什么,以及如何找到解决方法,是一个非常耗时的过程。

「如果你能去找一家已经有了设计方案,并且已经设计了很长时间的公司,可以节省大量的时间和金钱,而在市场上,时间就是一切。」

「这个过程中会有太多的问题。并非每一个由AMD或英伟达设计的GPU都能成为赢家。不过,一套好的架构设计可以经历几代的调整,慢慢进步。」研究机构Jon Peddie Research的负责人表示。

对于新的生产制程来说,硬件实现和软件开发的成本太高了。据《国际商业时报》估计,使用5nm级技术制造的设备,其设计成本超过5.4亿美元。如果制程为3nm,设计成本还将增加3倍。

「如果将布局和平面图、模拟、验证和驱动程序全部考虑在内,GPU开发的成本和时间就会激增。」Peddie解释说。

「硬件设计和布局是非常直接的:如果弄错一条线,可能要花几个月的时间来查错。」

目前,世界上只有少数几家公司能够开发出具有AMD和英伟达级别的现代游戏或计算用GPU(460亿-800亿个晶体管规模)芯片。

不过,前不久中国的壁仞科技发布的BR104和BR100也达到了几乎类似的水平。(据猜测,BR104包含大约385亿个晶体管)。

目前,全球11个PC/数据中心GPU设计供应商中的8个来自中国,这本身就说明了问题。

也许在不久的将来,除了美国公司,我们不会看到有竞争力的独立游戏GPU。中国是否能推出有竞争力的竞争对手,目前还有待观察。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
TypeScript类型系统进阶与大型前端项目实践
TypeScript类型系统进阶与大型前端项目实践

本专题围绕 TypeScript 在大型前端项目中的应用展开,深入讲解类型系统设计与工程化开发方法。内容包括泛型与高级类型、类型推断机制、声明文件编写、模块化结构设计以及代码规范管理。通过真实项目案例分析,帮助开发者构建类型安全、结构清晰、易维护的前端工程体系,提高团队协作效率与代码质量。

49

2026.03.13

Python异步编程与Asyncio高并发应用实践
Python异步编程与Asyncio高并发应用实践

本专题围绕 Python 异步编程模型展开,深入讲解 Asyncio 框架的核心原理与应用实践。内容包括事件循环机制、协程任务调度、异步 IO 处理以及并发任务管理策略。通过构建高并发网络请求与异步数据处理案例,帮助开发者掌握 Python 在高并发场景中的高效开发方法,并提升系统资源利用率与整体运行性能。

89

2026.03.12

C# ASP.NET Core微服务架构与API网关实践
C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开,系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例,帮助开发者掌握构建高可用微服务系统的关键技术,提高系统的可扩展性与维护效率。

276

2026.03.11

Go高并发任务调度与Goroutine池化实践
Go高并发任务调度与Goroutine池化实践

本专题围绕 Go 语言在高并发任务处理场景中的实践展开,系统讲解 Goroutine 调度模型、Channel 通信机制以及并发控制策略。内容包括任务队列设计、Goroutine 池化管理、资源限制控制以及并发任务的性能优化方法。通过实际案例演示,帮助开发者构建稳定高效的 Go 并发任务处理系统,提高系统在高负载环境下的处理能力与稳定性。

59

2026.03.10

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

99

2026.03.09

JavaScript浏览器渲染机制与前端性能优化实践
JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开,系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理,以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例,帮助开发者理解浏览器底层工作原理,并掌握提升网页加载速度与交互体验的实用技巧。

105

2026.03.06

Rust内存安全机制与所有权模型深度实践
Rust内存安全机制与所有权模型深度实践

本专题围绕 Rust 语言核心特性展开,深入讲解所有权机制、借用规则、生命周期管理以及智能指针等关键概念。通过系统级开发案例,分析内存安全保障原理与零成本抽象优势,并结合并发场景讲解 Send 与 Sync 特性实现机制。帮助开发者真正理解 Rust 的设计哲学,掌握在高性能与安全性并重场景中的工程实践能力。

230

2026.03.05

PHP高性能API设计与Laravel服务架构实践
PHP高性能API设计与Laravel服务架构实践

本专题围绕 PHP 在现代 Web 后端开发中的高性能实践展开,重点讲解基于 Laravel 框架构建可扩展 API 服务的核心方法。内容涵盖路由与中间件机制、服务容器与依赖注入、接口版本管理、缓存策略设计以及队列异步处理方案。同时结合高并发场景,深入分析性能瓶颈定位与优化思路,帮助开发者构建稳定、高效、易维护的 PHP 后端服务体系。

619

2026.03.04

AI安装教程大全
AI安装教程大全

2026最全AI工具安装教程专题:包含各版本AI绘图、AI视频、智能办公软件的本地化部署手册。全篇零基础友好,附带最新模型下载地址、一键安装脚本及常见报错修复方案。每日更新,收藏这一篇就够了,让AI安装不再报错!

173

2026.03.04

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号