0

0

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

PHPz

PHPz

发布时间:2024-07-16 16:23:14

|

389人浏览过

|

来源于IT之家

转载

无需任何修改转换,amd 显卡也跑起原版 cuda 程序了!

英国一家初创公司,推出了针对 AMD 的 CUDA 程序编译工具,而且免费商用。

工具一经发布就引发了网友们的广泛热议,并登顶了 HackerNews 热榜。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

该工具名为 SCALE,开发者给它的定位是一个 GPGPU(通用 GPU)编程工具包。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

目前已有大模型框架 llama-cpp 等 9 个程序通过测试,实现了正常运行。

与其他实现方式不同,SCALE 直接模拟 CUDA 工具包的安装,不需要转换成其他语言就能源到源地完成编译。

因此,像内联 PTX 这种英伟达专用的中间语言,SCALE 同样能够提供支持。

无需转换,让 AMD 跑起 CUDA

官网介绍显示,SCALE 主要有三个组成部分 —— 兼容的 nvcc 编译器、CUDA 运行时和驱动 API 的 AMD 实现,以及 ROCm 库。

其中编译器可以把用包括 nvcc、内联 PTX 等在内的 CUDA 专属语言编写的程序,直接编译成可在 AMD GPU 上运行的二进制代码。

ROCm 库则用来提供“CUDA-X”API,SCALE 在处理 cuBLAS 和 cuSOLVER 等库时均采用这种方式。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

SCALE 的关键创新点在于按原样接受 CUDA 程序,而不必将它们移植到另一种语言,兼容 nvcc 和 clang 等多种编译方式,同时现有的构建工具和脚本(如 cmake)可以正常工作。

按照官方的说法,SCALE 实现了对 CUDA 的完全兼容,让开发者无需针对不同 GPU 平台分别编写代码。

这一点与 AMD 推出的 HIP 存在很大不同,因为 HIP 是通过一定方式对 CUDA 代码进行重写,遇到复杂的宏可能无法正确理解,也不支持内联 PTX 等专属语言。

甚至 SCALE 作者认为,HIP 并不能解决 CUDA 兼容性问题。

另外,SCALE 的语言是 CUDA 的超集,提供一些可选的语言扩展,可以使希望摆脱 nvcc 的开发者更轻松、更高效地编写 GPU 代码。

作者表示,希望未来开发者可以只编写一次代码,就能不同硬件平台上运行,并正在着手通过弥合流行的 CUDA 编程语言和其他硬件供应商之间的兼容性差距。

目前,SCALE 对 AMD 各系列 GPU 的支持情况如下:

已支持:gfx1030(RX6000 系列)和 gfx1100(RX7000 系列)

“似乎有效”(seem to work):gfx1010(RX5000 系列)和 gfx1101

正在适配:gfx900(RX Vega 系列)

另外,作者测试了一些 CUDA 开源项目,并利用 SCALE 成功运行了 9 款 CUDA 应用。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

不过,SCALE 毕竟是个全新的项目,所以作者也准备了从安装到编译的一系列教程,给出了不同类型的示例程序。

教程关键步骤都附有相关代码,甚至包括了如何判断自己 GPU 的型号,可以说是非常细致了。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

如果使用过程中遇到问题,作者也介绍了常见故障的排除方式,同时还开通了 Discord 论坛,可与开发团队直接沟通交流。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

Voicenotes
Voicenotes

Voicenotes是一款简单直观的多功能AI语音笔记工具

下载

打造出 SCALE 的这家初创公司名为 Spectral Compute,2018 年成立于英国,自称对 CPU 和 GPU 的架构有深入的了解,目标是帮助开发者高效利用算力资源。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

网友:挑战英伟达护城河?

有网友认为,如果 SCALE 真能有(宣传中的)效果,那么将对英伟达护城河发起挑战,让 AMD 与之展开直接竞争。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

不过,现在下定论未免为时过早,毕竟 SCALE 官方也承认目前和原版 CUDA 相比还存在一些缺陷。

而且开发者也明确表示有一些 CUDA API 和功能并不被支持,但也没有给出具体的列表。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

关于“AMD 方案”的更多不足,一名自称和 SCALE 团队交流过的网友表示,目前的 SCALE 还无法操作 TensorCore,也就意味着 AMD 上跑不了 FlashAttention 加速框架。

另外由于 N 卡上有强大的矩阵乘法单元,所以即使能编译运行,AMD 卡上的性能可能也不及 N 卡。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

更有网友认为,英伟达一家独大的原因是 AMD 不愿意投资让其 GPU 拥有更高的机器学习性能(而不只是拥有 CUDA 这一个优势)。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

即便能够高效运行,AMD 卡是否真的经济实惠且容易获得,同样是一个问题。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

还有一波网友的观点是,最大的问题不是技术上能不能运行,而是背后的法律问题。

这个问题同样引发了广泛的讨论,不过目前也暂未有定论。

有人认为 SCALE 像 ZLUDA(另一种在 AMD 上运行 CUDA 程序的方式)一样存在法律疑点,有可能招致英伟达的诉讼。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

具体来说,根据英伟达的 EULA 条款,CUDA SDK 只允许开发在 N 卡上运行的应用程序,这可能禁止了类似 SCALE 这样的兼容实现。

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

但立马就又有网友说,SCALE 并没有用到英伟达的“SDK”,何谈 SDK 使用协议呢?

初创公司硬刚英伟达:在 AMD 卡上模拟 CUDA,原版程序直接编译运行

总之,无论是技术不足还是法律问题,对于这个新工具的讨论都还在持续进行。

至于到底好不好用,这就要由开发者用脚投票了。

参考链接:

[1]https://docs.scale-lang.com/

[2]https://news.ycombinator.com/item?id=40970560

本文来自微信公众号:量子位(ID:QbitAI),作者:克雷西

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2079

2024.08.16

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

177

2026.01.28

包子漫画在线官方入口大全
包子漫画在线官方入口大全

本合集汇总了包子漫画2026最新官方在线观看入口,涵盖备用域名、正版无广告链接及多端适配地址,助你畅享12700+高清漫画资源。阅读专题下面的文章了解更多详细内容。

35

2026.01.28

ao3中文版官网地址大全
ao3中文版官网地址大全

AO3最新中文版官网入口合集,汇总2026年主站及国内优化镜像链接,支持简体中文界面、无广告阅读与多设备同步。阅读专题下面的文章了解更多详细内容。

79

2026.01.28

php怎么写接口教程
php怎么写接口教程

本合集涵盖PHP接口开发基础、RESTful API设计、数据交互与安全处理等实用教程,助你快速掌握PHP接口编写技巧。阅读专题下面的文章了解更多详细内容。

2

2026.01.28

php中文乱码如何解决
php中文乱码如何解决

本文整理了php中文乱码如何解决及解决方法,阅读节专题下面的文章了解更多详细内容。

4

2026.01.28

Java 消息队列与异步架构实战
Java 消息队列与异步架构实战

本专题系统讲解 Java 在消息队列与异步系统架构中的核心应用,涵盖消息队列基本原理、Kafka 与 RabbitMQ 的使用场景对比、生产者与消费者模型、消息可靠性与顺序性保障、重复消费与幂等处理,以及在高并发系统中的异步解耦设计。通过实战案例,帮助学习者掌握 使用 Java 构建高吞吐、高可靠异步消息系统的完整思路。

8

2026.01.28

Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

24

2026.01.27

拼多多赚钱的5种方法 拼多多赚钱的5种方法
拼多多赚钱的5种方法 拼多多赚钱的5种方法

在拼多多上赚钱主要可以通过无货源模式一件代发、精细化运营特色店铺、参与官方高流量活动、利用拼团机制社交裂变,以及成为多多进宝推广员这5种方法实现。核心策略在于通过低成本、高效率的供应链管理与营销,利用平台社交电商红利实现盈利。

122

2026.01.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
正则表达式手册
正则表达式手册

共7课时 | 6.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号