全新大模型开源，腾讯（int4能打DeepSeek） Vs 谷歌（2GB运行多模态）

雪夜

发布时间：2025-08-03 13:18:02

561人浏览过

来源于php中文网

原创

全新大模型开源，腾讯（int4能打deepseek） vs 谷歌（2gb运行多模态）图片大家好，我是专注 ai 学习的老章

最近除了阿里 Qwen3 模型上线了图像生成与处理新功能，大家纷纷尝试吉卜力风格创作外，

还有几款新发布的开源大模型值得关注：

一是腾讯推出了 80B 规模的混元 A13B 模型，最大亮点是实现了近乎无损精度的 int4 量化，性能强劲
二是谷歌发布了轻量级多模态模型 Gemma 3n，主打可在手机端运行，最低仅需 2GB 内存
三是我发现了一个小众但实用的超长上下文模型 Jan-nano-128k，仅 2.5GB 的 Q4_K_M 版本就支持 128K 上下文长度

腾讯混元 A13B

官方技术报告已经写得非常详尽，有兴趣的朋友可以深入阅读[1]

试用地址：

https://hunyuan.tencent.com/?model=hunyuan-a13b

全新大模型开源，腾讯（int4能打DeepSeek） Vs 谷歌（2GB运行多模态）图片核心优势一览

小模型，大能力：仅激活 130 亿参数（总参数达 800 亿），在多项基准测试中表现媲美更大规模模型
双模式推理：支持“快思考”与“慢思考”两种模式。默认为慢思考输出，若需快速响应，可在输入前加

/no_think

超长文本理解：原生支持 256K 上下文窗口，在处理长文档任务时性能稳定
强化 Agent 能力：在 BFCL-v3、τ-Bench、C3-Bench 等智能体评测中表现领先
高效推理机制：采用分组查询注意力（GQA），支持多种量化格式，显著提升推理效率

我参考的是魔搭社区上的中文解读版技术博客[2]，总结出几个关键点：

腾讯同步开源了两个重要数据集：ArtifactsBench 用于弥补代码评估中的视觉与交互差距[3]，而 C3-Bench 是专为智能体设计的评测集，帮助揭示模型短板并推动可解释性研究[4]
A13B 在数学、科学推理及 Agent 场景下，可与 OpenAI-o1-1217、DeepSeek R1、Qwen3-A22B 正面较量

Agent

全新大模型开源，腾讯（int4能打DeepSeek） Vs 谷歌（2GB运行多模态）图片3. Hunyuan-A13B-Instruct-GPTQ-Int4 量化版本几乎与原版无差，堪称精度无损！

Bench	Hunyuan-A13B-Instruct	Hunyuan-A13B-Instruct-GPTQ-Int4
OlympiadBench	82.7	84.0
AIME 2024	87.3	86.7
Gsm8k	94.39	94.24
BBH	89.1	87.91
DROP	91.1	91.05

这意味着本地部署时，完全可以使用 int4 版本

钛投标

钛投标 | 全年免费 | 不限字数 | AI标书智写工具

下载

完整模型约 160GB，int4 版本仅约 44GB，估计 4 张 4090 显卡即可流畅运行

全新大模型开源，腾讯（int4能打DeepSeek） Vs 谷歌（2GB运行多模态） https://www.php.cn/link/8993c6e2d67634d2e190e80b3cc600f2

int4 版本部署命令如下：

# 下载模型：# ModelScope: modelscope download --model Tencent-Hunyuan/Hunyuan-A13B-Instruct-GPTQ-Int4# 拉取国内镜像：docker pull docker.cnb.cool/tencent/hunyuan/hunyuan-a13b:hunyuan-moe-A13B-vllm # 使用ModelScope下载的模型启动服务docker run  --privileged --user root  --net=host --ipc=host \        -v ~/.cache/modelscope:/root/.cache/modelscope \        --gpus=all -it --entrypoint python   docker.cnb.cool/tencent/hunyuan/hunyuan-a13b:hunyuan-moe-A13B-vllm \         -m vllm.entrypoints.openai.api_server --host 0.0.0.0 --tensor-parallel-size 4 \         --port 8000 --model /root/.cache/modelscope/hub/models/Tencent-Hunyuan/Hunyuan-A13B-Instruct-GPTQ-Int4/ --trust_remote_code

相比 DeepSeek-R1 较高的运行成本，这款 44GB 的 Hunyuan-A13B-Instruct-GPTQ-Int4 在数学、推理和 Agent 表现上值得进一步实测验证。

谷歌 Gemma 3n

谷歌 Gemma 家族再添新成员——面向端侧部署的轻量多模态模型 Gemma 3n

原生多模态支持：Gemma 3n 支持图像、音频、视频和文本输入，输出为文本结果
专为端侧优化：以高效运行为目标，提供 E2B 和 E4B 两种有效参数规模版本。虽然原始参数为 50 亿和 80 亿，但通过架构创新，实际内存占用相当于传统 20 亿和 40 亿参数模型，最低仅需 2GB（E2B）或 3GB（E4B）即可运行
架构创新亮点：包括 MatFormer 架构（增强计算灵活性）、逐层嵌入 PLE（提升内存效率）、LAuReL 与 AltUp（优化结构效率），以及专为移动端优化的新型音频编码器和基于 MobileNet-v5 的视觉编码器
综合性能出色：在多语言支持（覆盖 140 种文本语言和 35 种多模态语言理解）、数学、代码生成和逻辑推理方面均有显著提升。E4B 版本在 LMArena 基准测试中得分突破 1300，成为首个低于 100 亿参数却达到该水平的模型

全新大模型开源，腾讯（int4能打DeepSeek） Vs 谷歌（2GB运行多模态）图片最吸引人的点在于：极低成本即可实现端侧多模态推理

据网友实测反馈，Gemma 3n 的语音转写与翻译功能表现良好

但更值得关注的是其在移动端的实际运行表现

谷歌已将该模型上架安卓平台的 Edge Gallery 应用，结合其支持 GPU 卸载的特性，可能是目前最佳使用方式

不过有测试显示，在高通骁龙 6 代 4 核处理器（仅 CPU 运行）上每秒仅生成 4-5 个 token，响应较慢，实用性受限

目前建议持续关注，更多资源可自行查阅：

Hugging Face

https://huggingface.co/collections/google/gemma-3n-685065323f5984ef315c93f4

盖世游戏如何添加手柄

vivo如何改回经典桌面

盘搜搜怎么找蓝光电影盘搜搜怎么搜索4K影视资源【经验】

Mini LED电视爆火：85英寸以上占比已超70%

盘搜搜怎么搜索AE模板工程盘搜搜After Effects资源【AE】

AI工具

AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型，支持联网搜索。

下载

相关专题

edge是什么浏览器

Edge是一款由Microsoft开发的网页浏览器，是Windows 10操作系统中默认的浏览器，其目标是提供更快、更安全、更现代化的浏览器体验。本专题为大家提供edge浏览器相关的文章、下载、课程内容，供大家免费下载体验。

1714

2023.08.21

IE浏览器自动跳转EDGE如何恢复

ie浏览器自动跳转edge的解决办法：1、更改默认浏览器设置；2、阻止edge浏览器的自动跳转；3、更改超链接的默认打开方式；4、禁用“快速网页查看器”；5、卸载edge浏览器；6、检查第三方插件或应用程序等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

396

2024.03.05

如何解决Edge打开但没有标题的问题

若 Microsoft Edge 浏览器打开后无标题（窗口空白或标题栏缺失），可尝试以下方法解决：重启 Edge：关闭所有窗口，重新启动浏览器。重置窗口布局：右击任务栏 Edge 图标 → 选择「最大化」或「还原」。禁用扩展：进入 edge://extensions 临时关闭插件测试。重置浏览器设置：前往 edge://settings/reset 恢复默认配置。更新或重装 Edge：检查最新版本，或通过控制面板修复

1031

2025.04.24

登录token无效

登录token无效解决方法：1、检查token的有效期限，如果token已经过期，需要重新获取一个新的token；2、检查token的签名，如果签名不正确，需要重新获取一个新的token；3、检查密钥的正确性，如果密钥不正确，需要重新获取一个新的token；4、使用HTTPS协议传输token，建议使用HTTPS协议进行传输；5、使用双因素认证，双因素认证可以提高账户的安全性。

6560

2023.09.14

登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容，供大家免费下载体验。

841

2023.09.14

token怎么获取

获取token值的方法：1、小程序调用“wx.login()”获取临时登录凭证code，并回传到开发者服务器；2、开发者服务器以code换取，用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容，可以阅读本专题下面的文章。

1090

2023.12.21

token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易，用来购买或出售特定的虚拟货币，也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1909

2024.03.01

http与https有哪些区别

http与https的区别：1、协议安全性；2、连接方式；3、证书管理；4、连接状态；5、端口号；6、资源消耗；7、兼容性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

2864

2024.08.16

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

2026.03.06

热门下载

网站特效

网站源码

网站素材

前端模板