0

0

标准化 3D 生成质量榜单来了!首创层次化评价体系,告别“谁的 demo 更吸睛”主观评估

DDD

DDD

发布时间:2025-08-17 10:28:13

|

294人浏览过

|

来源于ZAKER

转载

作为 ai 视频之后最被看好的 aigc 应用领域之一,对比 2024 年,2025 年ai 3d 生成的质量已经进化成了这样:

 标准化 3D 生成质量榜单来了!首创层次化评价体系,告别“谁的 demo 更吸睛”主观评估

△图源:Meshy

随着模型能力的不断进化,在评估层面,新的挑战也在出现:

传统 3D 生成评测往往停留在对象级的粗糙评估,主要关注 " 整体质量 ",缺少对局部结构和材质的系统化分析。

为了解决这个问题,上海人工智能实验室联合复旦大学、清华大学、香港中文大学等高校发布了Hi3DEval——一套面向 3D 内容生成的全新层次化自动评测体系。

 标准化 3D 生成质量榜单来了!首创层次化评价体系,告别“谁的 demo 更吸睛”主观评估

团队通过设计对象级、部件级与材质主题三层评测协议,实现从整体形态到局部结构再到材质真实性的多粒度分析,全方位揭示模型的生成能力。

在此基础上,首期3D 生成榜单已在 HuggingFace 同步发布,涵盖30 个主流与前沿模型,覆盖Text to 3D与Image to 3D两大核心任务。

 标准化 3D 生成质量榜单来了!首创层次化评价体系,告别“谁的 demo 更吸睛”主观评估

研究团队表示,该榜单可以直观呈现各模型的总和表现,希望以此为学术界与产业界提供可追踪、可复现的对标基准,推动 3D 生成技术向更高质量与更高透明度发展。

三层评测协议:从整体到细节,全面解析 3D 生成质量

Hi3DEval 基于三层评测协议的层次化评测体系,旨在提供更细粒度的质量剖析,还能揭示具体的优缺点,为模型改进与优化提供明确方向。

对象级(object-level)

对象级评估关注生成物体的宏观表现,涵盖 "几何合理性"、"几何精细度"、"纹理质量"、"几何 - 纹理一致性"、"Prompt-3D 一致性" 五个维度。

" 几何合理性 " 侧重的结构完整性、保真性,不存在多头、塌陷、浮空等违背物理规律。

" 几何精细度 " 则侧重表面精细度,包括边缘锐利度、细小部件的完整性等。

" 纹理质量 " 考察纹理贴图的清晰度、细节保真度以及美学水平。

" 几何 - 纹理一致性 " 检查纹理与几何结构的对齐程度,例如花纹是否遵循物体表面轮廓。

"Prompt-3D 一致性 " 则评估生成 3D 资产与输入文本或图像提示的匹配度,包括类别、属性和身份特征等,确保结果符合用户需求。

 标准化 3D 生成质量榜单来了!首创层次化评价体系,告别“谁的 demo 更吸睛”主观评估

部件级(part-level)

现有的大多数 3D 生成评测体系都停留在对象级评估,只能给出整体质量的笼统评分,难以揭示模型在局部结构上的优劣。

Hi3DEval 引入部件级评测,将关注点精确落在诸如椅子腿、扶手、背板等细分部位,能够直观定位缺陷发生的区域。

这种粒度更细的评测不仅有助于诊断生成过程中的局部几何问题,还能在模型优化时提供有针对性的改进信号。评测维度包括局部几何合理性(保证局部结构符合现实物理与设计逻辑)和局部几何精细度(衡量细节刻画的清晰度与丰富程度)。

 标准化 3D 生成质量榜单来了!首创层次化评价体系,告别“谁的 demo 更吸睛”主观评估

材质主题(material-subject)

传统的材质评估仍停留在图片质量和主观审美层面,常用的指标如 FID、KID、美学评分等。

为了弥补这块的空缺,Hi3DEval 设计材质主题的评估协议,聚焦表面视觉与物理属性,借助物体在不同光照条件下的反射信息,从 "细节与复杂性"、"色彩与饱和度"、"一致性与伪影"、"材质合理性" 四个维度进行全方位评估。

其中前两个维度聚焦表面视觉," 细节与复杂度 " 关注材质纹理的视觉丰富度和美学协调度," 色彩与饱和度 " 则评估材质颜色的分布是否自然以及饱和度是否合理。后两个维度则聚焦物理属性," 一致性与伪影 " 检查材质纹理在不同光照或视角下的一致性,避免接缝、错位、异常阴影等视觉伪影, " 材质合理性 " 评估反射率、粗糙度等物理特性是否符合现实材料表现。

UXbot
UXbot

AI产品设计工具

下载

 标准化 3D 生成质量榜单来了!首创层次化评价体系,告别“谁的 demo 更吸睛”主观评估

首期评测榜单:直观呈现模型实力,推动行业对标

Hi3DEval 在 HuggingFace 平台发布了首期 3D 生成榜单,涵盖 30 余款 Text-to-3D 与 Image-to-3D 模型。

榜单在统一的评测设置下对所有模型进行测评,包括相同的输入提示、渲染视角、光照条件及输出格式。这种标准化流程不仅消除了实验环境差异带来的偏差,还保障了榜单的评分结果的公正性和可参考性。

榜单结果不仅直观呈现总分排名,还提供各个维度的单项得分,帮助研究者、开发者快速定位模型优势与短板。同时,它也为学术界与工业界提供了可追踪的对标参考,推动 3D 生成技术向高质量、透明化发展。

 标准化 3D 生成质量榜单来了!首创层次化评价体系,告别“谁的 demo 更吸睛”主观评估

完整榜单可点击文末链接查看。

自动化评测管线:混合 3D 表征,增强 3D 感知能力

过往多数评测方法依赖静态渲染图像,难以暴露动态不一致(如跨视角形变、细节抖动等)和真实几何缺陷(如多头问题、局部塌陷等),评测结论与模型在真实三维使用场景中的可用性存在偏差。

为了缓解 2D 表征的局限性,Hi3DEval 使用多视角环绕视频 + 原生网格(mesh)构建了基于混合 3D 表征的自动化评测管线。

视频表征能直观揭示跨视角 / 时序的结构稳定性与纹理漂移,能够区分 " 静帧好看、转动即崩 " 的模型,使其非常适合用于对象级和材质主题的评估。而对于部件级评测,由于视频表征经常出现对部件主体的遮挡进而影响评估质量,所以选用了原生 3D 表征支持几何相关维度的自动化评测。

通过统一的模型设置与对比实验,Hi3DEval 在人类偏好一致性上的表现优越,超越了现有主流自动评测指标,为 3D 内容生成领域提供了更可靠、更全面的评测工具

 标准化 3D 生成质量榜单来了!首创层次化评价体系,告别“谁的 demo 更吸睛”主观评估

 标准化 3D 生成质量榜单来了!首创层次化评价体系,告别“谁的 demo 更吸睛”主观评估

在生成 3D 技术高速迭代的当下,虽然不同模型在功能和表现形式上的差距正在逐渐缩小,但在内容精细度、真实感、结构一致性等质量维度上,差异依旧显著。

过去,由于缺乏一套科学、统一且可扩展的评价体系,行业讨论往往停留在 " 谁的 demo 更吸睛 " 这种主观印象层面,难以全面衡量方法的真正水平。

Hi3DEval 这样的基准推出,旨在打破这一局限——不仅提供了面向未来的、系统化的 3D 内容质量评价标准,也为学术界和产业界带来了更透明、更公平的对比依据。

论文地址:

https://arxiv.org/abs/2508.05609

项目主页:

https://zyh482.github.io/Hi3DEval/

评测榜单:

https://huggingface.co/spaces/3DTopia/3DGen-Leaderboard

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

— 完 —

点亮星标

科技前沿进展每日见

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
github中文官网入口 github中文版官网网页进入
github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started,GitHub 是一种基于云的平台,可在其中存储、共享并与他人一起编写代码。 通过将代码存储在GitHub 上的“存储库”中,你可以: “展示或共享”你的工作。 持续“跟踪和管理”对代码的更改。

3334

2026.01.21

http与https有哪些区别
http与https有哪些区别

http与https的区别:1、协议安全性;2、连接方式;3、证书管理;4、连接状态;5、端口号;6、资源消耗;7、兼容性。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

2770

2024.08.16

PHP 命令行脚本与自动化任务开发
PHP 命令行脚本与自动化任务开发

本专题系统讲解 PHP 在命令行环境(CLI)下的开发与应用,内容涵盖 PHP CLI 基础、参数解析、文件与目录操作、日志输出、异常处理,以及与 Linux 定时任务(Cron)的结合使用。通过实战示例,帮助开发者掌握使用 PHP 构建 自动化脚本、批处理工具与后台任务程序 的能力。

62

2025.12.13

Golang 测试体系与代码质量保障:工程级可靠性建设
Golang 测试体系与代码质量保障:工程级可靠性建设

Go语言测试体系与代码质量保障聚焦于构建工程级可靠性系统。本专题深入解析Go的测试工具链(如go test)、单元测试、集成测试及端到端测试实践,结合代码覆盖率分析、静态代码扫描(如go vet)和动态分析工具,建立全链路质量监控机制。通过自动化测试框架、持续集成(CI)流水线配置及代码审查规范,实现测试用例管理、缺陷追踪与质量门禁控制,确保代码健壮性与可维护性,为高可靠性工程系统提供质量保障。

48

2026.02.28

Golang 工程化架构设计:可维护与可演进系统构建
Golang 工程化架构设计:可维护与可演进系统构建

Go语言工程化架构设计专注于构建高可维护性、可演进的企业级系统。本专题深入探讨Go项目的目录结构设计、模块划分、依赖管理等核心架构原则,涵盖微服务架构、领域驱动设计(DDD)在Go中的实践应用。通过实战案例解析接口抽象、错误处理、配置管理、日志监控等关键工程化技术,帮助开发者掌握构建稳定、可扩展Go应用的最佳实践方法。

43

2026.02.28

Golang 性能分析与运行时机制:构建高性能程序
Golang 性能分析与运行时机制:构建高性能程序

Go语言以其高效的并发模型和优异的性能表现广泛应用于高并发、高性能场景。其运行时机制包括 Goroutine 调度、内存管理、垃圾回收等方面,深入理解这些机制有助于编写更高效稳定的程序。本专题将系统讲解 Golang 的性能分析工具使用、常见性能瓶颈定位及优化策略,并结合实际案例剖析 Go 程序的运行时行为,帮助开发者掌握构建高性能应用的关键技能。

37

2026.02.28

Golang 并发编程模型与工程实践:从语言特性到系统性能
Golang 并发编程模型与工程实践:从语言特性到系统性能

本专题系统讲解 Golang 并发编程模型,从语言级特性出发,深入理解 goroutine、channel 与调度机制。结合工程实践,分析并发设计模式、性能瓶颈与资源控制策略,帮助将并发能力有效转化为稳定、可扩展的系统性能优势。

22

2026.02.27

Golang 高级特性与最佳实践:提升代码艺术
Golang 高级特性与最佳实践:提升代码艺术

本专题深入剖析 Golang 的高级特性与工程级最佳实践,涵盖并发模型、内存管理、接口设计与错误处理策略。通过真实场景与代码对比,引导从“可运行”走向“高质量”,帮助构建高性能、可扩展、易维护的优雅 Go 代码体系。

19

2026.02.27

Golang 测试与调试专题:确保代码可靠性
Golang 测试与调试专题:确保代码可靠性

本专题聚焦 Golang 的测试与调试体系,系统讲解单元测试、表驱动测试、基准测试与覆盖率分析方法,并深入剖析调试工具与常见问题定位思路。通过实践示例,引导建立可验证、可回归的工程习惯,从而持续提升代码可靠性与可维护性。

3

2026.02.27

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
前端小白零基础入门HTML5+CSS3
前端小白零基础入门HTML5+CSS3

共361课时 | 40.5万人学习

CSS3 3D 特效视频教程
CSS3 3D 特效视频教程

共14课时 | 3.1万人学习

7天教会你HTML5和CSS3视频教程
7天教会你HTML5和CSS3视频教程

共21课时 | 4.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号