0

0

Google DeepMind开放Project Genie测试!「世界模型」技术比李飞飞更厉害?

舞夢輝影

舞夢輝影

发布时间:2026-01-31 08:32:02

|

977人浏览过

|

来源于php中文网

原创

google deepmind 推出的 ai 项目「project genie」已于本周四起,面向美国地区 google ai ultra 订阅用户开启抢先体验通道。用户只需输入简短文字指令,或上传任意图片,系统即可即时生成一个具备可操作性与探索性的互动游戏世界。

该项目深度融合了 Google 最新发布的 Genie 3 世界模型、Nano Banana Pro 图像生成模型,以及 Gemini 智能系统。DeepMind 表示,此次开放测试旨在获取真实用户的使用反馈与高质量训练数据,以持续优化世界模型性能,并加快技术迭代进程。

Google DeepMind开放Project Genie测试!「世界模型」技术比李飞飞更厉害?

延伸阅读:

马斯克传重组三大事业帝国!SpaceX、xAI、特斯拉酝酿世纪大合併

所谓“世界模型”,指的是能够对物理或虚拟环境构建内部表征,并据此预测未来状态、规划智能行为的一类人工智能系统。DeepMind 此次选择从电子游戏等轻量级娱乐场景切入,后续将逐步拓展至高保真模拟环境,用于机器人感知与决策训练,最终服务于通用人工智能(AGI)的长期愿景。

ADHD Reading
ADHD Reading

面向ADHD群体的浏览器阅读增强扩展

下载

当前,全球范围内世界模型研发已进入白热化阶段。AI 领域权威学者李飞飞(Fei-Fei Li)创立的 World Labs 去年底正式发布首款商用产品 Marble;新兴 AI 视频生成公司 Runway 近期亦公开其自研世界模型;而 Meta 前首席科学家杨立昆(Yann LeCun)联合创办的 AMI Labs,也将该方向列为战略级核心技术布局重点。

不过,DeepMind 团队坦承,Project Genie 目前仍处于早期实验阶段:系统表现存在显著波动——有时可生成逻辑严密、细节丰富的沉浸式世界,有时却会产出难以理解的异常结果。在操作流程上,用户需首先通过文字描述设定基础环境与主角特征,完成“世界素描(World sketch)”;随后 Nano Banana Pro 将据此生成初始图像,Genie 则以此为起点构建完整互动世界。实测显示,尽管局部修改功能基本可用,但偶发偏差仍较明显,例如明确要求“绿色头发”却输出紫色发色。

用户亦可上传真实照片作为生成基底,但效果因图而异。一旦图像通过审核,Project Genie 仅需数秒即可输出可供实时探索的三维世界。受限于高昂算力开销,目前每轮体验严格限定为 60 秒——项目负责人弗鲁赫特解释称,Genie 3 属于自回归模型(Autoregressive model),推理过程资源密集,限时机制旨在保障更多用户公平参与体验。

安全层面,系统已部署多重内容过滤与合规审查机制(Guardrails),明确禁止生成裸露内容、涉及迪士尼等受版权保护的 IP 元素。与此同时,交互自然度亦是当前重点攻坚方向:测试中曾出现角色穿墙、碰撞检测失效等问题;WASD 导航键响应偶有延迟或方向错位。弗鲁赫特强调,这仅为初步原型,团队后续将持续提升画面写实性、物理一致性及人机交互流畅度。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
li是什么元素
li是什么元素

li是HTML标记语言中的一个元素,用于创建列表。li代表列表项,它是ul或ol的子元素,li标签的作用是定义列表中的每个项目。本专题为大家li元素相关的各种文章、以及下载和课程。

438

2023.08.03

Go Web框架Gin接口开发与中间件设计实践
Go Web框架Gin接口开发与中间件设计实践

本专题围绕 Go 在 Web 后端开发中的主流框架 Gin 展开,系统讲解高性能接口开发与中间件机制设计。内容涵盖路由分组、请求绑定、参数校验、统一响应封装、日志与鉴权中间件实现,以及接口限流与异常处理策略。通过实战项目案例,帮助开发者构建结构清晰、性能优良的 Go Web 服务体系,提升接口开发效率与系统可维护性。

9

2026.03.19

bootstrap安装教程
bootstrap安装教程

本专题整合了bootstrap安装相关教程,阅读专题下面的文章了解更多详细操作教程。

27

2026.03.18

bootstrap框架介绍
bootstrap框架介绍

本专题整合了bootstrap框架相关介绍,阅读专题下面的文章了解更多详细内容。

172

2026.03.18

vscode 格式化
vscode 格式化

本专题整合了vscode格式化相关内容,阅读专题下面的文章了解更多详细内容。

14

2026.03.18

vscode设置中文教程
vscode设置中文教程

本专题整合了vscode设置中文相关内容,阅读专题下面的文章了解更多详细教程。

9

2026.03.18

vscode更新教程合集
vscode更新教程合集

本专题整合了vscode更新相关内容,阅读专题下面的文章了解更多详细教程。

13

2026.03.18

Gemini网页版零基础入门:5分钟上手Gemini聊天指南
Gemini网页版零基础入门:5分钟上手Gemini聊天指南

本专题专为零基础用户打造,5分钟快速掌握Gemini网页版核心用法。从账号登录到界面布局,详解如何发起对话、优化提示词及利用多模态功能。通过实战案例,教你高效获取信息、创作内容与分析数据。无论学习还是工作,轻松开启AI辅助新时代,让Gemini成为你的得力智能助手。

62

2026.03.18

Python WebSocket实时通信与异步服务开发实践
Python WebSocket实时通信与异步服务开发实践

本专题聚焦 Python 在实时通信场景中的开发实践,系统讲解 WebSocket 协议原理、长连接管理、消息推送机制以及异步服务架构设计。内容包括客户端与服务端通信实现、连接稳定性优化、消息队列集成及高并发处理策略。通过完整案例,帮助开发者构建高效稳定的实时通信系统,适用于聊天应用、实时数据推送等场景。

33

2026.03.18

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Go 教程
Go 教程

共32课时 | 6.4万人学习

Go语言实战之 GraphQL
Go语言实战之 GraphQL

共10课时 | 0.9万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号