Google DeepMind开放Project Genie测试！「世界模型」技术比李飞飞更厉害？

舞夢輝影

发布时间：2026-01-31 08:32:02

977人浏览过

来源于php中文网

原创

google deepmind 推出的 ai 项目「project genie」已于本周四起，面向美国地区 google ai ultra 订阅用户开启抢先体验通道。用户只需输入简短文字指令，或上传任意图片，系统即可即时生成一个具备可操作性与探索性的互动游戏世界。

该项目深度融合了 Google 最新发布的 Genie 3 世界模型、Nano Banana Pro 图像生成模型，以及 Gemini 智能系统。DeepMind 表示，此次开放测试旨在获取真实用户的使用反馈与高质量训练数据，以持续优化世界模型性能，并加快技术迭代进程。

Google DeepMind开放Project Genie测试！「世界模型」技术比李飞飞更厉害？

延伸阅读：

马斯克传重组三大事业帝国！SpaceX、xAI、特斯拉酝酿世纪大合併

所谓“世界模型”，指的是能够对物理或虚拟环境构建内部表征，并据此预测未来状态、规划智能行为的一类人工智能系统。DeepMind 此次选择从电子游戏等轻量级娱乐场景切入，后续将逐步拓展至高保真模拟环境，用于机器人感知与决策训练，最终服务于通用人工智能（AGI）的长期愿景。

ADHD Reading

面向ADHD群体的浏览器阅读增强扩展

下载

当前，全球范围内世界模型研发已进入白热化阶段。AI 领域权威学者李飞飞（Fei-Fei Li）创立的 World Labs 去年底正式发布首款商用产品 Marble；新兴 AI 视频生成公司 Runway 近期亦公开其自研世界模型；而 Meta 前首席科学家杨立昆（Yann LeCun）联合创办的 AMI Labs，也将该方向列为战略级核心技术布局重点。

不过，DeepMind 团队坦承，Project Genie 目前仍处于早期实验阶段：系统表现存在显著波动——有时可生成逻辑严密、细节丰富的沉浸式世界，有时却会产出难以理解的异常结果。在操作流程上，用户需首先通过文字描述设定基础环境与主角特征，完成“世界素描（World sketch）”；随后 Nano Banana Pro 将据此生成初始图像，Genie 则以此为起点构建完整互动世界。实测显示，尽管局部修改功能基本可用，但偶发偏差仍较明显，例如明确要求“绿色头发”却输出紫色发色。

用户亦可上传真实照片作为生成基底，但效果因图而异。一旦图像通过审核，Project Genie 仅需数秒即可输出可供实时探索的三维世界。受限于高昂算力开销，目前每轮体验严格限定为 60 秒——项目负责人弗鲁赫特解释称，Genie 3 属于自回归模型（Autoregressive model），推理过程资源密集，限时机制旨在保障更多用户公平参与体验。

安全层面，系统已部署多重内容过滤与合规审查机制（Guardrails），明确禁止生成裸露内容、涉及迪士尼等受版权保护的 IP 元素。与此同时，交互自然度亦是当前重点攻坚方向：测试中曾出现角色穿墙、碰撞检测失效等问题；WASD 导航键响应偶有延迟或方向错位。弗鲁赫特强调，这仅为初步原型，团队后续将持续提升画面写实性、物理一致性及人机交互流畅度。

完全 AI Coding 的性能优化 | zorm v1.8.1发布

EasyGoAdmin 敏捷开发框架 Beego+Layui 版本 v3.0.0 发布

项目流：类似禅道的项目管理软件，支持微信登录

多数人没发现隐藏在Google Maps的「这项功能」！将完全改变看导航的习惯

EasyGoAdmin 敏捷开发框架 GoFrame+AntdVue 版本 v2.6.0 发布

相关标签:

go 人工智能 ai 特斯拉马斯克 google 虚拟环境迪士尼 ultra gemini li agi 视频生成

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：游戏界最强晶片还是它！AMD Ryzen 7 9850X3D险胜英特尔下一篇：记忆体成本攀升引定价分歧！传苹果iPhone 18将吸收成本三星 S26 恐大涨

作者最新文章

Python如何实现任务调度系统_定时任务设计

2026-03-18 12:43

Java中Apache利用mod_cache自定义缓存键的生成规则

2026-03-18 12:44

Linux下利用ss命令高效率查询特定PID关联的Socket信息

2026-03-18 12:53

Java中Apache中error_log对权限拒绝（403）的记录

2026-03-18 13:23

Apache中主备模式在小规模Java系统中的成本与效益

2026-03-18 13:24

Java final 常量在编译期的常量折叠优化

2026-03-18 13:35

Java中Apache通过mod_log_config自定义日志格式

2026-03-18 13:41

Linux 共享内存异常_共享内存调优

2026-03-18 13:46

JavaScript中利用模块化实现前端AB测试的功能开关

2026-03-18 14:09

Linux生产事故复盘模板_复盘方法与示例

2026-03-18 14:16

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

li是什么元素

li是HTML标记语言中的一个元素，用于创建列表。li代表列表项，它是ul或ol的子元素，li标签的作用是定义列表中的每个项目。本专题为大家li元素相关的各种文章、以及下载和课程。

438

2023.08.03

Go Web框架Gin接口开发与中间件设计实践

本专题围绕 Go 在 Web 后端开发中的主流框架 Gin 展开，系统讲解高性能接口开发与中间件机制设计。内容涵盖路由分组、请求绑定、参数校验、统一响应封装、日志与鉴权中间件实现，以及接口限流与异常处理策略。通过实战项目案例，帮助开发者构建结构清晰、性能优良的 Go Web 服务体系，提升接口开发效率与系统可维护性。

2026.03.19

bootstrap安装教程

本专题整合了bootstrap安装相关教程，阅读专题下面的文章了解更多详细操作教程。

2026.03.18

bootstrap框架介绍

本专题整合了bootstrap框架相关介绍，阅读专题下面的文章了解更多详细内容。

172

2026.03.18

vscode 格式化

本专题整合了vscode格式化相关内容，阅读专题下面的文章了解更多详细内容。

2026.03.18

vscode设置中文教程

本专题整合了vscode设置中文相关内容，阅读专题下面的文章了解更多详细教程。

2026.03.18

vscode更新教程合集

本专题整合了vscode更新相关内容，阅读专题下面的文章了解更多详细教程。

2026.03.18

Gemini网页版零基础入门：5分钟上手Gemini聊天指南

本专题专为零基础用户打造，5分钟快速掌握Gemini网页版核心用法。从账号登录到界面布局，详解如何发起对话、优化提示词及利用多模态功能。通过实战案例，教你高效获取信息、创作内容与分析数据。无论学习还是工作，轻松开启AI辅助新时代，让Gemini成为你的得力智能助手。

2026.03.18

Python WebSocket实时通信与异步服务开发实践

本专题聚焦 Python 在实时通信场景中的开发实践，系统讲解 WebSocket 协议原理、长连接管理、消息推送机制以及异步服务架构设计。内容包括客户端与服务端通信实现、连接稳定性优化、消息队列集成及高并发处理策略。通过完整案例，帮助开发者构建高效稳定的实时通信系统，适用于聊天应用、实时数据推送等场景。

2026.03.18

热门下载

网站特效

网站源码

网站素材

前端模板