从一张图片到完整3D世界丨DeepMind Genie 2来了！

发表于 2024-12-09

标记狮私有云部署

一键部署标记狮至私有服务器，构建快速，安全，高效，私密的UI设计团队云协作

画面质量优秀：系统生成的 3D 世界分辨率达到了 720p，支持第一人称或第三人称视角，适配键盘和鼠标操作。
真实的物理效果：Genie 2 可以模拟重力、碰撞、水流等核心物理特性，还能处理复杂的光影、反射和烟雾效果，真实感拉满！
空间记忆强大：它拥有“空间记忆”功能，不会像以前的 3D 生成器那样，玩家返回之前探索过的地方时场景会重新生成。Genie 2 会忠实还原你之前走过的环境，体验感更流畅。

DeepMind 还发布了一段展示视频，使用了基础模型以最高画质运行，画面非常惊艳。而精简模型虽然画质略低，但可以支持实时交互。

DeepMind 表示，Genie 2 非常适合游戏开发者。它可以通过简单的草图或照片快速生成测试场景。比如，你画个手稿，它就能“变”出一个完整的 3D 环境，还附带真实的物理和光影效果！

DeepMind 还测试了 Genie 2 与 AI 智能体 SIMA 的结合应用。SIMA 可以在数字环境中理解自然语言指令，比如“打开蓝色的门”，然后在 Genie 2 生成的 3D 房间中完成操作。这种搭配让 Genie 2 变得更有潜力，不仅能用来做游戏，还可以用作训练 AI 的虚拟场景。

DeepMind 对 Genie 2 的期待非常高！研究员 Tim Rocktäschel 表示，他们在两年前开发 Genie 1 时，就希望能打造一种“基础世界模型”，为人工智能提供无穷无尽的训练场景。而 Genie 2 的推出，让他们离这个目标更近了一步。

想象一下，未来 AI 系统可以在 Genie 2 生成的环境中学习各种复杂任务，比如机器人操作、无人驾驶模拟，甚至是虚拟助手的训练。
它不仅是科技的突破，更可能彻底改变我们对数字世界的交互方式！

https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model/