你能想象吗?只用一张图片,就能生成一个可探索的 3D 世界!Google DeepMind 最近推出了全新的 AI 系统——Genie 2,它可以把单张图片“变身”为互动式 3D 环境,最多可以探索 1 分钟。
Genie 2 到底有多厉害?
画面质量优秀:系统生成的 3D 世界分辨率达到了 720p,支持第一人称或第三人称视角,适配键盘和鼠标操作。
真实的物理效果:Genie 2 可以模拟重力、碰撞、水流等核心物理特性,还能处理复杂的光影、反射和烟雾效果,真实感拉满!
空间记忆强大:它拥有“空间记忆”功能,不会像以前的 3D 生成器那样,玩家返回之前探索过的地方时场景会重新生成。Genie 2 会忠实还原你之前走过的环境,体验感更流畅。
DeepMind 还发布了一段展示视频,使用了基础模型以最高画质运行,画面非常惊艳。而精简模型虽然画质略低,但可以支持实时交互。
不仅是炫酷科技,还能真正用起来!
DeepMind 表示,Genie 2 非常适合游戏开发者。它可以通过简单的草图或照片快速生成测试场景。比如,你画个手稿,它就能“变”出一个完整的 3D 环境,还附带真实的物理和光影效果!
DeepMind 还测试了 Genie 2 与 AI 智能体 SIMA 的结合应用。SIMA 可以在数字环境中理解自然语言指令,比如“打开蓝色的门”,然后在 Genie 2 生成的 3D 房间中完成操作。这种搭配让 Genie 2 变得更有潜力,不仅能用来做游戏,还可以用作训练 AI 的虚拟场景。
未来应用前景如何?
DeepMind 对 Genie 2 的期待非常高!研究员 Tim Rocktäschel 表示,他们在两年前开发 Genie 1 时,就希望能打造一种“基础世界模型”,为人工智能提供无穷无尽的训练场景。而 Genie 2 的推出,让他们离这个目标更近了一步。
想象一下,未来 AI 系统可以在 Genie 2 生成的环境中学习各种复杂任务,比如机器人操作、无人驾驶模拟,甚至是虚拟助手的训练。
它不仅是科技的突破,更可能彻底改变我们对数字世界的交互方式!
https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model/