WHAMM是第一个真正可以被拿来当游戏玩的世界模型
微软在四月初发布的WHAMM!没有带来很多讨论,但是对我而言还是蛮震撼的 - 走到当初大家所想象的元宇宙需要的技能树又被点亮一颗
WHAMM是完全在一个大模型所模拟的虚拟世界中生成的游戏场景,每秒钟可以实时生成十帧画面,相比于之前的只能异步生成或者每秒一帧,WHAMM是已经达到了可玩的程度了。
相比于传统的游戏在UE/Unity上面设置游戏场景、碰撞体积、交互规则,WHAMM所用的世界模型则是让模型理解这个虚拟的世界和规则,再基于理解生成每一秒所看到的画面。你可以在大模型内前进后退、射击、闪躲,这个世界模型也可以记住世界中物体的状态和位置。
体验上明显还可以感觉到一些问题:比如模型的context window限制导致游戏中脱离视线一段时间的物品可能会被“遗忘” - 消失,模型的计数不稳定导致血量等信息更新不准确等。但是还是很期待未来可以根据任何一段视频者图文记录生成一个虚拟的世界,在你自己制定的规则中互动和体验。游戏会有更多新的想象空间。
游戏链接 - https://t.co/z4svGVfbap
游戏发布博客 - https://t.co/xvSU2ejydU
底层世界模型博客 - https://t.co/7eAqiua9Hq