作者 | 辰辰
出品 | 网易科技
李飞飞、杨立昆、马斯克,这三位顶级大脑正在“合谋”一件大事。
他们不再执着于卷大模型,而是开启了AI的下半场:世界模型(World Models)。
(图片由AI生成)
他们的野心早已超越了写诗或敲代码,而是试图通过这项黑科技,在数字空间里彻底“重造”一个符合物理规律的真实世界。而那个产值1900亿美元的电子游戏产业,不过是这场宏大造物实验的第一个“试验田”。
1. “空间智能”:李飞飞的降维打击
长期以来,AI一直被困在文字和像素的“扁平世界”里。ChatGPT懂语言逻辑,但不理解重力;Sora能生成视频,却经常让视频里的吸管穿透杯子。
曾凭借ImageNet开启深度学习时代的“AI教母”李飞飞正试图打破这道墙。她新近创立的独角兽公司World Labs估值已超10亿美元,在今年11月份亮出了首张王牌:名为 Marble 的商用世界模型平台。
Marble不只是生成视频。它可以根据你的一句话、一张照片,瞬间生成一个可实时进入、自由探索、符合物理逻辑的3D世界。
李飞飞在最新宣言中直言:“这超越了语言的边界。”她将这种能力称为“空间智能(Spatial Intelligence)”。在Marble平台上,用户输入“一个赛博朋克风格的小巷”,AI给出的不再是一张画,而是一个可以像玩《赛博朋克2077》一样走进去、回头看、甚至导出的三维关卡。
(图片由AI生成,不代表实际效果)
李飞飞直言不讳地将矛头对准了业界霸主:“Unity和Epic的Unreal(虚幻引擎)都到了该被‘颠覆’的时候了。”传统的模拟游戏引擎将迎来改进,而世界模型可能会彻底颠覆这一领域。
2. 杨立昆的“反击”:为什么LLM只是“复读机”?
就在李飞飞发力的同时,AI界另一位泰斗杨立昆也坐不住了。
上月底,他正式宣布创办AMI Labs(高级机器智能实验室),并开出了惊人的价码。据报道,公司正寻求以30亿欧元(约35亿美元)的估值融资5亿欧元(约5.86亿美元)。
杨立昆一直是“大语言模型(LLM)”最激烈的批评者。他认为现在的聊天机器人只是在玩概率游戏,根本没有真正的常识。“世界模型”则是他的终极方案。
(图片由AI生成)
与LLM不同,杨立昆的世界模型试图让AI像人类一样通过观察和感官数据(视频、声音、传感器)来学习:如果我推一下杯子,它会倒吗?如果我松手,球会掉吗?这种对因果律和物理规律的理解,将从根本上解决AI的“幻觉”问题。
有趣的是,AMI Labs挖来了明星医疗AI初创公司Nabla的联合创始人亚历克斯·勒布伦(Alex LeBrun)担任CEO。勒布伦是一个深谙商业化的狠角色,他曾将自己的初创公司卖给Facebook。这意味着杨立昆不再满足于实验室里的学术研究,他要直接切入医疗和游戏等实战赛道。
3. 谷歌DeepMind Genie 3:实时生成的“头号玩家”
如果说杨立昆是在为世界模型勾勒逻辑蓝图,那么谷歌DeepMind则直接端出了“造物主”的原型机。
就在李飞飞与杨立昆相继亮剑时,DeepMind也祭出了技术“大杀器” Genie 3。这不再是一个只能看、不能碰的视频生成器,而是一个能够实时生成、实时交互的动态世界模型。
“这可能是通往AGI(通用人工智能)最关键的拼图。”DeepMind研究科学家杰克·帕克-霍尔德(Jack Parker-Holder)这样评价。
(图片由AI生成,不代表实际效果)
Genie 3的惊人之处在于它对“交互”的定义。它能以每秒24帧的速度、720p的分辨率,实时响应用户的文本指令。当你输入一段指令,它不是给你一张静态图,而是瞬间“渲染”出一个数字世界。
但最令内部团队感到不可思议的,是它展现出的“物理记忆”功能。在传统的AI生成画面中,物体往往是“转瞬即逝”的——你转个身,身后的树可能就变成了电线杆。但Genie 3拥有物理一致性:
· 墙上的油漆: 如果你在虚拟世界里给一面墙刷了红漆,即便你走开去探索森林再回来,那抹红漆依然会留在原地。
· 真实反馈: 无论是走过沙地的阻力、滑雪时的惯性,还是游泳时的浮力,Genie 3都能给出准确的反馈。
(图片由AI生成)
最令人细思极恐的是: Genie 3的这些物理常识,并非由程序员手工编写的代码定义的。 DeepMind研究总监施洛米·弗鲁克特(Shlomi Fruchter)透露,模型从未被告知什么是“水”,什么是“摩擦力”。这种模拟现实的能力,完全是在海量数据训练中“自发涌现”的。这意味着,AI正在通过观察人类世界的影像,自己推导出了牛顿力学。
研究团队坚信,Genie 3将成为具身智能的最佳练兵场。在昂贵的原型机器人踏入现实世界之前,它们可以在Genie 3创造的无限个、高保真的模拟环境中训练数百万次。尽管DeepMind谦逊地承认,目前的模型距离“完美模拟现实”还有一段路要走,但他们已经计划开放这一模型。显然,谷歌不甘心只做旁观者,它要直接定义未来3D交互的标准。
4. 马斯克与xAI:我也来造一个
如果说从实验室走出来的AI科学家们还在谈论“空间智能”、“因果律”和“物理涌现”,马斯克的风格则是一贯的“暴力美学”:招最贵的人,做最狂的事。
今年夏天,马斯克的xAI就从英伟达挖走了Zeeshan Patel和Ethan He等多位顶级研究员,组建“Omni团队”。这些专家的年薪最高达44万美元(约合人民币320万元)。不仅如此,马斯克的xAI还在社交媒体平台X上公开招聘“游戏导师”,时薪高达100美元,专门教他的AI模型Grok如何“打游戏”和设计游戏。
马斯克的赌约是:在2026年底前,推出一款完全由AI生成的伟大游戏。
(图片由AI生成)
对于马斯克而言,游戏只是练兵场。世界模型在3D环境中的表现,将直接关乎他的人形机器人Optimus能否在现实中熟练叠衣,以及特斯拉的FSD(完全自动驾驶)能否处理复杂的物理突发状况。正如英伟达所言:世界模型的潜在市场规模,几乎等同于现有的全球经济规模。
5. 1900亿美元的诱惑与10亿美元的豪赌
为什么巨头们都盯上了游戏?
根据Newzoo的数据,全球视频游戏产业今年预计将产生近1900亿美元的营收。但在光鲜的数据背后,是日益难以为继的成本危机:
· 一款3A大作的开发周期已经延长至5到7年。
· 制作成本动辄超过10亿美元。
· 成千上万的艺术家在机械地进行“磨皮”和“搬砖”等枯燥工作。
(图片由AI生成)
Genie 3项目负责人弗鲁克特预测:“游戏创作将在未来几年内发生彻底改变。”
目前的AI已经能帮开发者把视频游戏的开发速度提升4倍。今年谷歌云的一项调查显示,将近90% 的视频游戏开发者都在使用AI智能体来提高效率。有用户预测,2026年用户可直接提示AI创建类似《上古卷轴》的RPG游戏。
以开发手游《异形大战僵尸:入侵》(Aliens vs Zombies: Invasion)的Game Gears工作室为例,其CEO亚历山大·瓦先科(Alexander Vaschenko)断言:“很快,电影和游戏行业如果不靠AI,将一天也转不下去。”
有用户更是认为,传统3A游戏开发模式已死。现在,AI允许工作室先生成预告片和玩法来测试玩家兴趣,再决定是否投入开发,从而极大降低风险。AI将让游戏行业从动辄数年、数亿美元的开发周期,转向高效的原型测试。
在不久的将来,所谓的“3D建模”和“复杂的开发软件”将成为历史。一个普通玩家坐在电脑前,对着麦克风说:“给我创造一个《指环王》风格的开放世界,但我想要它是粉红色的,”AI就能实时为你构建一个独一无二的游乐场。
(图片由AI生成)
6. 前进的代价?“内容垃圾”与工会的怒火
然而,每一个技术奇点的背后,都投射着阴影。
本月,六个欧洲视频游戏工会发出了愤怒的集体抗议,谴责AI的过度使用。他们认为,公司正在强迫员工使用这些工具,而代价是工作条件的恶化和大规模的裁员。
更大的冲突在于艺术的完整性。批评者担心,当AI世界模型可以无限量产3D环境时,玩家将面对海量的“内容垃圾”——那些看起来精美、符合逻辑,却毫无灵魂、缺乏人类审美温度的平庸之作。
(图片由AI生成)
《博德之门3》开发商Larian Studios的负责人迈克尔·多斯(Michael Douse)就在X上泼了一盆冷水:“游戏行业缺的不是工具,而是领导力和愿景。” 他认为,行业不需要更多“数学生成的、心理学训练的玩法循环”,而是需要人类的情感表达。
7. 结语:在数字世界里“寻找乐趣”
面对争议,DeepMind专家、前育碧制作人亚历山大·穆法雷克(Alexandre Moufarek)给出了一个更温情的视角。
(图片由AI生成)
他回忆起在传统大厂开发游戏的日子:圣诞节临近,由于工期太紧,开发者根本没时间去打磨细节、去Debug,更没时间去实验那些疯狂的新点子。
“我希望世界模型能把时间还给开发者,” 穆法雷克说,“让他们重新去‘寻找乐趣’,去冒险尝试,而不是被重复的体力劳动压垮。”
这番话道出了变革的初衷:让AI承担物理世界的繁重,让人类回归精神世界的创造。
(图片由AI生成)
李飞飞、杨立昆和马斯克殊途同归的背后,是AI进化逻辑的根本性跃迁。从LLM的“鹦鹉学舌”到世界模型的“洞察物理”,AI正在补全它认知拼图中最关键的一块。
在这场豪赌中,游戏产业只是被选中的第一个“幸运儿”。我们正在见证的,不只是游戏开发方式的颠覆,而是AI从“观察者”向“造物者”的惊人蜕变。