马斯克拿1万亿薪酬, 图灵奖得主却说AI是泡沫, 谁在撒谎?

11月7日凌晨，特斯拉股东大会上发生了一件大事。尽管挪威主权财富基金等多家机构明确反对，超过75%的特斯拉股东还是批准了马斯克那份1万亿美元的薪酬方案。

投票结果公布后，现场一片沸腾，股东们高呼"埃隆、埃隆"，马斯克本人也兴奋地跳起了舞。特斯拉股价盘后上涨1.69%。

这份为期十年的"业绩对赌"协议，可能把马斯克送上人类首个"万亿美元富豪"的宝座。但要实现这一点，他需要将特斯拉的市值从目前的约1万亿美元推至惊人的8.5万亿美元。

这个薪酬方案的核心逻辑很简单，马斯克的目标涵盖了汽车、完全自动驾驶、无人出租车和人形机器人四大核心业务。这些业务的底层技术，全部指向人工智能。

所以，马斯克能否达到这个目标，关键就在于人工智能技术能否支撑起这个愿景。

但有意思的是，就在资本市场为马斯克欢呼的同时，AI领域的顶尖科学家们却在泼冷水。

今年3月，2018年图灵奖得主、Meta首席AI科学家杨立昆在一档科技播客上发表了一场"爆论"，"当下人形机器人的所有演示都令人印象深刻，但这些机器人实际上都很蠢。"

他指出，当前既没有能完成猫狗基本任务的机器人，也缺乏家用服务机器人，更未实现完全自主的L5级自动驾驶。

能完成前后空翻的机器人，面对叠衣服、擦桌子等基础任务却频频失误。

杨立昆的批评不是孤立的。今年2月，他在巴黎的2025年人工智能行动峰会上再一次炮轰了生成式AI，"放弃生成式模型，不研究大语言模型，我们没办法只通过文本训练让AI达到人类的智慧水平。"

他认为，现有的大模型运行虽然高效，但推理过程是发散的，生成的token有可能不在合理答案范围内，这也是为什么有些大模型会产生幻觉。虽然现在的很多生成式模型让AI可以通过律师资格考试、解决数学问题，但并不能做家务。

10月底，李飞飞和前谷歌CEO埃里克·施密特在沙特利雅得的一场峰会上展开了一场核心辩论。施密特激进地预测超级智能可能在三年内到来，并将其定义为比全人类智慧总和还要高的存在。

但李飞飞反问，"AI连牛顿都成不了，真正的超级智能可能远未开始。"她强调，真正的智能在于创造力和提出问题的能力，而非简单的知识堆积。

李飞飞一直在推动"空间智能"的概念。11月初，她发表长文指出，现在的大型语言模型主要基于文本数据训练，擅长反刍和检索知识，但缺乏对物理世界的理解和推理能力。

她说语言模型及当今的多模态语言模型的底层表示是一维的，它们在根本上就是操作于离散token的一维序列上。

在处理空间智能问题时，核心是世界的三维本质。虽然多模态大语言模型也能看图像，但它是将其他模态硬塞进这种一维token序列的底层表示中，这种一维且由人类生成的数据，可能无法很好地表示物理世界。

麻省理工学院、芝加哥大学和哈佛大学联合发表的研究论文也在发出类似的警告。这些研究指出，现在的AI无法进行真正的推理，无法发明新的东西或提出自己的科学发现，离接近人类水平的智能还非常遥远。"单纯堆砌算力的大模型，可能永远无法实现通用智能。"

这就形成了一个有趣而深刻的悖论。

特斯拉的业务，不管是无人车、机器人、还是人工智能业务，背后的基础都是人工智能。马斯克如果能配得上这样的巨额工资，那么人工智能就不能是泡沫，技术路线不能出错，不能只画图、回答问题，而是要具有真正的智能。

但如果AI能达到这个高度，能做出最稀缺的富有创造性，需要深刻洞察，因而能创造出巨大财富的决策，那么，既然AI都可以做到，还要企业家何用？企业家即便不能被取代，稀缺性也必然会下降，就不值得资本给出这么高的工资。

反之，如果AI还无法达到这个程度，无法做出洞察人类社会，具有创造性的决策，马斯克的企业家才能仍然极其重要，那么这就意味着，AI的技术路线可能就错了，也就无法支撑起马斯克的业绩。

资本市场其实也有自己的记忆。2000年3月，纳斯达克科技指数达到了历史最高5048点，接着是恐慌性崩盘。到2002年10月，纳斯达克跌去了77%，达到1139的低点。

现在我们知道，互联网整体上不是泡沫，但却是在经历泡沫，在度过"绝望之谷"后，才能最终进入到"平稳高原"。

25年后，纳斯达克科技指数再创新高，达到23901.36。与2000年科技泡沫相比，如今市盈率更健康、货币环境宽松，但AI过度依赖的风险仍然存在。

某种程度上，AI的绝望之谷还未到来，或许泡沫一定会出现，而泡沫一旦破裂，十年时间可能就是不够的。

杨立昆在今年1月的CES 2025上接受采访时说，"我们甚至还远没有达到任何动物（猫或狗）对物理世界的理解水平，它们比我们今天拥有的任何AI系统都更了解物理世界。"

他预测，AI技术到2030年前将迎来进一步的革命，但目前的AI系统依然受限，现有技术难以支撑家用机器人和自动驾驶汽车。

李飞飞也在推动一种全新的技术路线。她和团队创立的World Labs正在研发Marble模型，这是一种"世界模型"，能让AI理解三维空间和物理规律。她认为，一个真正的世界模型必须具备生成性、多模态性和交互性，能够根据输入的"动作"，预测或输出世界的"下一个状态"。

马斯克的万亿薪酬方案和顶级科学家的质疑，揭示了AI发展的核心矛盾。资本市场押注的是美好愿景，但技术路线的不确定性依然存在。无论如何，这场关于AI未来的争论，将在未来十年给出答案。