11月7日凌晨,特斯拉股东大会上发生了一件大事。尽管挪威主权财富基金等多家机构明确反对,超过75%的特斯拉股东还是批准了马斯克那份1万亿美元的薪酬方案。
投票结果公布后,现场一片沸腾,股东们高呼"埃隆、埃隆",马斯克本人也兴奋地跳起了舞。特斯拉股价盘后上涨1.69%。
这份为期十年的"业绩对赌"协议,可能把马斯克送上人类首个"万亿美元富豪"的宝座。但要实现这一点,他需要将特斯拉的市值从目前的约1万亿美元推至惊人的8.5万亿美元。
这个薪酬方案的核心逻辑很简单,马斯克的目标涵盖了汽车、完全自动驾驶、无人出租车和人形机器人四大核心业务。这些业务的底层技术,全部指向人工智能。
所以,马斯克能否达到这个目标,关键就在于人工智能技术能否支撑起这个愿景。

但有意思的是,就在资本市场为马斯克欢呼的同时,AI领域的顶尖科学家们却在泼冷水。
今年3月,2018年图灵奖得主、Meta首席AI科学家杨立昆在一档科技播客上发表了一场"爆论","当下人形机器人的所有演示都令人印象深刻,但这些机器人实际上都很蠢。"
他指出,当前既没有能完成猫狗基本任务的机器人,也缺乏家用服务机器人,更未实现完全自主的L5级自动驾驶。

能完成前后空翻的机器人,面对叠衣服、擦桌子等基础任务却频频失误。
杨立昆的批评不是孤立的。今年2月,他在巴黎的2025年人工智能行动峰会上再一次炮轰了生成式AI,"放弃生成式模型,不研究大语言模型,我们没办法只通过文本训练让AI达到人类的智慧水平。"
他认为,现有的大模型运行虽然高效,但推理过程是发散的,生成的token有可能不在合理答案范围内,这也是为什么有些大模型会产生幻觉。虽然现在的很多生成式模型让AI可以通过律师资格考试、解决数学问题,但并不能做家务。
10月底,李飞飞和前谷歌CEO埃里克·施密特在沙特利雅得的一场峰会上展开了一场核心辩论。施密特激进地预测超级智能可能在三年内到来,并将其定义为比全人类智慧总和还要高的存在。

但李飞飞反问,"AI连牛顿都成不了,真正的超级智能可能远未开始。"她强调,真正的智能在于创造力和提出问题的能力,而非简单的知识堆积。
李飞飞一直在推动"空间智能"的概念。11月初,她发表长文指出,现在的大型语言模型主要基于文本数据训练,擅长反刍和检索知识,但缺乏对物理世界的理解和推理能力。
她说语言模型及当今的多模态语言模型的底层表示是一维的,它们在根本上就是操作于离散token的一维序列上。
在处理空间智能问题时,核心是世界的三维本质。虽然多模态大语言模型也能看图像,但它是将其他模态硬塞进这种一维token序列的底层表示中,这种一维且由人类生成的数据,可能无法很好地表示物理世界。

麻省理工学院、芝加哥大学和哈佛大学联合发表的研究论文也在发出类似的警告。这些研究指出,现在的AI无法进行真正的推理,无法发明新的东西或提出自己的科学发现,离接近人类水平的智能还非常遥远。"单纯堆砌算力的大模型,可能永远无法实现通用智能。"
这就形成了一个有趣而深刻的悖论。
特斯拉的业务,不管是无人车、机器人、还是人工智能业务,背后的基础都是人工智能。马斯克如果能配得上这样的巨额工资,那么人工智能就不能是泡沫,技术路线不能出错,不能只画图、回答问题,而是要具有真正的智能。
但如果AI能达到这个高度,能做出最稀缺的富有创造性,需要深刻洞察,因而能创造出巨大财富的决策,那么,既然AI都可以做到,还要企业家何用?企业家即便不能被取代,稀缺性也必然会下降,就不值得资本给出这么高的工资。

反之,如果AI还无法达到这个程度,无法做出洞察人类社会,具有创造性的决策,马斯克的企业家才能仍然极其重要,那么这就意味着,AI的技术路线可能就错了,也就无法支撑起马斯克的业绩。
资本市场其实也有自己的记忆。2000年3月,纳斯达克科技指数达到了历史最高5048点,接着是恐慌性崩盘。到2002年10月,纳斯达克跌去了77%,达到1139的低点。
现在我们知道,互联网整体上不是泡沫,但却是在经历泡沫,在度过"绝望之谷"后,才能最终进入到"平稳高原"。
25年后,纳斯达克科技指数再创新高,达到23901.36。与2000年科技泡沫相比,如今市盈率更健康、货币环境宽松,但AI过度依赖的风险仍然存在。
某种程度上,AI的绝望之谷还未到来,或许泡沫一定会出现,而泡沫一旦破裂,十年时间可能就是不够的。

杨立昆在今年1月的CES 2025上接受采访时说,"我们甚至还远没有达到任何动物(猫或狗)对物理世界的理解水平,它们比我们今天拥有的任何AI系统都更了解物理世界。"
他预测,AI技术到2030年前将迎来进一步的革命,但目前的AI系统依然受限,现有技术难以支撑家用机器人和自动驾驶汽车。
李飞飞也在推动一种全新的技术路线。她和团队创立的World Labs正在研发Marble模型,这是一种"世界模型",能让AI理解三维空间和物理规律。她认为,一个真正的世界模型必须具备生成性、多模态性和交互性,能够根据输入的"动作",预测或输出世界的"下一个状态"。
马斯克的万亿薪酬方案和顶级科学家的质疑,揭示了AI发展的核心矛盾。资本市场押注的是美好愿景,但技术路线的不确定性依然存在。无论如何,这场关于AI未来的争论,将在未来十年给出答案。
