Demis Hassabis 深度访谈 260506

AI发展路线：从AlphaFold到根节点问题

▶

Demis Hassabis回顾了DeepMind的根节点问题战略，即通过AI解决关键基础科学问题来解锁大量下游应用。AlphaFold2即将迎来发布五周年，证明了这一路线的可行性。目前DeepMind正在推进多个根节点问题：材料科学（包括室温超导体和更好的电池）、核聚变能源（与Commonwealth Fusion深度合作，帮助控制等离子体和磁体约束，甚至材料设计）、以及量子计算（与Google量子AI团队合作，用机器学习帮助纠错编码，期待未来量子计算反哺AI）。Hassabis特别强调了核聚变的意义——模块化聚变反应堆将提供无限清洁可再生能源，不仅能直接解决能源和气候危机，还能让海水淡化、火箭燃料制备等高能耗项目变得可行。

根节点问题AlphaFold核聚变材料科学

数学能力的悖论：IMO金牌 vs 基础错误

▶

Hassabis讨论了当前AI系统的一个核心矛盾：AI已经能在国际数学奥林匹克（IMO）中获得金牌，解决世界上最优秀的学生才能解答的难题，但同时却在基础的高中数学和逻辑问题上犯错，甚至连国际象棋都下不好。他将这种表现称为'锯齿状智能'（jagged intelligence）——在某些维度达到博士水平，在其他方面却不及高中水平。这种不一致性是当前系统未达到AGI的关键标志。原因可能包括图像tokenize的方式（比如AI可能没有看到每个字母，导致数字数出错），以及推理和思考能力还不够成熟。目前的推理系统在推理时间上已有进步，但还不够一致，不能可靠地用思考时间来复查和验证输出。

AGI数学锯齿状智能推理

从AlphaGo到AlphaZero：AGI的路线图

▶

Hassabis用AlphaGo到AlphaZero的演化来类比当前LLM的发展阶段。当前的LLM更像AlphaGo阶段——从人类知识（互联网数据）出发，压缩成可用模型。但真正需要的是类似AlphaGo中的搜索/思考层，利用模型来指导有用的推理路径和规划。下一步才是AlphaZero阶段——系统自主发现知识。Hassabis认为当前的主要限制不是人类知识的边界，而是不知道如何像AlphaGo那样可靠地使用这些系统。另一个关键缺失是持续学习能力——当前模型训练部署后就不再学习，而真正的AGI需要像人一样在部署后持续学习。

AlphaGoAlphaZero持续学习AGI路径

商业化竞赛 vs 科学研究：得失权衡

▶

Hassabis坦言如果由他决定，会让AI在实验室中停留更长时间，做更多AlphaFold式的工作，甚至攻克癌症。原计划是15-20年前规划的纯科学路线：逐步构建AGI，每步都严格分析安全性和系统行为，同时分支出去做对社会有益的应用。但聊天机器人的规模化改变了轨迹，形成了激烈的商业竞赛——多家商业组织甚至国家都在争抢超越彼此，这让严谨的科学研究变得困难。不过也有好处：更多资源涌入加速了进步，大众只落后最前沿几个月就能体验AI，政府对AI的理解也在加深。Hassabis认为DeepMind在平衡两者——50%精力用于规模化，50%用于创新。

商业化科学研究AI竞赛安全

规模化是否撞墙？

▶

针对'规模化撞墙'的质疑，Hassabis明确表示DeepMind从未真正看到撞墙。他认为人们只看到了其他公司进展放缓，但实际情况是回报率在递减——这并不意味着零回报，而是不再是每代翻倍。目前处于指数增长和渐近线之间的中间地带。Gemini 3的进步证明投资仍有显著回报。数据耗尽的问题可以通过合成数据解决——系统已经足够好，可以自己生成数据，特别是在编程和数学等可验证的领域，理论上可以产生无限数据。DeepMind的优势在于研究优先，拥有最广泛最深入的研究团队，加上TPU等基础设施，50%规模化+50%创新的组合策略使其在困难地形中保持领先。

规模化合成数据GeminiTPU

幻觉问题与置信度评分

▶

Hassabis讨论了即使在Gemini 3这样的顶级模型中，幻觉问题仍然存在——模型有时会在应该拒绝回答时仍然给出答案。他类比AlphaFold的置信度评分机制，认为LLM也需要类似的系统。目前模型越好，越了解自己知道什么，但还需要训练模型输出不确定性。很多幻觉的类型是模型强迫自己回答不应该回答的问题。解决方案需要利用思考步骤和规划步骤来回顾和验证输出——目前模型就像一个人在状态不好时说出脑中第一个想法，而真正需要的是停下来、思考、然后调整。下一个token的概率并不反映整体事实的置信度，这是核心问题。

幻觉置信度推理AlphaFold

世界模型：超越语言的空间理解

▶

Hassabis将世界模型和模拟称为他最长久的热情所在。语言模型对世界的理解超出了预期——语言可能比我们想象的更丰富，包含了更多关于世界的信息。但物理世界的空间动态、空间感知和物理机制很难用文字描述，也不在文字语料库中。Genie项目代表了这一方向的突破，让AI能够理解和生成交互式的物理世界。世界模型与语言模型的结合将是通向更全面智能的关键。这也是机器人、自动驾驶等应用的基础——需要理解物理世界的运行规律，而不仅仅是文字描述。

世界模型Genie语言模型物理理解

AGI的定义与意识之谜

▶

Hassabis探讨了AGI的定义问题，强调一致性是关键标志——AGI应该在各维度表现一致，而非当前的锯齿状。他提出了一个深刻的哲学问题：如果构建了AGI并将其作为心智的模拟，与真实心智对比，我们可能发现什么是人类心智特有的——可能是创造力、情感、梦境或意识。这回到了图灵机的本质问题：宇宙中是否存在不可计算的东西？目前没有人发现不可计算的现象。Hassabis认为意识和智能是不同的东西，当前系统表现出的'智能'不意味着它们有意识体验，但这是一个开放性问题。

AGI定义意识图灵机哲学

AI安全与未来展望

▶

Hassabis在访谈最后部分讨论了AI安全的重要性。他强调在竞争环境中保持科学严谨性的挑战，但DeepMind致力于在推进能力的同时确保安全。他谈到了AI对社会的潜在影响，包括积极面（如保护人们免受社交媒体噪音干扰的AI助手）和需要警惕的方面。Hassabis对AI的未来保持谨慎乐观——相信技术可以为人类带来巨大福祉，但需要负责任地发展，确保安全措施与能力提升同步前进。他认为公众能近距离体验AI的发展是好事情，有助于社会对AI的理解和监管。

AI安全社会责任未来展望

Demis Hassabis 深度访谈

📋 访谈摘要

📖 话题详览

AI发展路线：从AlphaFold到根节点问题

📝 该时段完整对话

数学能力的悖论：IMO金牌 vs 基础错误

📝 该时段完整对话

从AlphaGo到AlphaZero：AGI的路线图

📝 该时段完整对话

商业化竞赛 vs 科学研究：得失权衡

📝 该时段完整对话

规模化是否撞墙？

📝 该时段完整对话

幻觉问题与置信度评分

📝 该时段完整对话

世界模型：超越语言的空间理解

📝 该时段完整对话

AGI的定义与意识之谜

📝 该时段完整对话

AI安全与未来展望

📝 该时段完整对话