← 返回访谈列表

Demis Hassabis 深度访谈

Demis Hassabis 深度访谈 260506 · 260506

9
话题段落
1334
字幕段落
55m
对话时长
-
核心金句

📋 访谈摘要

加载中...

📖 话题详览

点击任意话题卡片查看该时段的完整对话内容。

AI发展路线:从AlphaFold到根节点问题

Demis Hassabis回顾了DeepMind的根节点问题战略,即通过AI解决关键基础科学问题来解锁大量下游应用。AlphaFold2即将迎来发布五周年,证明了这一路线的可行性。目前DeepMind正在推进多个根节点问题:材料科学(包括室温超导体和更好的电池)、核聚变能源(与Commonwealth Fusion深度合作,帮助控制等离子体和磁体约束,甚至材料设计)、以及量子计算(与Google量子AI团队合作,用机器学习帮助纠错编码,期待未来量子计算反哺AI)。Hassabis特别强调了核聚变的意义——模块化聚变反应堆将提供无限清洁可再生能源,不仅能直接解决能源和气候危机,还能让海水淡化、火箭燃料制备等高能耗项目变得可行。

根节点问题AlphaFold核聚变材料科学

数学能力的悖论:IMO金牌 vs 基础错误

Hassabis讨论了当前AI系统的一个核心矛盾:AI已经能在国际数学奥林匹克(IMO)中获得金牌,解决世界上最优秀的学生才能解答的难题,但同时却在基础的高中数学和逻辑问题上犯错,甚至连国际象棋都下不好。他将这种表现称为'锯齿状智能'(jagged intelligence)——在某些维度达到博士水平,在其他方面却不及高中水平。这种不一致性是当前系统未达到AGI的关键标志。原因可能包括图像tokenize的方式(比如AI可能没有看到每个字母,导致数字数出错),以及推理和思考能力还不够成熟。目前的推理系统在推理时间上已有进步,但还不够一致,不能可靠地用思考时间来复查和验证输出。

AGI数学锯齿状智能推理

从AlphaGo到AlphaZero:AGI的路线图

Hassabis用AlphaGo到AlphaZero的演化来类比当前LLM的发展阶段。当前的LLM更像AlphaGo阶段——从人类知识(互联网数据)出发,压缩成可用模型。但真正需要的是类似AlphaGo中的搜索/思考层,利用模型来指导有用的推理路径和规划。下一步才是AlphaZero阶段——系统自主发现知识。Hassabis认为当前的主要限制不是人类知识的边界,而是不知道如何像AlphaGo那样可靠地使用这些系统。另一个关键缺失是持续学习能力——当前模型训练部署后就不再学习,而真正的AGI需要像人一样在部署后持续学习。

AlphaGoAlphaZero持续学习AGI路径

商业化竞赛 vs 科学研究:得失权衡

Hassabis坦言如果由他决定,会让AI在实验室中停留更长时间,做更多AlphaFold式的工作,甚至攻克癌症。原计划是15-20年前规划的纯科学路线:逐步构建AGI,每步都严格分析安全性和系统行为,同时分支出去做对社会有益的应用。但聊天机器人的规模化改变了轨迹,形成了激烈的商业竞赛——多家商业组织甚至国家都在争抢超越彼此,这让严谨的科学研究变得困难。不过也有好处:更多资源涌入加速了进步,大众只落后最前沿几个月就能体验AI,政府对AI的理解也在加深。Hassabis认为DeepMind在平衡两者——50%精力用于规模化,50%用于创新。

商业化科学研究AI竞赛安全

规模化是否撞墙?

针对'规模化撞墙'的质疑,Hassabis明确表示DeepMind从未真正看到撞墙。他认为人们只看到了其他公司进展放缓,但实际情况是回报率在递减——这并不意味着零回报,而是不再是每代翻倍。目前处于指数增长和渐近线之间的中间地带。Gemini 3的进步证明投资仍有显著回报。数据耗尽的问题可以通过合成数据解决——系统已经足够好,可以自己生成数据,特别是在编程和数学等可验证的领域,理论上可以产生无限数据。DeepMind的优势在于研究优先,拥有最广泛最深入的研究团队,加上TPU等基础设施,50%规模化+50%创新的组合策略使其在困难地形中保持领先。

规模化合成数据GeminiTPU

幻觉问题与置信度评分

Hassabis讨论了即使在Gemini 3这样的顶级模型中,幻觉问题仍然存在——模型有时会在应该拒绝回答时仍然给出答案。他类比AlphaFold的置信度评分机制,认为LLM也需要类似的系统。目前模型越好,越了解自己知道什么,但还需要训练模型输出不确定性。很多幻觉的类型是模型强迫自己回答不应该回答的问题。解决方案需要利用思考步骤和规划步骤来回顾和验证输出——目前模型就像一个人在状态不好时说出脑中第一个想法,而真正需要的是停下来、思考、然后调整。下一个token的概率并不反映整体事实的置信度,这是核心问题。

幻觉置信度推理AlphaFold

世界模型:超越语言的空间理解

Hassabis将世界模型和模拟称为他最长久的热情所在。语言模型对世界的理解超出了预期——语言可能比我们想象的更丰富,包含了更多关于世界的信息。但物理世界的空间动态、空间感知和物理机制很难用文字描述,也不在文字语料库中。Genie项目代表了这一方向的突破,让AI能够理解和生成交互式的物理世界。世界模型与语言模型的结合将是通向更全面智能的关键。这也是机器人、自动驾驶等应用的基础——需要理解物理世界的运行规律,而不仅仅是文字描述。

世界模型Genie语言模型物理理解

AGI的定义与意识之谜

Hassabis探讨了AGI的定义问题,强调一致性是关键标志——AGI应该在各维度表现一致,而非当前的锯齿状。他提出了一个深刻的哲学问题:如果构建了AGI并将其作为心智的模拟,与真实心智对比,我们可能发现什么是人类心智特有的——可能是创造力、情感、梦境或意识。这回到了图灵机的本质问题:宇宙中是否存在不可计算的东西?目前没有人发现不可计算的现象。Hassabis认为意识和智能是不同的东西,当前系统表现出的'智能'不意味着它们有意识体验,但这是一个开放性问题。

AGI定义意识图灵机哲学

AI安全与未来展望

Hassabis在访谈最后部分讨论了AI安全的重要性。他强调在竞争环境中保持科学严谨性的挑战,但DeepMind致力于在推进能力的同时确保安全。他谈到了AI对社会的潜在影响,包括积极面(如保护人们免受社交媒体噪音干扰的AI助手)和需要警惕的方面。Hassabis对AI的未来保持谨慎乐观——相信技术可以为人类带来巨大福祉,但需要负责任地发展,确保安全措施与能力提升同步前进。他认为公众能近距离体验AI的发展是好事情,有助于社会对AI的理解和监管。

AI安全社会责任未来展望