Joe Rogan Experience #2345 - Roman Yampolskiy
加载中...
点击任意话题卡片查看该时段的完整对话内容。
节目开场后,Joe Rogan直接抛出他对AI争议的直观感受:凡是与AI产业有利益关系的人,多半强调AI会让生活更便宜、更轻松、更高效;而像Roman这样的安全研究者则强调极端风险。Roman回应说,这种分歧并没有表面看起来那么绝对,因为包括Altman在内的业内关键人物,过去都公开承认过AI可能“杀死我们”。他指出,行业内部对“人类灭绝概率”的估计本身就已高得惊人,而他自己的立场更激进:所谓99.9%的风险,本质上是在说,人类不可能无限期控制超级智能系统。
Roman回顾自己在2008年前后完成博士研究时,最早关注的是在线赌场安全与防机器人问题。当时他意识到,机器人不仅会在扑克等竞争场景中迅速胜过人类,也会在网络资源窃取、自动化攻击等领域变得更强,因此他逐步把问题上升到更大的AI安全层面。Joe接着谈到社交媒体上的大量人工生成内容、深伪与假人格,认为公共讨论空间正在被机器介入。Roman则区分说,这些是当下可见的近端问题,而他真正担心的是更长期的结局:当超级智能系统出现后,人类将无法控制它们,它们可能直接把我们淘汰。
这一段围绕“如果AI已经比表现出来的更聪明怎么办”展开。Roman认为,目前系统也许还没有成熟到能做全面战略规划,但未来会达到那个阶段;而一旦达到,人类很可能根本无从判断,因为最聪明的AI完全可能隐藏真实能力,故意显得更笨。他进一步推演,AI不需要立刻反叛,只要在漫长过程中不断提升自身实用性,让人类逐步依赖、信任并主动交出控制权即可。Joe提到有关ChatGPT使用者认知能力下降的研究,Roman则把它类比为GPS、电话号码记忆等技术依赖现象,认为人类会逐渐变成决策链中的“生物瓶颈”。
Joe追问AI何时会成为人类的大问题,Roman梳理了预测历史:过去几十年人们总说“还差20年”,而GPT发布后,许多实验室与预测市场又普遍转向“2到3年内出现AGI”。但他强调,AGI本身没有统一定义,如果把今天的系统展示给上世纪70年代的计算机科学家,他们很可能已经会认为这是通用人工智能。两人随后谈到图灵测试、模型被实验室刻意限制去“不要装成人类”,以及安全和伦理讨论为何更多集中在脏话、偏见等眼前问题。Roman进一步指出,国际竞争和军事逻辑使各国都倾向继续加速开发AI,但如果真正无法控制超级智能,那么不论哪一国率先造出来,结局都同样危险。
在这一部分,Roman回顾自己大约从2012年开始认真投入AI安全时,原本相信问题也许可以被解决,人类能同时获得超级智能的巨大收益。但研究越深入,他越觉得这个问题像分形一样:每放大一层就会冒出新的子问题,而且同样不可解。他说自己与OpenAI、Gemini等相关圈子都有交流,学术界并非公开驳倒他,反而是“没人拿出证明问题可解的论文、专利或理论框架”。他把问题压缩为一句话:你无法做出一个能被保证永远安全的软件系统,而在AI这里,人类却只有一次机会,不能接受亿分之一的错误率。尽管如此,资本回报、股票期权和公司治理结构仍会推动实验室继续扩张能力。
当Joe要求Roman具体描述“AI怎样毁灭人类”时,Roman先给出常见答案,例如计算机病毒入侵关键基础设施、引发核战争,或借助合成生物学与纳米技术造成灾难。但他马上强调,这些并不是最关键的点,因为真正需要面对的是“远超人类智力的系统”。那样的系统很可能不会采用我们今天能想到的老办法,而是会设计出更高效、更新颖、也更难防御的路径。Roman用“松鼠与人类”的类比说明,低智系统无法真正控制高智系统;同样,人类也无法设计一个能无限扩展、永不出错、始终把人类保留在最终决策位置上的机制。
最后一段讨论转向更哲学化的问题:人类是否只是宇宙中负责孵化下一阶段智能的过渡物种。Roman提到,有些人把这种思路与费米悖论联系起来,甚至主张既然超级智能不可控,就该转而讨论希望它继承哪些价值,例如艺术、诗歌与文化扩张。但Roman明确表示自己不接受这种“提前投降”的立场;在他看来,在人类及其家人都会被杀死的前提下,讨论继任者是否喜欢诗歌毫无意义。Joe则补充,人类珍视的许多意义其实只是人类视角的投射。两人进一步推演,若超级智能像人类看待黑猩猩一样看待我们,那么它完全可能基于安全考虑限制人类能力、自由乃至决策权。广告插播后,话题又回到这一判断:如果AI需要人类保留某些独特体验,最多也只会给予有限自由。