AutoGrad Changed Everything (Not Transformers) [Dr. Jeff Beck]
加载中...
点击任意话题卡片查看该时段的完整对话内容。
Jeff Beck 先介绍自己的数学博士背景,以及早期研究复杂系统中的模式形成和燃烧合成。随后他说明贝叶斯推断为何对自己重要:它不仅是一套统计方法,更是一种关于经验世界的规范性思考方式。他回忆 Zoubin Ghahramani 关于 Dirichlet process prior 的讲解,认为其中“新数据如何与旧数据归类、形成理论并检验假设”的过程,正好概括了科学方法的核心。
嘉宾进一步讨论“贝叶斯大脑”的证据。他说真正让他相信大脑具有贝叶斯特征的,并不是抽象理论,而是人类和动物在低层感知运动任务中的行为实验,尤其是多线索整合实验。实验显示,当视觉与听觉等线索可靠性逐次变化时,人们仍会根据相对可靠性加权整合信息,表现得仿佛考虑了不确定性并进行了近似最优推断。
主持人提出“大脑 90% 的工作是决定忽略什么”,嘉宾回应说,人确实接收了海量信息,其中许多不会直接表现为行为,但仍可能用于维持低层统计表征。例如长期闭眼会使视觉系统衰退,说明大脑需要持续输入来维护对视觉世界统计规律的理解。他还把这种机制与自监督、无监督学习类比,认为大脑也在利用输入形成类似语言模型先验的背景知识。中间广告则把高质量人类反馈描述为可被基础设施化和民主化的数据资源。
话题转向“大脑是计算机”或“大脑是预测机器”等宏大隐喻。嘉宾认为,人类总会用当时最先进的技术来解释大脑:古代是杠杆滑轮,中世纪是体液,如今则是计算机。他进一步谈到宇宙是否是机器、语言模型为何多为自回归,以及物理学中动量为何有用。核心观点是,许多模型并不必然揭示世界本体如何运作,而是因为它们在数学和计算上方便、紧凑且有效。
主持人追问偏好因果关系模型的好处。嘉宾解释说,因果关系可以减少需要追踪的变量数量,使模型更接近马尔可夫式的简化系统,从而便于迭代预测。更重要的是,如果一个系统需要行动,就必须预测行动后果;越能把行动与真正影响世界的因果因素连接起来,模型越能指导有效干预。因此,因果模型既有模拟上的简洁性,也能指出应在哪里介入以达成目标。
嘉宾讨论微观与宏观因果的区别。他指出,真正识别因果关系通常需要干预,但人们关心的因果关系往往是与自身可行动范围相匹配的关系。微观因果即使真实,如果没有能在该尺度操作的工具,也难以直接有用。人类的特殊之处在于能用技术扩展行动能力,例如通过工具进入核能等微观尺度。因而因果分析带有工具性:我们优先理解能被操控、能改变现实结果的层级。
最后讨论心智是否是特殊案例,以及“向下因果”如何理解。嘉宾以工具主义角度说明,向下因果不是被当作本体结论,而是用来检验某个宏观划分是否合理:如果把许多微观元素圈定为一个宏观对象后,该宏观描述能总结系统整体行为,并使微观细节在进一步预测中变得不重要,那么这个划分就有价值。他还指出,意向性虽有解释力,但只有当我们能描述它如何随时间演化并做出长期预测时,才是好的宏观变量;法律语境中把人固定为“坏人”的做法让他不安。