← 返回访谈列表

“Curing All Disease 深度访谈

“Curing All Disease by next century is too conservative" - Mark Zuckerberg

8
话题段落
1594
字幕段落
56m
对话时长
-
核心金句

📋 访谈摘要

加载中...

📖 话题详览

点击任意话题卡片查看该时段的完整对话内容。

以开放工具加速生物医学研究

开场剪辑概括了 Biohub 的核心理念:不是由一个机构单独治愈疾病,而是为整个科学共同体提供工具。嘉宾强调,理解个体的遗传风险、疾病机制和可干预路径,是精准治疗的基础;同时,开放源码和共享工具能让更多科学家更快参与。片段还提到蛋白质结构预测与蛋白质设计,说明他们关注的是能理解生物系统的通用模型,而非只针对单一靶点的专用模型。

开放科学疾病治疗蛋白质模型科研工具

Biohub 愿景的起点与科学界反馈

主持人提到 Biohub 已成为他们的核心慈善项目,并承诺投入 5 亿美元建设虚拟生物学计划。Priscilla Chan 回顾说,十年前他们思考如何回馈社会时,Mark 希望建立一个能在本世纪末前治愈、预防和管理所有疾病的组织。这个目标最初遭到多位顶尖科学家的嘲笑,但反复追问后,他们发现问题并非目标本身,而是科学研究长期存在孤岛化、论文发表后信息流动慢、实验工具留在个人电脑里无法延续等结构性障碍。

慈善战略科学协作疾病愿景工具缺口

从大学联盟到虚拟生物学计划

Mark 解释,早期 Biohub 模式是把工程师和科学家联合起来,跨多所大学进行长期工具开发。这个模式逐渐验证有效后,CZI 不断加大投入,使科学成为其最主要工作,并从旧金山扩展到纽约、芝加哥等 Biohub。当前统一主题是虚拟生物学:用独特实验数据建模生物系统,从蛋白质开始,最终延伸到细胞和更完整的系统。Mark 强调,生物学不像语言模型那样拥有海量互联网数据,许多关键数据必须通过新成像、细胞工程和炎症测量设备主动创造。

虚拟生物学AI实验室湿实验室数据生成

单细胞数据、CellxGene 与从数据到理解

Priscilla Chan 追溯了 Biohub 与当前 AI 生物学工作的连续性:最早的申请项目围绕单细胞测序,目标是理解单个细胞中 RNA 的表达。起初他们只是资助方法共享,随后资助 Human Cell Atlas,并在科学家难以标注数据时开发了 CellxGene 工具。这个工具逐渐形成社区,吸引外部贡献大量数据,成为许多转录组模型依赖的知识语料。她也承认,早期有人批评这只是“集邮式”收集数据,但大语言模型的兴起让他们看到从海量数据中提取知识、把生物学从发现科学推向工程科学的可能。

单细胞测序Human Cell AtlasCellxGene工程化生物学

Alex Reeves 加入与前沿 AI 生物学机构

Alex Reeves 讲述自己为何认为 Biohub 是推进该使命的正确路径。他在 EvolutionaryScale 已经组建团队、融资并推进模型,但真正打动他的是 Mark 和 Priscilla 将前沿 AI 与前沿生物学深度整合的构想。他认为科学正在进入一个新阶段:AI 系统可以从大规模数据中学习世界模型,也能学习生物学规律。要建设面向下一时代的机构,需要足够规模、合适人才、前沿 AI、前沿生物学以及二者之间的反馈循环。主持人随后把问题引向从 AlphaFold、蛋白质折叠到细胞行为和更大生物系统建模的可扩展性。

Alex Reeves前沿AI机构建设世界模型

分层建模:从蛋白质到细胞系统

Mark 认为,生物建模在每一层都会有质的差异,但必须分层推进。要理解细胞,就需要先理解蛋白质相互作用;要理解免疫系统或多细胞互动,又离不开对细胞的理解。他强调 Biohub 的策略是从构件层级逐步建立模型,而不是直接跳到宏观系统。Priscilla 补充说,他们有意把 AI 团队和湿实验团队做成一个统一体系,通过空间转录组、透明斑马鱼发育观察、细胞间通信传感器等实验,收集能连接不同生物层级的数据,帮助模型形成跨层“结缔组织”。

分层建模蛋白质互作细胞系统实验数据

连接还原论与系统生物学

主持人以自身生物学背景说明,传统实验中发育生物学、分子生物学等领域常各自为政,缺少跨层整合。对话随后指出,生物学长期存在还原论视角与系统视角的分离,而 Biohub 的价值之一就是把二者连接起来。Alex Reeves 进一步提出,当前进入了生物学中的信息理论时代:每个复杂层级都由更低层级构成,若想让数字系统真正回答实验室中会提出的新问题,就必须在每个层级收集信息,并以足够规模揭示底层信息架构。

系统生物学还原论信息理论数字实验

机制可解释性与模型中的生物学知识

最后一段聚焦机制可解释性。主持人指出,与复现人类行为的许多 AI 任务不同,生物学仍有大量未知,因此模型是否能揭示新知识尤其重要。Alex Reeves 解释说,机制可解释性过去常用于理解大语言模型的表示空间,而在蛋白质语言模型中,模型仅通过蛋白质序列代码训练,却能涌现出生物结构和功能的表示。这些模型学习了已知和未知生物学中的底层结构语法,因此有机会把我们完全不了解的蛋白质,与已有知识的蛋白质联系起来,并打开黑箱理解模型所表示的生物机制。

机制可解释性蛋白质语言模型模型黑箱生物知识发现