“Curing All Disease 深度访谈 260614

以开放工具加速生物医学研究

▶

开场剪辑概括了 Biohub 的核心理念：不是由一个机构单独治愈疾病，而是为整个科学共同体提供工具。嘉宾强调，理解个体的遗传风险、疾病机制和可干预路径，是精准治疗的基础；同时，开放源码和共享工具能让更多科学家更快参与。片段还提到蛋白质结构预测与蛋白质设计，说明他们关注的是能理解生物系统的通用模型，而非只针对单一靶点的专用模型。

开放科学疾病治疗蛋白质模型科研工具

Biohub 愿景的起点与科学界反馈

▶

主持人提到 Biohub 已成为他们的核心慈善项目，并承诺投入 5 亿美元建设虚拟生物学计划。Priscilla Chan 回顾说，十年前他们思考如何回馈社会时，Mark 希望建立一个能在本世纪末前治愈、预防和管理所有疾病的组织。这个目标最初遭到多位顶尖科学家的嘲笑，但反复追问后，他们发现问题并非目标本身，而是科学研究长期存在孤岛化、论文发表后信息流动慢、实验工具留在个人电脑里无法延续等结构性障碍。

慈善战略科学协作疾病愿景工具缺口

从大学联盟到虚拟生物学计划

▶

Mark 解释，早期 Biohub 模式是把工程师和科学家联合起来，跨多所大学进行长期工具开发。这个模式逐渐验证有效后，CZI 不断加大投入，使科学成为其最主要工作，并从旧金山扩展到纽约、芝加哥等 Biohub。当前统一主题是虚拟生物学：用独特实验数据建模生物系统，从蛋白质开始，最终延伸到细胞和更完整的系统。Mark 强调，生物学不像语言模型那样拥有海量互联网数据，许多关键数据必须通过新成像、细胞工程和炎症测量设备主动创造。

虚拟生物学AI实验室湿实验室数据生成

单细胞数据、CellxGene 与从数据到理解

▶

Priscilla Chan 追溯了 Biohub 与当前 AI 生物学工作的连续性：最早的申请项目围绕单细胞测序，目标是理解单个细胞中 RNA 的表达。起初他们只是资助方法共享，随后资助 Human Cell Atlas，并在科学家难以标注数据时开发了 CellxGene 工具。这个工具逐渐形成社区，吸引外部贡献大量数据，成为许多转录组模型依赖的知识语料。她也承认，早期有人批评这只是“集邮式”收集数据，但大语言模型的兴起让他们看到从海量数据中提取知识、把生物学从发现科学推向工程科学的可能。

单细胞测序Human Cell AtlasCellxGene工程化生物学

Alex Reeves 加入与前沿 AI 生物学机构

▶

Alex Reeves 讲述自己为何认为 Biohub 是推进该使命的正确路径。他在 EvolutionaryScale 已经组建团队、融资并推进模型，但真正打动他的是 Mark 和 Priscilla 将前沿 AI 与前沿生物学深度整合的构想。他认为科学正在进入一个新阶段：AI 系统可以从大规模数据中学习世界模型，也能学习生物学规律。要建设面向下一时代的机构，需要足够规模、合适人才、前沿 AI、前沿生物学以及二者之间的反馈循环。主持人随后把问题引向从 AlphaFold、蛋白质折叠到细胞行为和更大生物系统建模的可扩展性。

Alex Reeves前沿AI机构建设世界模型

分层建模：从蛋白质到细胞系统

▶

Mark 认为，生物建模在每一层都会有质的差异，但必须分层推进。要理解细胞，就需要先理解蛋白质相互作用；要理解免疫系统或多细胞互动，又离不开对细胞的理解。他强调 Biohub 的策略是从构件层级逐步建立模型，而不是直接跳到宏观系统。Priscilla 补充说，他们有意把 AI 团队和湿实验团队做成一个统一体系，通过空间转录组、透明斑马鱼发育观察、细胞间通信传感器等实验，收集能连接不同生物层级的数据，帮助模型形成跨层“结缔组织”。

分层建模蛋白质互作细胞系统实验数据

连接还原论与系统生物学

▶

主持人以自身生物学背景说明，传统实验中发育生物学、分子生物学等领域常各自为政，缺少跨层整合。对话随后指出，生物学长期存在还原论视角与系统视角的分离，而 Biohub 的价值之一就是把二者连接起来。Alex Reeves 进一步提出，当前进入了生物学中的信息理论时代：每个复杂层级都由更低层级构成，若想让数字系统真正回答实验室中会提出的新问题，就必须在每个层级收集信息，并以足够规模揭示底层信息架构。

系统生物学还原论信息理论数字实验

机制可解释性与模型中的生物学知识

▶

最后一段聚焦机制可解释性。主持人指出，与复现人类行为的许多 AI 任务不同，生物学仍有大量未知，因此模型是否能揭示新知识尤其重要。Alex Reeves 解释说，机制可解释性过去常用于理解大语言模型的表示空间，而在蛋白质语言模型中，模型仅通过蛋白质序列代码训练，却能涌现出生物结构和功能的表示。这些模型学习了已知和未知生物学中的底层结构语法，因此有机会把我们完全不了解的蛋白质，与已有知识的蛋白质联系起来，并打开黑箱理解模型所表示的生物机制。

机制可解释性蛋白质语言模型模型黑箱生物知识发现

“Curing All Disease 深度访谈

📋 访谈摘要

📖 话题详览

以开放工具加速生物医学研究

📝 该时段完整对话

Biohub 愿景的起点与科学界反馈

📝 该时段完整对话

从大学联盟到虚拟生物学计划

📝 该时段完整对话

单细胞数据、CellxGene 与从数据到理解

📝 该时段完整对话

Alex Reeves 加入与前沿 AI 生物学机构

📝 该时段完整对话

分层建模：从蛋白质到细胞系统

📝 该时段完整对话

连接还原论与系统生物学

📝 该时段完整对话

机制可解释性与模型中的生物学知识

📝 该时段完整对话