


随着诺贝尔奖季节的临近,科学家们最喜欢猜测的事情莫过于猜测谁将获得诺贝尔奖。今年提出的一种可能性——就像最近经常出现的情况一样,既可能是化学奖,也可能是医学奖/生理学奖——是对一种名为AlphaFold的计算机算法的奖励,该算法利用人工智能来预测蛋白质分子的形状,而这仅仅是基于对构成蛋白质分子的组成单元(氨基酸)序列的了解。
AlphaFold是由人工智能公司DeepMind设计的,该公司是谷歌的子公司,由计算机科学家Demis Hassabis领导。该算法于2018年首次公布,似乎最终解决了现代分子生物学中最具挑战性和最令人垂涎的目标之一:找出蛋白质序列(可以从DNA中相应的基因序列推断出)与其三维结构之间的联系。
这种结构为这种分子的生物学功能提供了重要线索。许多蛋白质是促进细胞生化反应的酶,并引导它们走向所需的结果。如果我们知道一种酶的结构,我们或许就能设计出形状合适的药物分子,与蛋白质结合,并干预其功能,例如阻止它进行一些对健康有害的过程。传统上,计算蛋白质的结构依赖于一种叫做x射线晶体学的技术,这种技术很费力,而且只有在蛋白质可以结晶的情况下才有效(不是所有的蛋白质都可以)。现在也有其他方法来测定蛋白质结构,但仍然是一项艰苦的工作。
AlphaFold似乎让所有这些努力都过时了。2022年,研究人员使用该算法预测了超过2亿种蛋白质的结构——比实验发现的蛋白质多1000倍,几乎涵盖了所有已知的蛋白质。更棒的是,DeepMind团队现在对AlphaFold进行了调整,使其能够预测蛋白质之间以及蛋白质与DNA和脂质等其他生物分子之间的相互作用。
那么,现在所有的分子生物学都可以在电脑上按下一个按钮来解释吗?不完全是。首先,AlphaFold的结构预测质量参差不齐,而且并不总是在足够精确的细节上与实验结果相匹配,无法可靠地用于药物发现。更重要的是,结构并不能决定一切:一些蛋白质的功能在很大程度上取决于它们的摆动和松弛。更重要的是,在通往有效药物的漫长而艰难的道路上,找到与蛋白质结合的候选药物分子只是第一步;通常情况下,这种结合不会在生理水平上产生影响。AlphaFold看起来肯定会成为药物发现的有用工具,但远非万灵药。
事实可能会证明,它最大的价值在别处。最令人兴奋的前景之一是反向使用该算法:选择一种特定的蛋白质形状,然后找出哪种序列将产生它。通过这种方式,研究人员可以设计出与自然界中发现的蛋白质分子非常不同的蛋白质分子,这些蛋白质分子可能能够执行全新的酶促任务,或者充当新材料的构建块(例如,丝绸就是一种天然蛋白质材料)。华盛顿大学(University of Washington)的生物化学家戴维?贝克(David Baker)是该领域的领军人物,有消息称他将与哈萨比斯一起登上诺贝尔奖的名单:两位研究人员都获得了突破奖(Breakthrough Prize),这一国际奖项的奖金分别为300万美元,由亿万富翁企业家尤里?米尔纳(Yuri Milner)资助。Baker的团队将AlphaFold与他们自己的软件结合起来,设计出任意的、非自然形状的蛋白质,比如环状结构,然后显示出具有这些定制序列的真正蛋白质确实可以折叠成目标形状。
AlphaFold还可能有助于回答生物学中的基本问题。格拉斯哥大学(University of Glasgow)的一个研究小组利用该技术研究出了黄病毒(包括导致丙型肝炎和登革热的黄病毒)使用的蛋白质结构,从而发现了不同病毒病原体之间的进化联系,这种联系从基因组上看并不明显(非常不同的基因组序列可以编码功能相似的蛋白质)。研究人员推断,这些病毒中的一些显然在其进化史上从细菌中捕获了一种至关重要的感染酶。这类信息可能有助于开发针对这些潜在致命疾病的疫苗。
就我个人而言,我怀疑AlphaFold是否能获得诺贝尔奖。但它的时代可能会到来。