谷歌最新人工智能软件阿尔法折叠(Alpha Fold),在一项极其困难的任务中击败了所有对手,成功根据基因序列预测了生命基本分子——蛋白质的三维结构。
这意味着,人工智能已经深度进入基因和蛋白质领域,这既是医疗、药物和生命科学与AI联姻的一种突破,也表明AI在维护人们健康、延长寿命和提高生命质量方面有了稳步进展。
阿尔法折叠是被设计来解析蛋白质折叠的。生物体和人体拥有着各种各样的蛋白质,它们承担着身体各种复杂且重要的功能,从食物消化到免疫抗病,从感觉到运动功能等,都离不开蛋白质。
蛋白质是由氨基酸构成的,基因则是编码氨基酸并生成蛋白质的“码农”。由于基因编码和蛋白质功能的不同,蛋白质的分子结构会有千差万别。执行复杂生命和生理功能的一些蛋白质分子很大,需要折叠起来才能贮存于组织和细胞并发挥功能。而蛋白质折叠更是有无穷的形式。
实际上,一个简单的蛋白质往往包含了数百个氨基酸,其空间结构的可能性就高达10的300次方个。不只是蛋白质中氨基酸序列决定生命现象和疾病,而且蛋白质的空间结构同样决定生理功能和疾病,只要蛋白质的结构发生一点错误,就会诱发和导致各种疾病,如糖尿病、帕金森症和阿尔茨海默病等。
也因此,解析蛋白质结构已成为基因测序后,诊断疾病、研发新药和深入理解生命现象的一把重要钥匙。阿尔法折叠通过人工智能算法,在去年底的一项有98名参赛者参加的解析蛋白质结构的竞赛中赢得第一名,获得了43种蛋白质中的25种蛋白质结构的最高分,排名第二的队伍只有其中3个获得了预测最高分。
这说明,阿尔法折叠在解析和预测蛋白质结构上比较准确。这也昭示着,对疾病的诊断和研发新药有了新的利器。
不过,阿尔法折叠并非是唯一能分析和预测蛋白质结构的工具,其他方法也能分析蛋白质结构,如X射线晶体衍射分析、核磁共振、冷冻电镜等技术,而且冷冻电镜技术由于能确定溶液中的蛋白质分子的高分辨率结构,还获得了2017年诺贝尔化学奖。
可与阿尔法折叠的AI技术相比,其他技术都有较大的短板,既耗时又昂贵。而如果用计算机算法来分析和处理海量的蛋白质三维结构,就有可能既快又准确。阿尔法折叠正是现在通过算法来解析蛋白质结构的佼佼者。
进一步而言,以阿尔法折叠为代表的AI不只是可以既快又准确地分析已知的一些蛋白质的三维结构,还能预测和发现人们尚未知晓的蛋白质结构。因为,蛋白质可分为若干种同源家族,来自同一家族的蛋白质长相十分相似。即使这个家族中没有任何的已知结构,人工智能也能根据这些已有的序列勾勒出这个蛋白质家族的整体概况,预测这个蛋白质家族的一些未知结构。
不过,阿尔法折叠的最大进步是通过算法来找到蛋白质的三维形状。一段基因序列(DNA片段)只构成了氨基酸按一定序列排成的长链,仅仅靠基因测序是无法获知蛋白质结构的,这就需要阿尔法折叠以算法来确认蛋白质的三维结构。
从理论上,能够分析和预测蛋白质的形状和结构,就能够更好地确定其他分子与蛋白质结合的方式,也就可能研发新的药物,因为药物是在人体内与特殊的蛋白质结合并改变蛋白质的活动方式而发挥药效的。从这个意义上来看,阿尔法折叠能解析蛋白质折叠问题,也仅仅是一个新的开端,要研发出新药或产生新的治疗疾病的方式,还有很长的路要走。
当然,阿尔法折叠和其他AI技术都主要是通过算法来理解疾病和改进药物治疗的效果,预测和分析蛋白质折叠尚不能解决蛋白质折叠问题。因此,现阶段比阿尔法折叠走得更远和应用得更成熟的是让AI软件诊断疾病,如癌症。已经有人工智能软件在解析乳腺X光图片时比普通医生快30倍,其准确率更是高达99%。
当阿尔法折叠和其他AI技术能诊断疾病,确定病因时,就可以既采用新的疗法,如基因疗法,修改和删除致病基因,进而让返老还童成为可能,又有可能研发出针对蛋白质三维结构的新药来治疗疾病。现在,人工智能介入医学和生命科学才只是开始。