智能应用 影音
未来车产业价值链平台
event

DeepMind发布35万种全新蛋白质结构图谱

DeepMind发布35万种全新蛋白质结构图谱

人工智能(AI)研究实验室DeepMind创造了迄今为止最全面的人类蛋白质图谱。DeepMind是Google母公司Alphabet的子公司,目前其人类基因计划正在为绘制人类基因而努力。

蛋白质是个长且复杂不规则形状的分子,像摺纸一样折叠复杂,在体内执行许多任务,从构建组织到对抗疾病。科学家为了了解蛋白质对身体的运作,因此开始积极研究蛋白质折叠的结构,希望能从中设计新的药物和找出新的治疗方法。 以前,若要确定蛋白质的结构需依赖昂贵且耗时的实验才能知道。但2020年DeepMind表示,可以使用名为AlphaFold的AI软件对蛋白质的结构进行准确预测。现在,DeepMind正向大众发布软件做出的数十万个预测。

DeepMind的首席CEO兼联合创始人Demis Hassabis表示,这是DeepMind十年以来的巅峰。DeepMind从一开始就打算这在AI方面取得突破,并且应用于现实世界的问题,看看科学是否可以加速造福人类。 目前在公共领域有大约180,000种蛋白质结构可用,每一种都已经透过实验方法发现与产生,可透过蛋白质数据库访问。

DeepMind发布对20种不同生物体约35万种蛋白质结构的预测,包括老鼠、果蝇甚至是大肠杆菌。最重要的是,该版本已包括对98%人类蛋白质的预测,约有2万种不同结构,统称为人类蛋白质组,虽然不是人类蛋白质的第一个公共数据集,但是是目前最全面和准确的。

在发布第一批数据后,DeepMind仍计划继续增加蛋白质数据,数据库将由欧洲生命科学生物分子实验室(EMBL)维护。EMBL总干事Edith Heard表示,到2021年底,DeepMind希望发布1亿种蛋白质结构的预测,并且期待数据集能够改变目前人类对生命运作方式的理解。了解蛋白质的结构对各领域的科学家都很有用。这些数据可以应用在设计新药、合成分解新型?创造对病毒或极端天气有抵抗力的农作物。DeepMind的蛋白质预测已被用于医学研究,包括研究SARS-CoV-2。

不过值得注意的是,DeepMind的软件蛋白质结构预测,不是一个已经确定的模型,这意味需要进一步验证结构。不过,由于实验确定蛋白质的结构既昂贵又耗时,且需要仰赖大量反复试验。因此即使是低信度的预测也可以为科学家指明正确的研究方向,节省他们大量的工作。

过去,由于蛋白质太小无法用显微镜检查,因此科学家不得不使用昂贵且复杂的方法,例如核磁共振和或是X射线确定结构。然而,近年来,因为AI,能在已知的蛋白质结构数据集上进行深度训练,使用这些数据进行预测。DeepMind深厚的AI技术和计算资源使计划能够加快进展。2020年,DeepMind参加了CASP国际蛋白质折叠比赛,并击败了其他队伍。而如今,DeepMind的AlphaFold程序自2020年的CASP竞赛以来也已经升级,现在分析计算速度已经提高16倍。

Demis Hassabis表示,现在是发展AI的大好时机,在接下来的十年里,DeepMind希望在AI领域能够取得惊人的突破,加速解决在地球上遇到的问题。

  •     按赞加入DIGITIMES智能医疗粉丝团
更多关键字报导: AI DeepMind