dailyorder
活动+
 

哈佛机器学习模型预测蛋白质结构 速度较传统方法快100万倍

哈佛团队开发的AI模型预测蛋白质结构的速度比现有技术快100万倍。哈佛医学院

组织、肌肉、酶和抗体的蛋白质配方是以DNA编码,并定义其3D结构和功能,但很难预测氨基酸成分如何的交互作用,科学家估计需花上138亿年才能找出典型蛋白质数千种氨基酸的所有可能结构。好消息是哈佛医学院(Harvard Medical School)科学家已开发出能,预测速度比现有技术快100万倍的人工智慧(AI)系统。

据VentureBeat及Interesting Engineering报导,该系统能有效预测任何蛋白质的结构,并能在不牺牲准确性的情况下,预测速度比现有技术快100万倍。

HMS Blavatnik研究所系统生物学研究领导人Mohammed AlQuraishi表示,蛋白质是由20种不同氨基酸所构成,在物理上接近的3D空间中被组合成环、螺旋、片等子结构。氨基酸尊重物理定律,寻求能量有利状态,因此得以预测。

之前的方法将新的氨基酸序列映射到预定义的模板上,或透过基因组数据筛选以监定可能一起进化的序列,但这些系统无法确定缺乏先验知识的结构。

哈佛研究团队采用了可变学习这种机器学习方法来发现蛋白质序列与其结构之间的关系。其复发几何网络仅由几千行计算机程序码组成,可预测连接氨基酸的化学键的最可能角度和围绕这些键的旋转角度。

经过几个月的数千种蛋白质培训,该AI系统在最近几年的CASP中表现优于所有其它方法,能预测无预先存在模板的蛋白质结构,并超越使用预先存在模板的最佳模型。此外,该系统预测的速度仅几毫秒,比需要数小时的现有技术快6~7个数量级。

但该模型对商业应用来说仍不够准确,需要进一步优化。AlQuraishi认为有许多方法可优化该模型,例如进一步集成化学和物理定律,使其能补足现有方法,预测更广泛的蛋白质结构。

  •     按赞加入DIGITIMES智能医疗粉丝团
更多关键字报导: 机器学习