蛋白结构预测终于等来了春天
2018年11月30日,两年一度的国际蛋白质结构预测竞赛(CASP)开始。来自世界各地的数百支团队参与,对一些组委会选中蛋白结构进行定量地预测。 阿尔法狗匿名第一次参加该比赛,初出茅庐的阿尔法狗 比人类参赛的最优秀团队的成绩高出一大截,这是阿尔法狗初次参与科研解蛋白结构,已经能够显示出来绝对的实力和优势。
蛋白结构与功能研究是破解生命过程的一项重要的研究内容。对蛋白功能的认识,离不开对蛋白结构的认识,蛋白与蛋白和其他分子之间的相互作用的基础就是蛋白的结构。获得蛋白结构的方法如x-ray衍射技术,核磁共振技术,冷冻电镜技术等,需要非常复杂的过程,仪器设备,人工实验,耗费巨大。
很早人们就开始思考尝试利用计算机进行蛋白结构的预测,蛋白的三维结构信息是隐藏在蛋白一级结构中的,是可以通过一级结构预测出蛋白三维结构的。然而,这一过程相当复杂,在alphago采用的机器学习之前,预测方法一直是穿线法为最为有效的方法,但是其局限性还是很大的,需要同源蛋白结构作为模板,尽管现在已经有数以万计的蛋白结构被解析出来,可以作为模板进行预测,但是仍然不能完全解决结构预测的问题。 从穿线法出现以来,没有突破性技术诞生。
机器学习尤其是深度学习最近的发展,如日中天,使计算机的应用从人类的计算工具,变成了可以独立思考和判断的有灵魂的机器大脑。深度学习在人脑不能企及的复杂问题上,百试百灵,蛋白结构作为一项超级复杂的问题,这一次深度学习有一次证明了自己的实力。
(未来已来,肉脑被机器大脑取代的时间表已经不长了,这不是问题,难道不是问题吗,如果机器大脑可以取代肉脑,我们还需要研究碳水化合物构成的智慧载体的工作原理吗? ,如果能够被硅片大脑取代,我们是不是也该放弃肉体。)
未来蛋白解析工作,是不是可以交给计算机直接计算出来,费劲巴拉的进行蛋白表达,结晶,衍射的工作是不是就可以退下了,进历史博物馆了呢。
深度学习给我开了一个脑洞,生命科学研究,本质是研究 DNA到生命体(进而到群体)的因果关系。客观的序列与复杂的生物多样性的关系,那么,如果有了足够多的序列信息和生物特征信息,是不是可以利用深度学习将序列映射到生命体结构上,从而破解生命密码呢?
- 上一篇:在线统计学分析网站http://vassarstats.ne 2012/5/23
- 下一篇:没有啦