蛋白质作为生命体活动的重要承担者,长久以来因为其极其复杂的立体结构,受到科学家的广泛关注,蛋白质具有四级结构,其中的一级结构为氨基酸的排列顺序,理论上来讲,只要确认了氨基酸的排列顺序,蛋白质的结构就是唯一且已知的。二级结构由氨基酸肽链的螺旋,转角等组成,三级结构主要由蛋白质肽链之间的疏水作用,二硫键等等组成,通过多个二级结构的组成,在三维空间排列形成了一个蛋白质的分子结构,四级结构则是亚基和亚基之间的相互作用,三级结构形成亚基后,亚基间的空间排列方式决定了四级结构。
蛋白质一级,二级,三级,四级结构图
在蛋白质分子结构发现中,结构生物学在21世纪初扮演了至关重要的角色,使用X射线,冷冻电镜等手段,结构生物学解决了很多膜蛋白,通道蛋白等非常复杂的结构,但是这种卓有成效的手段往往限制于时间较长的掣肘,所以在2022年,谷歌公司开发了Alphafold计算模拟蛋白质折叠平台,能够以99%的精确度预测人类蛋白质组的蛋白
Alphafold的本地版所需要的算力较大,往往适合超级计算机,为此,研发人员开发了适合精度不高的在线alphafold预测工具colabFold,网址:
https://colab.research.google.com/github/sokrypton/ColabFold/blob/main/AlphaFold2.ipynb#scrollTo=KK7X9T44pWb7下面是网站的截图
网站制作非常简约,并且同时适合单一蛋白的折叠,以及蛋白质复合物的对接,如果折叠单一复合物,只需要将蛋白质的一级氨基酸序列输入query sequence一栏中,并且更改job name为所需名字,如果要预测蛋白质复合物,只需要在两个蛋白质复合物之间输入”:” ,软件会自动识别序列为前后两个蛋白并进行分子对接。
一般保持advanced settings不变,循环数设置为3
运行结束后,会在display 3D structure中显示运行后的蛋白质结构,可以使用不同的着色方式进行着色。
下面可以按照要求对自己的结果进行下载和打包。
需要注意的是,在线版对接软件可以很方便的预测,但是colab不能提供完整的alphafold功能,如果硬件条件允许,可以下载本地版进行更加精准的预测
Tips;需要注册谷歌账号
如有相关模拟需求,欢迎联系我们!