欢迎大家来到IT世界,在知识的湖畔探索吧!
欢迎大家来到IT世界,在知识的湖畔探索吧!
值得注意的是,早在2019年,谷歌 AI 就在 bioRXiv 发过 ProtENN 的预印本,不知是不是最近才被 Nature 接收?

ProtENN 方法可以帮助在 Pfam 的蛋白质功能注释集中添加大约 680 万个条目,大约相当于过去十年的新增条目总和,将 Pfam 的覆盖范围扩大了9.5%以上。
它们基于线性序列的比对,并且不考虑蛋白质序列不同部分的氨基酸之间的相互作用。
然而,蛋白质不仅仅停留在一行氨基酸中,还会折叠起来,这样不相邻的氨基酸也会相互影响。
成本会非常高昂。
“ProtCNN”
)来预测蛋白质序列的分类,以及一组独立训练的 ProtCNN 模型(称之为
“ProtENN”
),目的是通过开发一种可靠的机器学习方法来补充传统的基于对齐的方法的缺陷。
蛋白质功能预测的挑战不在于为任务开发全新的模型,而更多在于创建公平的训练和测试集,以确保模型能够对看不见的数据进行准确的预测。


?
大家怎么看?
参考链接:
https://ai.googleblog.com/
https://www.nature.com/articles/s41587-021-01179-w
https://github.com/google-research/google-research/tree/master/using_dl_to_annotate_protein_universe#availability-of-trained-models
http://pfam.xfam.org/
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://itzsg.com/131484.html