
7月10日,Microsoft Research科学团队的AI发表了题为“蛋白质平衡合奏的可扩展模仿,并具有广义深度学习”的结果。论文:https://www.science.org/dii/10.1126/science.adv9817代码:github.com/microsoft/bioemu型号:https://huggingging.co/microsface.co/microsface https://colab.research.google.com/github/sokrypton/colabfold/blob/main/bioemu.ipynbai foundry: https://ai.azure.com/catalog/models/bioemu this study proposes a kind of name called bioemu the gererative deep learning model cane simulate protein conformational changes with Unsprecedented效率和准确性,为理解蛋白质功能机制和药物检测的超速发展开辟了新的途径。从结构性预测到功能模拟:诸如Alphafold之类的蛋白质研究模型的下一个边界已经使非凡的发展在蛋白质Str的预测中取得了成功近年来,这些方法通常只能预测单个静态结构,并且几乎无法获得在其操作过程中经历蛋白质的动态变化。蛋白质不是静态分子,而是构象合奏的变化,其操作通常取决于这些结构之间的过渡。 Bioemu诞生是为了解决这一挑战。它通过将静态结构纳入AlphaFold数据库,分子动力学(MD)模拟数据,在200毫秒和500,000个数据数据库中,可以在单个GPU中每小时生成数千种独立蛋白质结构,并在单个GPU中产生数千种独立的蛋白质结构。生成建模BioEMU从Microsoft Research中进行DIG(分布图形器)的初始工作。基于扩散模型的结构,结合了Alphafold的Evoformer和二阶积分采样技术的编码,它可以很好地从蛋白质的分布中进行样本mation。它的主要变化是:模仿操作过程中蛋白质中发生的主要结构变化的能力,例如隐藏的口袋,局部爆炸和域的重组;在能量项的自由预测中,1 kcal/mol误差水平与毫秒级的MD模拟和实验数据完全一致,并且与分子动力学模拟相比,达到了一些速度阶。突变体稳定性(ΔG)的修饰的预言非常好,平均绝对误差低于1 kcal/mol,而长矛人系数超过0.6。 OP TeamEn源释放研究已转化为采购的模型参数和代码GitHub和HuggingFace,并发布了100多毫秒的MD模拟数据,涵盖了数千种蛋白质系统和数千个三十个突变体,为后续研究提供了丰富的资源。 BioeMu还部署了Azure AI Foundry和Colabfold等平台,该平台允许用户轻松运行MOdels。看看未来:从单体蛋白到多分子系统的Bioemu开放释放源也标志着微软促进开放科学的重要一步。当前,生物emu建模对象是主要的单体蛋白质。研究小组探索了其扩展到更复杂的生物系统(例如复杂蛋白质和蛋白质)的扩展,并整合了实验数据,以进一步提高将军的一般和可解释性的能力。在蛋白质科学,药物设计和合成生物学领域,生物EMU有望是连接结构和功能,理论和实验的桥梁。