记者27日从中国农业科学院获悉,该院农业基因组研究所农业基因编辑技术研发与应用创新团队构建了全球规模最大的实验验证数据集,并基于此开发出人工智能(AI)大模型AlphaCD。该模型不仅能高效预测超过2万余种胞嘧啶脱氨酶的酶活特征,还能设计出新型高性能碱基编辑工具。相关成果日前发表于国际期刊《细胞研究》。
胞嘧啶碱基编辑器是一种基因编辑工具,广泛应用于疾病治疗、动植物育种等研究领域。“但传统胞嘧啶碱基编辑器研发依赖大量试错实验,成本高、周期长,且难以系统优化酶活特征。”论文通讯作者、中国农业科学院农业基因组研究所研究员左二伟说。
为破解这一难题,研究团队历时3年,实验测试了1100种胞嘧啶脱氨酶变体的催化效率、脱靶效应等核心指标,首次建立了覆盖多维功能特征的大规模实验数据库。
基于该数据库,团队整合蛋白质序列、三维结构、理化性质等多模态数据,开发出AlphaCD。经严格验证,AlphaCD在预测胞嘧啶脱氨酶催化效率、脱靶活性、靶向窗口及基序偏好等关键指标时,准确性显著优于传统方法。
“AlphaCD突破了当前AI大模型依赖超算资源的局限。”左二伟介绍,研究团队采用随机森林算法发现,在个人计算机上即可完成模型训练。这一轻量化设计能让学术机构低成本开展高通量功能预测。
记者27日从中国农业科学院获悉,该院农业基因组研究所农业基因编辑技术研发与应用创新团队构建了全球规模最大的实验验证数据集,并基于此开发出人工智能(AI)大模型AlphaCD。该模型不仅能高效预测超过2万余种胞嘧啶脱氨酶的酶活特征,还能设计出新型高性能碱基编辑工具。相关成果日前发表于国际期刊《细胞研究》。
胞嘧啶碱基编辑器是一种基因编辑工具,广泛应用于疾病治疗、动植物育种等研究领域。“但传统胞嘧啶碱基编辑器研发依赖大量试错实验,成本高、周期长,且难以系统优化酶活特征。”论文通讯作者、中国农业科学院农业基因组研究所研究员左二伟说。
为破解这一难题,研究团队历时3年,实验测试了1100种胞嘧啶脱氨酶变体的催化效率、脱靶效应等核心指标,首次建立了覆盖多维功能特征的大规模实验数据库。
基于该数据库,团队整合蛋白质序列、三维结构、理化性质等多模态数据,开发出AlphaCD。经严格验证,AlphaCD在预测胞嘧啶脱氨酶催化效率、脱靶活性、靶向窗口及基序偏好等关键指标时,准确性显著优于传统方法。
“AlphaCD突破了当前AI大模型依赖超算资源的局限。”左二伟介绍,研究团队采用随机森林算法发现,在个人计算机上即可完成模型训练。这一轻量化设计能让学术机构低成本开展高通量功能预测。
本文链接:http://www.vanbs.com/v-146-5341.html设计基因编辑工具的AI大模型问世
相关文章:
无人机编队支援抢险救灾08-08
从刺梨故事看科技创新引领高质量发展06-24
第12届警博会首设智慧化无人装备展区05-16
经典温暖的晚安问候语07-12
学校新型冠状病毒防疫工作总结通用(5篇)01-07
关于护士辞职信模板08-15
大学生创业实践心得10-22
运动会家长代表简短发言稿10-05
翅膀的话题作文600字07-12
童话书里含相思01-31
立秋的习俗说明文作文01-03
初一的语文满分作文11-25
护理专业有哪些大学10-12
全国各省录取分数线(全国录取分数线表)08-22
《待储光羲不至》原文、翻译及赏析11-16
《菩萨蛮阑风伏雨催寒食》原文及翻译赏析09-06