讲座时间
2025年10月22日16:00-17:00
讲座地点
金凤实验室1号楼314会议室
讲座题目:Towards intelligent computing to understand carbohydrate-active enzymes(通过智能计算理解碳水化合物活性酶—CAZyme)
主讲人简介
郑进芳,之江实验室副研究员,独立PI。长期从事生物计算,生物信息学算法开发,生物数据库的构建。开发的工具、数据库和模型发表在Nature genetics, Cell reports, Nature communication等生物信息学顶级期刊上,共28篇。总被引次数1261,总影响因子达到200。在CAZyme领域开发的算法dbCAN等一系列工具和算法深受研究人员的欢迎。其中dbCAN的在线平台每年平均接受3万的计算任务, 在国家生物信息中心发布全球生物数据库目录Database Commons中排名80/5980。最近主要聚焦人工智能驱动的生物学发现和创新,已开发多个蛋白质和细胞的大模型用于发现生物学中的进化规律。
讲座摘要
近年来,肠道微生物组已被公认为“人类的第二套基因组”。其与宿主的营养代谢、免疫调节、炎症反应等密切相关。而在微生物与宿主交互过程中,碳水化合物活性酶(Carbohydrate-Active enZymes,CAZymes)发挥着至关重要的作用。它们负责降解、修饰和合成多糖结构,决定了微生物对膳食纤维的利用方式,并通过短链脂肪酸等代谢产物影响宿主健康。然而,CAZyme 家族众多、结构多样、功能复杂,传统的人工或基于单一统计学的分析手段,已难以满足对其大规模、精准解析的需求。随着深度学习和大模型技术的兴起,AI 为理解和预测微生物功能提供了全新的解决方案。
本报告围绕 “数据-算法-模型” 三个层面构建了系统性研究框架,旨在利用 AI 深入解析 CAZyme 功能并促进健康应用转化。我们建立并持续迭代了 dbCAN3一体化生态平台(包括 CGC-Finder、dbCAN-PUL、eCAMI/dbCAN-sub、dbCAN-seq),在 9,421个肠道MAGs 上系统注释了约 0.5M CAZymes 和 17万个 CGCs,并提出“同源搜索 + 多数投票”的 CGC 底物预测策略。同时,借助AlphaFold2 + GCN/注意力机制的深度结构图学习方法,实现了 CAZyme 子家族的精细分类与功能预测,显著优于传统方法,特别是在远同源序列场景下表现突出。依托这些算法,我们构建了从测序数据 -> 功能注释 -> 丰度评估 -> 可视化的标准化流程,为微生物组功能分析与精准营养干预提供了可复现工具链。
欢迎大家积极参加