科学研究
学术报告
当前位置: 主页 > 科学研究 > 学术报告 > 正文

基于正则化重心映射的scATAC-seq数据整合方法

发布时间:2025-06-10 作者: 浏览次数:
Speaker: 陈盛泉 DateTime: 2025年6月18日(周三)上午9:30-11:00
Brief Introduction to Speaker:

陈盛泉,南开大学数学科学学院教授,博导,南开大学百名青年学科带头人。20177月本科毕业于厦门大学自动化系,202112月博士毕业于清华大学自动化系,20221月至202412月任南开大学数学科学学院副教授,20251月至今任教授,主要研究方向为单细胞数据建模与解析。主持国家自然科学基金青年、面上等项目,以第一或通讯作者身份发表学术论文27篇,包括Nature Machine Intelligence (2022)Nature Communications (2021, 2024a, 2024b)Nature Computational Science (2024)Cell Discovery (2024)Protein & Cell (2024)Nucleic Acids Research (2021a, 2021b)Genome Biology (2023, 2025)Genome Research (2023)等,入选2021年清华大学学术新秀2023年中国科协青年人才托举工程。


Place: 腾讯会议号:335-427-641
Abstract:单细胞染色质开放性测序(scATAC-seq)为基因调控机制研究提供了重要视角,而多源scATAC-seq数据分析面临着批次效应等关键挑战,亟需建立高效的数据整合方法。针对现有方法普遍存在的两大局限:过度校正导致生物异质性丢失、忽略原始特征空间的校正导致下游分析可靠性受影响,本报告将介绍一种基于正则化重心映射的深度学习模型Fountain。Fountain引入批次内数据的几何信息作为批次间重心映射的正则化约束,在保持生物异质性的前提下实现跨批次精准对齐,且训练后的模型无需重新训练即可整合新批次数据,实现数据的在线整合。此外,Fountain可提供批次校正后的原始维度特征,显著提升细胞异质性刻画能力,并在细胞类型特异性遗传力分析等下游任务中展现出更强的生物学解释力。