即可将网页分享至朋友圈
近日,电子科技大学生命学院2019级博士研究生刀福英在Science伙伴期刊Research上发表题为“Accurate Identification of DNA Replication Origin by Fusing Epigenomics and Chromatin Interaction Information”的研究论文(Research, vol. 2022, Article ID 9780293, 14 pages, 2022)。刀福英为论文第一作者,林昊教授和新加坡南洋理工大学Melissa. J. Fullwood教授为共同通讯作者,电子科技大学生命科学与技术学院为第一作者单位和通讯单位。
DNA复制起始在真核生物细胞中受到严格而精密的调控,该过程涉及多种遗传和表观基因组特征(图1a)。解析细胞复制起始调控机制,可以很好的了解生物遗传信息传递过程、基因突变机制以及重大疾病的发生发展机理,正确识别DNA复制起始位点(ORIs)可为研究复制引起的多种疾病提供重要线索。
为此,该研究基于机器学习方法设计名为iORI-Epi的预测框架(图1b),首次证明了可以通过基因组表观遗传信息、转录因子模体(motif)信息和三维基因组染色质互作信息来精确识别真核生物ORIs(AUC = 0.9627)。特征分析反映了染色质可及性、活性组蛋白信号和染色质远程互作信号在识别ORIs中具有突出的重要性,同时发现转录因子FOXL1结合位点序列是良好的预测因子。鲁棒的分类模型说明表观基因组的特征、序列特征和染色质空间结构特征在确定ORIs中具有丰富的信息性和互补性。进一步的实验证实iORI-Epi在其他细胞系(MCF7和HCT116)中具有高度的可扩展性。该研究提供了机器学习识别真核复制起始位点的范例,值得扩展到其他真核物种的 ORIs 鉴定工作中。
此外,该研究还讨论了早期和晚期复制时间状态下ORIs的基因富集通路,发现早期的ORIs基因主要参与在细胞水平上调节细胞形态的发生过程,而晚期ORIs则富含与应激反应或防御反应相关的基因,涉及神经细胞调节和组织发育的过程。最后,启动子和DNA复制起始的关系表明哺乳动物细胞采用复杂和多层次的共调节机制以高度协调的方式进行DNA复制和转录。
图1. (a) DNA 复制起点的认证与激活;(b)iORI-Epi框架。
刀福英为电子科技大学生命学院2019级博士研究生,其导师为林昊教授。刀福英的研究领域为生物信息学,主要研究方向为疾病中的三维基因组染色质互作和基因组复制的机制。迄今为止,以第一作者在Research,Briefings in Bioinformatics,Bioinformatics等期刊发表10篇SCI论文,谷歌学术总引用1079次,h指数20,i10指数24。2021至2022年期间,获得CSC国家留学奖学金到新加坡南洋理工大学进行博士联合培养。
编辑:李文云 / 审核:林坤 / 发布:陈伟