ManBetX China·中国ManBetX™

学术进展

我院团队发布300种植物 LTR 类转座子注释数据集,为解析松树等针叶树庞大基因组维持机制提供重要基础

[发布日期:2021-07-22 点击数: ]

 

针叶树是北半球森林生态系统的建群种,具有显著的生态和经济价值,为重要的林业经营对象。针叶树基因组庞大而复杂,LTR 类转座子占其基因组的 70-80%,然而目前植物学界对该类转座子研究还很有限。人们对针叶树中LTR 类转座子的维持机制及其功能效应的认识还非常模糊。

编码基因仅仅是决定植物表型的部分因素,基因组的非编码序列同样起着重要作用。植物基因组中绝大部分是由所谓的垃圾序列(重复序列)构成,编码区的占比很小。转座子是构成基因组重复序列的主要成分,它们像病毒一样在基因组中不断复制扩张,按其复制方式可分为逆转录转座子(Class I retrotransposons)和非逆转录转座子(Class II DNA transposons)。越来越多的研究表明,转座子往往导致基因组结构变异、序列突变、基因丢失、基因融合、新编码基因的形成,也通过提供各类非编码基因、新的调控序列或改变甲基化和染色质构象模式等影响基因的表达,转座子是控制植物表型变异中不可忽视的因素。除了直接的功能效应,转座子也与基因组大小有紧密关联,被认为是基因组变庞大的重要原因。解析控制植物表型的各类编码和非编码因素是分子生物学研究的重要课题,也是高效遗传改良和分子设计育种的基础。

 

 

LTR 类转座子是植物基因组中占比最高的重复序列类型,它是逆转录转座子的一种。在玉米、小麦、松树等复杂基因组中,LTR 类转座子的比例超过或接近 70%,在其它植物基因组中占比也普遍超过了 50%。尽管 LTR 类转座子是基因组中的主导成分,起着显著的功能效应,然而由于不同物种中往往采用不同的注释算法,种间比研究很难进行,这严重限制着对这类转座子扩张机制、功能效应的深入分析。

 

 

研究团队收集了已发布的植物基因组数据,整合先进的识别和注释算法,用统一的策略完成了 300 种植物基因组的 LTR 注释。发布的信息包括:LTR 的基因组位置、所属亚类、LTR内编码区、TSD 序列、两端 LTR 序列的分化程度(LTR 的插入时间)等。该数据集可为后续 LTR 扩张及清除机制、LTR 转录及功能效应、LTR 形成基因重复、LTR 种间水平转移、LTR 对基因组大小变异作用等课题提供重要的基础,为解析松树等针叶树庞大基因组的构成和维持机制提供参考

该研究A comprehensive annotation dataset of intact LTR retrotransposons of 300 plant genomes”为主题发表在重要的多学科期刊 Scientific Data 上。ManBetX中国官网ManBetX China·中国ManBetX™、林木分子设计高精尖创新中心博士生周姗姗为论文的第一作者,博士生严雪梅、刘辉、徐杰、聂帅、贾凯华、焦思倩,博士后赵伟,西南林业大学赵友杰、张开福,加拿大 UBC 大学 Yousry El Kassaby  Tongli Wang,加拿大 Université Laval 大学 Ilga Porth 参与了该研究。ManBetX中国官网毛建丰为该研究的通讯作者

 

 

该研究得到国家自然科学基金31670664)、ManBetX中国官网双一流建设项目(2019XKJS0308)、ManBetX中国官网基础科研业务费(2018BLCB08)等基金项目的支持。

 

论文链接: https://www.nature.com/articles/s41597-021-00968-x

数据链接: https://doi.org/10.6084/m9.figshare.14684877

分析用代码链接: https://github.com/sszhou9/intact-LTR-RTs

XML 地图 | ManBetX中国官网,ManBetX App
XML 地图 | ManBetX中国官网,ManBetX App