基于叶绿体基因组序列分析当归及其近缘种的系统发育关系

目的:当归(Angelica sinensis(Oliv.)Diels)在经典分类学中隶属于伞形科(Apiaceae)芹亚科(Apioideae)的当归属(Angelica L.),现代分子系统学研究表明当归的系统位置在滇芹分支(Sinodielsia Clade),且与经典分类学中的当归属大部分物种亲缘关系较远。滇芹分支物种繁多,来源复杂,分支内物种的系统关系至今仍不明确。本研究旨在明确当归在滇芹分支内的近缘物种,分析当归及其近缘物种的系统发育关系,寻找可用于滇芹分支乃至芹亚科系统进化、物种鉴定的潜在分子标记。方法:基于叶绿体基因组的结构特点和其在系统发育研究中的优势,本研究选择对滇芹分支及相关分支的9属39个物种进行DNA测序,再进行叶绿体基因组的组装、注释,进一步分析叶绿体基因组的基本特征信息;使用本研究新组装的叶绿体基因组数据结合Gen branched chain amino acid biosynthesisBank数据库中已发表的滇芹分支及相关分支物种的叶绿体基因组数据,构建基于叶绿体全基因组和共有CDS序列的ML系统发育树,分析当归及滇芹分支物种的系统发育关系,明确在滇芹分支内与当归亲缘关系最近的物种;进一步对滇芹分支物种进行叶绿体基因组的比较分析,解析滇芹分支物种叶绿体基因组特点,筛选基因组的高变异区域。结果:本研究测序、组装并注释了39个滇芹分支及相关分支物种的叶绿体基因组(均为首次报道)。通过基本结构特征分析,发现39个基因组均呈典型的环状四分体结构,由LSC、SSC和两个IR区组成。基因组总长度为145,335~165,147 bp,编码基因数量为126~138个,包括83~93个CDS基因、35~37个t RNA基因和8个r RNA基因。本研究在39个叶绿体基因组中共检测到2734个SSR,其中单核苷酸SSR数量最多,为1577个,五核苷酸SSR和六核苷酸SSR数量相对较少;还检测到正向重复序列969个、回文重复序列930个、反向重复序列52个和互补重复46个。基于叶绿体基因组的系统发育分析结果显示:滇芹分支包含10属19种,其中3属3种首次聚在滇芹分支,而以前报道的6属7种则被划分出滇芹分支;滇芹分支内部形成两个亚分支,SubcladeⅠ和SubcladeⅡ,9条当归序列分别聚在滇芹分支的两个亚分支;在滇芹分支中与当归亲缘关系最近的物种是Cnidium officinale Makino、山芎(Conioselinum chinense Hoffm.)、藁本(Ligusticum sinenseBerzosertib溶解度 Oliv.)、川芎(Lig.chuanxiong Hort.)、辽藁本(Lig.jeholense(Nakai&Kitag.)Nakai&Kitag.)、细叶藁本(Lig.tenuissimum(Nakai)Kitag.)、峨眉当归(A.omeiensis Yuan et Shan)、牡丹叶当归(A.paeoniifolia Yuan et Shan)、三小叶当归(A.ternata Regel et Schmalh.)和多茎当归(A.multicaulis Pimenov)。滇芹分支物种叶绿体基因组的IR区的存在一定的扩张和收缩,基因组序列非编码区的变异情况较编码区变化更大,LSC区域和SSC区域的变异情况较IR区域的变化更大。本研究在滇芹分支内的物种叶绿体基因组中共检测到6个高变异区:rbc 点击此处L–acc D、ycf4–cem A、pet A–psb J、ycf1–ndh F、ndh F–rpl32的非编码区和ycf1基因,其中ndh F–rpl32和ycf1基因在滇芹分支所有相关属物种基因组中同样表现出高变异性,这些区域尤其是ndh F–rpl32和ycf1基因可优先作为潜在的分子标记开发为特定的DNA条形码,用于今后滇芹分支甚至伞形科的系统进化和物种鉴定等研究。结论:本研究首次报道的39个叶绿体基因组序列总长度为145,335~165,147bp,编码基因数量为126~138个,共包含2734个SSR和1997个长重复序列,丰富了伞形科物种叶绿体基因组数据库,为今后伞形科的分子系统学提供了数据基础。滇芹分支中与当归亲缘关系密切的物种有Cni.officinale、山芎、藁本、川芎、辽藁本、细叶藁本、峨眉当归、牡丹叶当归、三小叶当归和多茎当归,为今后当归的品种改良和品种选育提供了可用的遗传资源信息。筛选出滇芹分支及相关分支物种叶绿体基因组中的6个高变异区,为今后滇芹分支乃至伞形科DNA条形码的开发提供了参考信息。