线粒体是细胞中制造能量的细胞器,叶绿体是绿色植物进行光合作用的细胞器,因此线粒体与叶绿体都是细胞内进行能量转换的场所,两者均为半自主性细胞器,均具有自身的遗传物质和遗传体系。线粒体DNA(mtDNA)因独有的母系遗传模式和较高的突变频率, 已被广泛用于生物进化,群体结构,疾病诊断,法医等方面的研究。而叶绿体DNA(cpDNA)在揭示物种起源、生物进化及不同物种之间的亲缘关系等方面也具有很重要的作用。二代测序可以简便快速、高通量获得线粒体/叶绿体DNA 序列信息,因此动植物线粒体/叶绿体测序在进化生物学研究,疾病诊断和法医学领域都具有十分重要的应用价值。
测序方案 |
样本要求 |
测序方式 |
数据要求 |
对Total DNA样品进行测序
A. 随机测序建库测序流程

B. 随机测序数据分析流程
背景: 昆虫线粒体DNA(mtDNA)是一个典型环型分子,大小在14-18Kb,编码37个基因。最近,高通量测序已成为一种获得线粒体DNA的新方法,这种快速高效的技术不仅有利于线粒体基因组的系统构建,也推动了关于大量物种线粒体基因组文章的发表。牯岭腹露蝗是最常见的,并广泛分布在中国的一种地方性蝗虫,它能够对中国山毛榉和玉米造成严重破坏,当这两种植物不足时,它也会危害高粱、小麦和大米。牯岭腹露蝗的线粒体部分基因序列已被报到,但完整的线粒体基因组序列仍然没有被公布。
方法: 研究人员利用高通量测序技术分析牯岭腹露蝗完整的线粒体基因组序列, 这将有助于蝗科昆虫完整线粒体基因组数据的补充。
结果: 通过高通量测序得到19,893,972 raw reads,经过校正后的19,876,930 cleaned reads用于序列组装。使用北极翘尾蝗作为初始参考进行牯岭腹露蝗线粒体基因组的构建。结果发现牯岭腹露蝗线粒体基因组大小为15,655bp。结果发现其核苷酸组成是不对称的(A: 42.8%, C: 14.2%, G: 10.5% and T:32.6%),整个基因组的A+T含量为75.4%。序列编码37个典型基因(13个蛋白质编码基因,22个tRNA基因和2个rRNA基因)以及A+T富集区。有11,193bp在PCG区域,1472bp在tRNA,1314bp在大rRNA,851bp在小rRNA,777bp在 A+T富集区域。所有蛋白质编码基因以ATN作为起始密码子,同时他们中的大多数也以TAA作为终止密码子,但有两个例外情况使用TAG作为终止密码子(COX1和ND1)。22个tRNAs大小在64-71bp。A+T富集区域位于小rRNA和tRNA-Ile之间,这个区域的GC含量为13.8%。通过把测序数据中的COX1序列与先前报道的牯岭腹露蝗COX1序列进行比对,发现两者有98.8%相似度,这表明测序得到的数据可以代表牯岭腹露蝗的线粒体基因组序列。
结果:测序分析得到得到22.35M的原始数据,将校正后的22.34 M数据使用西伯利亚人参刺五加作为初始参考进行了叶绿体基因组的构建。发现环形基因组的大小是156,687 bp,包含一对反向重复序列(IR)(每个25880 bp),一个大的单拷贝(LSC)区域(86680 bp)和一个小的单拷贝(SSC)区域(18247 bp)。叶绿体基因组包含134个基因,其中89个蛋白质编码基因(81个PCG 类型),8个核糖体RNA基因(4个rRNA类型),和37个转运RNA 基因(30个tRNA类型)。在这些基因中, 16个有一个内含子, 2个有一对内含子。绝大多数基因类型有一个拷贝,而同时19个基因类型有两个拷贝,所有这19个基因类型都位于反向重复序列(IR)区域内。 总的来说,核苷酸组成是非对称的(30.7% A, 19.3% C, 18.7% G, 31.3% T),整个基因组的A+T含量为62%, LSC,SSC和IR区域的A+T含量分别为63.8%, 68.0% and 56.9%。
