鸟枪法测序 - 概述
关键词
鸟枪法测序、全基因组测序、DNA 序列、链终止、片段化、测序、Sanger 测序。
简介
鸟枪法测序是实现全基因组测序的关键技术之一。在遗传学中,鸟枪法测序是一种用于确定生物体基因组DNA序列的实验室技术。该方法涉及将基因组随机分解成小的DNA片段,然后使用链终止法分别对这些片段进行测序。
通过进行几轮片段化和测序,可以获得目标DNA的多重重叠读取。计算机程序查找DNA序列中的重叠部分,利用它们以正确的顺序重新组装片段,以重建基因组。鸟枪法测序涉及将DNA序列随机分解成许多小片段,然后通过查找重叠区域来重新组装序列。DNA被超声处理以获得所需大小的片段。
DNA测序的链终止法(“Sanger测序”)只能用于100到1000个碱基对的短DNA链。由于此大小限制,较长的序列被细分为可以分别测序的较小片段,并且这些序列被组装以给出总序列。
由于重复序列数量众多,复杂基因组的组装也变得更加复杂,这意味着类似的短读取可能来自序列的完全不同部分。
全基因组鸟枪法测序
1979年首次提出了针对小型(4000-7000碱基对)基因组的全基因组鸟枪法测序。第一个通过鸟枪法测序的基因组是烟草花叶病毒,发表在1981年。
配对末端测序
更广泛的应用受益于配对末端测序,俗称双管鸟枪法测序。对同一片段的两端进行测序并跟踪配对数据比对两个不同片段的一端进行测序更麻烦,但知道这两个序列的方向相反,并且相距约一个片段的长度,这对于重建原始目标片段的序列很有价值。
方法
要应用此策略,将高分子量DNA链剪切成随机片段,选择大小,并克隆到合适的载体中。然后使用链终止法对克隆的两端进行测序,产生两个称为末端读取或读取1和读取2的短序列。
组装
使用序列组装软件从读取中重建原始序列。首先,将重叠的读取收集到称为重叠群的较长的复合序列中。根据间隙的大小,使用不同的技术来查找间隙中的序列。如果间隙小(5-20kb),则使用聚合酶链式反应(PCR)进行测序。如果间隙大(>20kb),则通过细菌人工染色体(BAC)克隆大片段,然后进行测序。
覆盖率
覆盖率是读取的平均数量。可以根据原始基因组的长度(G)、读取的数量(N)和平均读取长度(L)计算为N×L/G。在鸟枪法测序中需要高覆盖率,因为它可以克服碱基识别和组装中的错误。DNA测序理论主题探讨了此类数量的关系。
宏基因组鸟枪法测序
通过对环境样本进行下一代测序获得数百万个读取,可以全面了解任何具有数千种物种的复杂微生物组,例如肠道菌群。宏基因组测序的灵敏度使其成为临床使用的有吸引力的选择。但是,它强调了样本或测序流程污染的问题。
鸟枪法测序的优点
通过去除映射阶段,全基因组鸟枪法测序比克隆到克隆测序快得多。
全基因组鸟枪法测序使用的DNA只是克隆到克隆测序所需的一小部分。
如果存在现有的参考序列,则全基因组鸟枪法测序特别有效。通过将其与现有的参考基因组比对,可以更容易地组装基因组序列。
鸟枪法测序比需要遗传图谱的方法快得多且成本更低。
鸟枪法测序的缺点
需要大量的计算能力和复杂的软件才能将鸟枪法序列组合在一起。
组装错误更有可能发生,因为没有使用遗传图谱。这些错误通常比其他方法更容易解决,并且如果可以使用参考基因组,则可以最大程度地减少这些错误。
只有在已经存在参考基因组的情况下才能真正进行全基因组鸟枪法测序,否则如果没有现有的基因组进行匹配,组装将非常困难。
全基因组鸟枪法测序也可能导致需要通过其他更劳动密集型的测序类型(例如克隆到克隆测序)来解决的错误。
重复基因组和序列可能更难以组装。
结论
鸟枪法宏基因组测序使研究人员能够全面采样每个复杂样本中所有存在的有机体中的所有基因。该方法使微生物学家能够评估细菌多样性和检测各种环境中微生物的丰度。鸟枪法宏基因组学还提供了一种研究无法培养的微生物的方法,否则这些微生物难以或不可能进行分析。
通过能够在单个测序运行中组合多个样本并在每个样本中获得高序列覆盖率,基于NGS的宏基因组测序可以检测到使用其他方法可能错过或成本过高的微生物群落的丰度非常低的成员。