真核生物中的LTR逆转录转座子和其结构
介绍
逆转录转座子是能够复制自身并插入基因组不同部分的遗传元件。它们几乎存在于所有生物体中,包括细菌、古菌和真核生物。逆转录转座子可以分为两大类:非LTR逆转录转座子和LTR逆转录转座子。在本文中,我们将重点关注LTR逆转录转座子、它们的结构以及它们在真核基因组中的作用。
LTR逆转录转座子,也称为Ty元件,是一种在其末端包含长末端重复序列(LTR)的逆转录转座子。这些LTR在结构上类似于逆转录病毒LTR,后者也存在于整合到宿主基因组的病毒中。LTR通常长100-500 bp,由三个区域组成:U3、R和U5。
U3区域位于LTR的5'端,包含逆转录转座子转录的启动子区域。R区域位于LTR的中间,包含参与逆转录转座子整合到基因组中的序列。U5区域位于LTR的3'端,包含参与逆转录转座子逆转录的序列。
真核生物中的结构
LTR逆转录转座子的内部结构与非LTR逆转录转座子相似。它们包含一个长的开放阅读框(ORF),两端都有LTR。ORF编码一种多蛋白,该多蛋白被加工成单个蛋白质,包括逆转录酶(RT)、整合酶(IN)和蛋白酶(PR)。这些蛋白质对于逆转录转座子复制和整合到宿主基因组中是必要的。
RT蛋白负责将逆转录转座子RNA逆转录成DNA。它使用逆转录转座子RNA作为模板合成互补DNA(cDNA)链。然后,cDNA链作为合成第二条DNA链的模板,从而产生一个双链DNA分子,该分子整合到宿主基因组中。
IN蛋白负责将逆转录转座子整合到宿主基因组中。它切割宿主DNA并将逆转录转座子DNA插入到生成的缺口处。PR蛋白负责将多蛋白加工成单个蛋白质。
LTR逆转录转座子存在于所有真核基因组中,它们在不同物种之间的丰度差异很大。例如,LTR逆转录转座子约占人类基因组的8%,而约占玉米基因组的40%。LTR逆转录转座子可以进一步分为两个亚类:Ty1-copia和Ty3-gypsy。如前所述,真核生物中的LTR逆转录转座子的结构包括其末端的长末端重复序列(LTR)和编码多蛋白的内部开放阅读框(ORF)。
LTR通常长100-500 bp,包含三个区域:U3、R和U5。U3区域包含逆转录转座子转录的启动子,R区域包含整合序列,U5区域包含逆转录序列。
内部ORF编码的多蛋白被加工成单个蛋白质,包括逆转录酶(RT)、整合酶(IN)和蛋白酶(PR)。RT蛋白负责将逆转录转座子RNA逆转录成DNA,IN蛋白负责将逆转录转座子整合到宿主基因组中,PR蛋白负责将多蛋白加工成单个蛋白质。
LTR逆转录转座子可以进一步分为两个亚类:Ty1-copia和Ty3-gypsy。Ty1-copia亚类的特点是较短的RT结构域和较长的IN结构域,而Ty3-gypsy亚类的特点是较长的RT结构域和较短的IN结构域。这些亚类在染色体分布上也存在差异,Ty1-copia元件更常出现在端粒和着丝粒附近,而Ty3-gypsy元件在整个基因组中分布更均匀。
在真核生物中,LTR逆转录转座子可以构成基因组的很大一部分,从人类的8%到玉米的40%不等。LTR逆转录转座子的丰度在不同物种之间差异很大,它们的活性也可能取决于环境因素,例如压力或感染。
LTR逆转录转座子在真核基因组中的作用是复杂且多方面的。它们通过插入基因组的非编码区来创造新的基因和调控元件。它们还通过插入基因并导致突变来重排染色体。此外,LTR逆转录转座子可以通过充当附近基因的增强子或启动子来参与基因表达的调控。
尽管LTR逆转录转座子可能导致基因组不稳定和突变,但宿主基因组已将它们用于各种功能。例如,一些LTR逆转录转座子已被驯化并进化成功能基因,例如哺乳动物中参与胎盘发育的syncytin基因。
结论
LTR逆转录转座子是一种存在于真核基因组中的逆转录转座子。它们具有特征性结构,包括其末端的LTR和编码多蛋白的内部ORF。LTR逆转录转座子可以进一步分为两个亚类,Ty1-copia和Ty3-gypsy,它们在染色体分布和蛋白质结构方面存在差异。尽管它们可能导致基因组不稳定,但LTR逆转录转座子在真核基因组的进化中发挥了重要作用,并已被宿主基因组用于各种功能。