Loading... # 讲稿 磷虾是一类富含的甲壳动物,分布于各大洋的浮游生态系统中。其中南极磷虾是地球上数量最多的野生动物物种,其生物量达到了300-500亿吨,是南极海洋生态系统的重要组成部分,对碳的生物地球化学循环和南极海洋的浮游植物生长都有着至关重要的作用。虽然研究表明南极磷虾存在内源性的定时系统,可以使其生命周期与南极的季节性极地环境同步,但我们对其适应高度季节性的昼长、食物可用性和海冰范围等特殊环境的分子机制了解还很有限。此外,我们还没有明确地确定是否存在不同的人口群体。南极磷虾的基因组大小约为42-48亿碱基,其复杂性使得基因组组装和南极磷虾适应性的基因研究一直受到阻碍。但是,最近对肺鱼和墨西哥蝾螈的研究表明,大动物基因组组装中存在的艰巨技术挑战是可以克服的。本文提供了南极磷虾的测序、组装、基因组特征分析和种群遗传分析等相关信息。 我们看到**基因组装结果**,作者对南极磷虾进行了测序,共获得PacBio CLR测序数据3.06 Tb,**PacBio HiFi 测序数据734.99 Gb**(约15X Coverage[^12]),短读长测序数据4.01 Tb,以及基于短读长技术的Hi-C数据11.38 Tb。随后采用NextDenovo v2.30进行了染色体水平的基因组组装。组装生成了南极磷虾48.01 Gb的基因组序列,这是迄今为止已报道的最大的动物基因组。是墨西哥钝口螈的1.5倍,肺鱼的1.2-1.3倍,是人类基因组的16倍!南极磷虾的基因组是已知的最大的,唯一可以和其进行比较的就是刚刚提到的墨西哥蝾螈和肺鱼了。为了直观的体现这一基因组组装的成果,作者将其与154个已经组装的无脊椎动物基因组进行了比较分析。与所列出的其他组装结果相比,南极磷虾组装具有很好的连续性,Contig N50为178.99 kb,Scaffold N50 更是达到了1.08 Gb,在对比的五种中,连续性[^6]优于其中对120个物种对组装结果(Fig.1B[^3][^5]) 通常基因组中的串联重复(Tandem Repeats,TRs)区域[^5],具有极强的简单重复性,以至于包含TRs在内的重复区域往往都难以组装分析。作者发现,当TRs比例达到25.77%时,基因组组装将极具挑战性。特别是组装具有长度大于50 bp的高丰度TRs区域时,会非常困难。然而南极磷虾的基因组组装结果中,72.15%的基因组序列被鉴定为重复序列,在附加重复注释后重复序列区域的比例更是达到了惊人的92.45%,已高于已有报道的澳大利亚肺鱼90.00%重复序列(Fig.1E[^8])。并且南极磷虾的重复区域的密度同样高于墨西哥钝口螈、肺鱼和两种孔雀石甲壳类动物。(Fig.1D[^7]),93.43%的contigs[^9]以重复序列结尾,并且具有高序列相似性(identity >98%)的邻近TEs在组装中形成短距离的聚类,形成了延伸的重复区域(Fig.S1C)。分析系统发育情况,发现南极磷虾的不同种之间并没有特别的发育方向。 **丰富的重复序列对南极磷虾基因组的影响,以及重复区域的实际 HiFi 组装表现** 该文中,作者列举了重复序列对南极磷虾基因组的影响,以及来自PacBio HiFi数据在重复序列密集的区域中,组装的准确性。以基因座*MTHL1*为例,观察的范围长达285 Kb,然而即使该区域内含子中含有大量的重复序列,但该区域在PacBio HiFi 数据的条件下,并没有出现组装错误(Fig.2A[^17]),南极磷虾的基因组中,GC含量为29.36%,与目前已发表的154中无脊椎动物基因组,有140种都比南极磷虾高,这种较低的GC含量,是由于南极磷虾存在相当多的DNA转座子[^1](Fig.2B)图B中,不同颜色表示基因组中的不同结构,例如褐色的为DNA转座子,虚线为全基因组平均的GC含量。 在36和170百万年,也就是三千六百万年前和一亿七千万年前,观察到两个可能的南极磷虾转座子爆发式增长的时间,最近一次的时间,直接导致了基因组增长了39.51%,这个时间很接近一种叫*Euphausia*的具有很大基因组的磷虾出现的时间。 host genomes 中,大时间尺度下TE的激活和抑制,促成了TEs的累积。我们使用蛋白质结构域数据库Pfam探究南极磷虾基因组中的这一现象,发现,前20个结构域占了已探测到的Pfam结构域的55.91%,这20个其中的11个,在转座子的激活上发挥作用,例如逆转录酶(RVT_1)和整合酶(integrase_H2C2)。值得注意的是,在前20个结构域中,有三个的密度显著高于其它46种无脊椎动物(z-score > 3),分别是zf-H2 C2_2,zf-TRM 13_CCCH和zf-MYND。其中,zf-TRM 13_CCCH位于TRM13甲基转移酶的N端,zf-MYND位于SET和含MYND结构域甲基转移酶中。DNA甲基化可以激活由TE驱动的基因组膨胀。作者猜测,这些蛋白结构域是南极磷虾基因组大小急剧变化的源头。 **南极磷虾适应环境的基因组学解释** 昼夜节律是由molecular clock genes控制的,由于环境变化,molecular clock genes的表达情况也会发生周期性的变化。南极磷虾进化出了季节同步策略,因此在南大洋具有巨大数量。这种季节性生命周期,可以使南极磷虾适应光照、温度和海冰高度变化的环境。光线和温度的变化可以控制或重置昼夜节律系统。季节的变化形成了寒冷又有剧烈光照变化的环境,南极磷虾暴露在这种环境中,进化出了具有昼夜节律的遗传适应性。在南极磷虾中,生物钟的双反馈回路并没有基因丢失,但其中通路的部分基因表现出了随时间变化的表达水平,在南极磷虾中,转录因子CLOCK (CLK) 和 CYCLE (CYC) 结合编码其抑制剂的基因上游的 E-box [^18]元件,CRYPTOCHROME2(CRY2)、PERIOD(PER) 和 TIMELESS(TIM),产生自我维持的昼夜节律(反馈回路)。在南极磷虾基因组中发现有625个基因的启动子部分至少包括一个E-box(CA[AT/TA]TG)[^10],其中包括主要的时钟抑制剂 PER、TIM 和 CRY2,以及直接调节 CLK 和 CYC 表达的三个关键昼夜节律转录因子 VRI、PDP1 和 REV-ERB。 该发现提供了磷虾生物钟的分子结构模型(图 3A),证实可能存在双反馈回路机制。 进一步评估了生物节律反馈环中基因表达的季节性差异,发现夏季和冬季有四个昼夜节律基因出现差异表达(CLK,CRY1,NEMO 和 PDP1)。CLK,CRY1和 PDP1在夏季上调,而 NEMO 在冬季上调。冬季 NEMO 表达增加可能表明参与了向静止状态的复杂转变,此前据报道,这种转变受到南极磷虾生物钟的影响,导致性退化和活动、生长和代谢率下降。 昼夜节律系统控制的行为模式,可帮助南极磷虾节约能量,以适应低温和剧变的光照条件。南极磷虾在整个生命周期中不断蜕皮,但这个过程是会随季节变化而变化的。冬季的蜕皮周期几乎是夏季和秋季的两倍,这与摄食方式并没有关系。研究者在南极磷虾基因组中发现了25个显著扩增的基因家族(图3B),其中蓝色和红色分别代表每个分支上获得和丢失的基因家族的数目。12个直接参与蜕皮周期(6个家族)和能量代谢(6个家族)(图3C),气泡大小代表基因数量,阴影代表log10 p。这些家族中的大多数基因都有表达,表明这些基因实际上参与的南极磷虾的生命活动,具有实际功能(图3D)。 几丁质是甲壳动物外壳的重要组成部分,南极磷虾中编码几丁质结合结构域蛋白质的基因扩增(Fig.3E)也反应了蜕皮周期中需要精细调节角质层的形成与再吸收,而同能量代谢相关的六个基因家族,可以降低连续蜕皮的消耗(Fig.3C, Table.S3)这些家族,包括编码具有ATP结合结构域蛋白质的基因,例如MHC、DDX5和DDR2。同时也发现南极磷虾中有69个肌球蛋白基因,平均比其他物种多16倍,这可能与南极磷虾独特的生命周期相关,比如冬季身体收缩相关的肌肉收缩。 之前还鉴定了几个在夏季和冬季之间差异表达的基因,编码卵黄蛋白(VTG)是无脊椎动物中一种重要的蛋黄蛋白,在能量需求旺盛的产卵季节提供营养库,所有六个编码VTG的基因在夏季都上调了,所有包括*CYSC*、*PFK*和*PKLR*在内的其他能量代谢相关基因在夏季也表现出上调(图3F),这可能从侧面支持夏季的卵黄形成与频繁蜕皮。消化脂肪酶基因*PNLIPRP2*的两个同源基因之一(一种消化脂肪酶基因)在冬季上调,此外,促进蜕皮和生长的基因(*JHE*、*JHE-like CXE*和*CHT10*)在食物供应量高的夏季上调,而抑制蜕皮的基因(*JHAMT*和*CASP2*)在冬季上调(图2F)。这些发现验证了南极磷虾在相对较高的温度、较长的光照条件和充足的食物供应下会频繁蜕皮的研究结果,表明周期性蜕皮和繁殖反应出来的基因组的进化是对南大洋极端季节性食物供应的适应。 **南极磷虾种群动态** 关于南极磷虾是否是南大洋中具有混群的单一遗传同质种群[^11],长期以来一直存在争论。研究者在大西洋区南乔治亚岛(SG)和南设得兰岛(SSI)、印度洋区Prydz湾(PB)和太平洋区罗斯海(RS)四个生物量较高的南大洋区域收集了75只磷虾,并对其进行了平均深度为17.72X[^12] 的基因组测序(图4A)一共获取到3.6457亿个SNP,平均每37bp一个SNP。研究者观察到南极磷虾地理组之间的成对FST值较低,最大群体遗传多样性指数(Fst[^13])为1.92x10-3(图4B),这些FST值很低,这表明不同地理群体之间差异很小,属于是在一个很大的地理尺度上不断混合。实际上,南极磷虾物种分布范围与南极沿岸海流重叠,即世界上最强的洋流ACC,这使得基因总体上是流通的。来自SG的磷虾是唯一一个位于南极分流以北的种群,基因差异最大,说明在这个环境中,自然选择的力量较大。综合分析SNP,群体分化指数,迁移率等指标,结果表明南极磷虾在大的地理范围上具有较高的遗传连通性,不同地理群体之间没有实质性差异。 然而,PCA(图4C)、MDS和NJ表明,南极磷虾的遗传结构是可识别的,特别是在SG和PB-RS之间。置换检验表明,随机选择的南极磷虾个体的FST值显著低于不同地理环境之间的FST,而当FST>0.1的离群SNP被移除后,不同地理环境的个体就无法区分了,这表明,仅仅一小部分的差异SNP,造就了不同的地理群体,检测到这些信息,也归功于SNP数据集的大而全。 中性演化理论,是日本遗传学家木村资生提出的演化理论,认为,分子遗传学的层次上,基因的变化大多数是中性突变,也就是对生物个体的生殖与生存既没有好处也没有坏处的突变。由于中性突变并不受自然选择影响,而是由中性的突变基因的遗传漂变产生的,因此中性理论也曾被认为是与查尔斯·达尔文的自然选择论处于竞争状态。但现今的演化生物学家认为,自然选择和中性演化,是可以并立或者互补的,即多数突变基因是有害的,通过自然选择快速剔除,于是不会在物种内产生重大的影响,因此在分子层面上,中性演化起更重要的作用。 一般来说,在一个很大的群体中,遗传漂变[^14]是有限的,使得中性遗传标记[^15],即具有较小选择优势的基因座得以保留,但即使自然选择的效果比较弱,但也会累积对群体有益的突变。经过距离分离检验不显著,但环境隔离(IBE)分析表明,遗传分化与环境距离显著相关(图4D[^19])。最终,检测到了387个SNP,他们与环境适应性息息相关,分析这387个SNP在四个群体中的MAF(等位基因频率),揭示了SGSSI和PB-RS组之间的不同遗传模式,得出结论,由于环境差异产生的自然选择,不同地理区域南极磷虾群体的遗传结构还是呈现出微弱差异,环境选择可能在驱动南极磷虾不同类群的遗传结构中起重要作用。 我们需要额外注意的是,对于一个大群体来讲,有效群体数量是一个很重要的概念,因为遗传漂变的大小和有效群体数量的倒数成比例,即有效群体数量越大,遗传漂变越小。通常,对于野生群体,如果知道了突变率和中性位点多态性水平,就可以推测Ne大小,(pi = Neμ,pi是中性位点多态性水平,μ为种群的突变率)群体越大,多态性水平越高,但实际上,物种间多态性水平的差异远比其群体数量的差异小很多,即Lewontin(列万廷)悖论。低突变率可能是由于磷虾基因组的GC含量低,以及自然选择效果的减弱有关。此外,有效群体数量与调查群体数量的比值极低,这代表南极磷虾群体的遗传多样性并不高。 对于南极磷虾群体的变迁,研究者使用PSMC和PopSizeABC推断过去的有效种群规模(*Ne*),发现*Ne*从大约1千万年前急剧减少,与更新世[^16]期间广泛的冰川-间冰期变化幅度和南大洋温度的整体下降相一致。种群规模的总体峰值约为1千万年,这期间,南极冰盖已经形成,并稳定了相当长一段时间,南冰洋洋流也已形成。还观察到南极磷虾群从10万年前开始扩张,这种扩张对应更新世晚期气候变冷,形成了更大面积的海冰,为南极磷虾提供了更多的栖息地(图4F)。在大尺度上,基于基因组数据的推论与历史气候变化相对应,但是温度对南极磷虾的影响是复杂的,仍很难预测快速的气候变化对南极磷虾的影响。实际上,我们对于南极磷虾如何受到海洋温度和初级生产的变化的影响还知之甚少,磷虾的栖息地可能会转移到高纬度地区,但气候变化将如何影响磷虾种群规模,进而影响依赖磷虾的南极生态系统,是迫切需要解决的关键问题。 总的来说,由于较为完整的进行了基因组测序,所以可以基于大数据捕捉到细微的变化,正如上面提到的,检测到了不同地理环境下南极磷虾的遗传结构的差别。但是不可否认的是,南极磷虾的基因组是迄今为止最大的动物基因组,同时其TR含量较高,因此组装的连续性不如肺鱼和墨西哥蝾螈,此外,还应对南极磷虾进行更广泛的采样测序,评估种群的演变动态。 # Ref [^1]: 转座子(英语:Transposable element,亦称为**转座元件**,**跳跃子**,"jumping genes" or transposons,)是一类[DNA](https://zh.wikipedia.org/wiki/DNA)序列,它们能够在[基因组](https://zh.wikipedia.org/wiki/基因组)中通过[转录](https://zh.wikipedia.org/wiki/转录)或[逆转录](https://zh.wikipedia.org/wiki/逆转录),在[内切酶](https://zh.wikipedia.org/wiki/內切酶)(Nuclease)的作用下,移动到其他[基因座](https://zh.wikipedia.org/wiki/基因座)。**I型转座子又叫反转座子(retrotransposon)。**在植物基因组中,反转座子是最常见的转座原件家族,它们占据了许多植物基因组的大部分。根据反转座子的转座机制,人们形象地称其为“复制-粘贴”型转座原件。反转座子在转座时,会先以DNA为模板,在RNA聚合酶II的作用下,转录成一段mRNA,然后再以这段mRNA为模板反转录成cDNA,最后在整合酶的作用下将这段cDNA整合到基因组上新的位置。 根据两端侧翼有无LTR(long terminal repeat),可将反转座子进一步划分为LTR反转座子和非LTR反转座子。LTR 是一段长末端重复序列,其长度从100bp到5kb不等,携带转录起始和终止的信号,位于 LTR 反转座子两端侧翼,调节 mRNA 媒介的形成。另外,还可根据能否“自给自足”,将反转座子分为自主型反转座子和非自主型反转座子。自主型反转座子编码了所有转座必须的蛋白;而非自主型反转座子缺少一些转座必须的蛋白,需要在自主型反转座子的帮助下才能顺利完成转座。植物中数量最多的非自主型反转座子叫做 short interspersed nuclear elements (SINEs)。**II型转座子也叫做转座子(transposon),与反转座子“复制-粘贴”的机制不同,II型转座子转座的机制被称为“剪切-粘贴”。**在转座酶的作用下,II型转座子从原来的位置解离下来,再重新整合到染色体上。而原来的位置由于转座子解离形成的断链,在DNA修复的机制下得以修整。最终的结果是,原来的位置少了一段转座子序列,而新位置多了一段转座子序列。 在植物中,数量较多的II型转座子包括 hAT(hobo, Activator and Tam3), CACTA 以及 Mutator-like element (MULE)超家族。和反转座子一样,II型转座子也可分为自主型和非自主型。非自主型转座子不具有转座必须的所有的成分,因此依赖于自主型转座子。植物基因组中,数量最多的非自主型转座子是MITEs(miniature inverted-repeat transposable elements)。值得一提的是,我们在[转座子之母:芭芭拉•麦克林托克](https://link.zhihu.com/?target=http%3A//mp.weixin.qq.com/s%3F__biz%3DMzU3ODY3MDM0NA%3D%3D%26mid%3D2247488665%26idx%3D1%26sn%3D28b2379308ed9056d1a2cc439fe3b67e%26chksm%3Dfd708efeca0707e8e36219c2d72e9be44eb3a0b85fd39c67c6baaec99e784b2aef52854b0e37%26scene%3D21%23wechat_redirect)(请点击阅读)一文中提到过的Ds就是一类非自主型转座子,它需要在Ac的帮助下,才能正常地完成转座作用,进而调节玉米籽粒的颜色。**Helitrons 转座子是近年来发现的一种新型 DNA 转座子,最初是利用基于重复序列的计算方法在拟南芥基因组中鉴定出来的。**后来发现,大多数植物和许多动物基因组中都携带 Helitrons 转座子。Helitrons 转座子具有典型的 5'TC 以及 3'CTRR(R为A或G)末端,并在3'末端上游约 15~20bp 处有一个茎环结构,是转座子的终止信号。Helitrons 转座子转座后,通常插入 AT-rich 区域的 AT 靶位点。和反转座子和转座子不同,Helitrons 通过滚环(rolling circle)的方式进行转座。并且,在滚环复制的转座过程中经常捕获和携带基因片段,可导致基因拷贝数的变化,也会在一定程度上促进基因组的进化。 [^2]: Pearson’s correlation coefficient (*r*) between contig length and various genome features. GC, percentage of GC; TE, percentage of transposable element; TR, percentage of tandem repeat; Gene, protein-coding gene regions. [^3]: 首先,GC含量可以影响DNA的稳定性和双链结构的强度。GC对于DNA的稳定性和双链结构的强度有很大的贡献,因为GC之间的氢键比AT之间的氢键更强。其次,GC含量还可以影响基因表达的调控。在一些生物体中,GC含量较高的基因在表达上更具有稳定性和持久性,而且GC含量较高的基因在转录因子结合和剪接等方面也具有优势。最后,GC含量也可以被用来比较不同生物体的基因组组成和进化关系。不同生物体之间的GC含量可能存在很大的差异,可以用于分类、进化和基因组比较研究。 [^4]: TE含量的变化与生物的进化、适应性和基因组特征密切相关。一些生物体中的TE含量较高,可能会影响基因组的稳定性和可读性,从而影响生物的生存和繁殖。例如,如果TE插入到了重要的基因区域中,就有可能导致基因的表达受到干扰或完全失去功能,从而影响生物体的正常生理和生化过程。此外,**高TE含量也可能会导致基因组重组和突变率增加,加速基因组进化的速度**。然而,TE在基因组演化和适应性方面也扮演着一定的积极角色。TE的插入可能在基因重组和基因组重塑中发挥作用,帮助生物适应环境变化和进化。同时,一些TE本身也可能拥有功能,例如可能在基因表达和调控中扮演着角色。 [^5]: 通常基因组中的串联重复(Tandem Repeats,TRs)区域,具有极强的简单重复性,以至于包含TRs在内的重复区域往往都难以组装分析。当重复核苷酸数在10到60之间时,被称为小卫星,低于10则被称为短串联重复或微卫星。ATTCGATTCGATTCG其中的ATTCG在这里重复了三次。TR的存在可以增加DNA分子的可变性和多样性,使得不同个体、不同种群、甚至不同物种之间的DNA序列有所区别。因此,TR是DNA分型和遗传多样性研究中的重要标记,可做为确定个体的遗传特征的描述模式,例如确定亲子关系。其次,TR还参与了基因表达和调控等方面的生物学过程。TR区域的长度和重复单元的类型和数量可以影响某些基因的转录和剪接,从而影响基因表达和蛋白质的功能。此外,TR还可以作为某些DNA结合蛋白和转录因子的结合位点,调控基因的表达和调节。最后,TR也可能与某些疾病的发生和进展相关。例如,一些疾病的基因变异和重组往往发生在TR区域,因此TR成为了一些疾病诊断和预测的重要标志。 [^6]: Contig N50是指一个基因组装中contig长度的中位数,其中至少50%的基因组装序列都可以通过较长的contig拼接而成。因此,Contig N50是评估基因组装质量的一个重要指标之一,通常情况下,较高的Contig N50意味着更好的基因组装质量和更完整的基因组序列。 [^7]: A. mexicanum,墨西哥蝾螈,E. superba,南极磷虾,L. vannamei,南美白对虾,P. viginalls,北美原鳌虾,P. annectens,肺鱼 [^8]: 无脊椎动物和脊椎动物基因组中第一轮重复序列的组成。虚线表示这些物种间重复序列的平均值。 [^9]: Contig是指通过对重叠序列片段的组装,从DNA序列读取结果中得到的较长的、连续的DNA序列。Contig是一种基因组序列的组装产物,由许多不同的DNA序列片段通过计算机算法组装而成,这些片段通常具有重叠的区域。Contig的长度可以在几百个碱基对到几百万个碱基对不等,取决于组装过程中所使用的数据质量和算法。Contig是基因组组装过程的中间产物,可以进一步被组装成更长的序列,如scaffold和chromosome。 [^10]: consensus sequence,共有序列,或一致序列或保守序列。这组序列互相之间非常相似但又不完全相同,共有序列就由这组相似序列中每个位置最常出现的碱基或者氨基酸组成。 [^11]: 单个遗传同质种群是由于群体内有限的遗传变异而具有相似遗传构成的一组个体。 当一个种群经历了遗传瓶颈或创始人效应时,就会发生这种情况,这会减少种群内的遗传多样性。 在这样的群体中,个体之间存在高度的遗传相似性,更容易识别和追踪特定遗传性状的遗传。 然而,这也可能使人口更容易受到可能威胁整个人口生存的遗传疾病或环境变化的影响。这里需要引入一个叫基因流的概念,它是基因在种群之间的转移,是由于配子的散布或个体的迁移造成的。**根据基因流动的速率,低速时,引入新等位基因可以诱导遗传多样性,高速时则会减少基因变异在种群中产生遗传同质性。**物理和生殖障碍会阻碍基因流动。 [^12]: 测序深度Sequencing Depth,是指:测序得到的碱基总量(bp)与基因组(转录组或测序目标区域大小)的比值,是评价测序量的指标之一,反映了一个区域平均被多少个reads测到。关于测序深度的选择,当测序深度达到10X的时候,基因组的覆盖度已接近饱和,但SNP的检测率却没有达到饱和。这是由于当深度达到10X的时候,虽然基因组大部分区域已被覆盖,但在覆盖到的区域中,依然有相当多的区域深度小于3-4X。SNP检测的最低深度标准通常为3-4X。如果没有达到这个水准,则判断其不可靠,而在分析结果中不予接受。为了进一步减少低测序深度区域的比例,则需要进一步提高测序深度。只有测序深度达到30X的时候,SNP检测才会达到饱和。[**重测序的深度与覆盖度之间的关系**](https://www.omicshare.com/forum/thread-636-1-1.html) [^13]: 在基因组学中,F~ST~ 值是指种群之间遗传分化的量度。FST是一个亚群所含的总遗传方差(S下标)相对于总遗传方差(T下标)的比例。具体来说,F~ST~ 的取值范围为 0 到 1,值越接近 0 表示种群之间的遗传分化越小,值越接近 1 表示种群之间的遗传分化越高。 FST 值常用于种群遗传学研究,以了解不同种群的进化历史和遗传多样性,可以使用多种方法和遗传标记进行计算。 [^14]: 遗传漂变,genetic drift,指种群中基因库在代际发生随机改变的一种现象。由于任何一个个体的生存与繁殖都受到随机因素的影响,繁殖过程可视作一种抽样,子代携带的等位基因即是对亲代抽取的一种样本。这一过程中的抽样误差使子代中的等位基因频率与亲代并不相等,尤其是在小种群中。遗传漂变可能改变某一等位基因的频率,甚至致其完全消失,进而降低种群的遗传多样性。一般情况下,种群的生物个体的数量越少,遗传漂变的效应就越强。遗传漂变是生物进化的关键机制之一。 [^15]: 中性遗传标记,主要是微卫星,已经成功用于研究两栖动物有效群体数量和结构以及评定杂交效果。 [^16]: 更新世,新生代第四纪的早期,自2,588,000年前至11,700年前。中新世(Miocene),上新世(pliocene),更新世(Pleistocene)。显著特征为气候变冷、有冰期与间冰期的明显交替。这一时期绝大多数动、植物属种与现代相似。更新世的生物群(Biota)都非常接近现代的形态——许多“属”一级的生物,甚至包括松柏科植物、被子植物、昆虫、软体动物、鸟类、哺乳动物和其他生存至今的生物,已经在此时出现。人类也在这一时期出现 [^17]: PacBio CCS 读数,叠加Subreads,对错误进行校正,可以得到高准确率的CCS reads,其中CCS reads依照Subreads叠加数量的不同,准确度也會有所差距。而Q30 HiFi reads经由高达10次以上的Subreads叠加,可将准确率提升至99.9%,與一般大於3條Subreads疊加即可獲得的CCS reads有準確度上的差異。另外,在insert長度部分,下列文獻提到於Sequel平台CCS read主要應用於短於2 kb的DNA,而HiFi reads insert長度則落在1kb-20kb以內。 [^18]: E-box,属于真核生物启动子调控序列,也称为上游启动子元件CACGTG,一般与转录因子结合,当中涉及形成转录复合物,它会与碱性螺旋-环-螺旋(bHLH)的转录因子结合。E-box是第一个被发现的调控元件,包含一段由具有 bHLH(碱性−螺旋−环−螺旋)结构域的转录因子所识别的核心序列:CANNTG,能被生物钟节律振荡中 的正调节因子 BMAL1、CLOCK 和 NPAS2 蛋白特异性结合。 [^19]: 通常通过距离隔离(IBD),环境隔离(IBE)和电阻隔离(IBR)阐明迁移选择漂移均衡对种群结构的影响是由空间差异还是环境差异决定的)测试。 最后修改:2023 年 04 月 18 日 © 允许规范转载 赞 如果觉得我的文章对你有用,请随意赞赏