植物DNA C值
简介
无论物种的倍性水平如何,C 值指的是未复制的配子核中核 DNA 的数量。
一种名为 *Genlisea margaretae* 的食肉草本植物的基因组大小为 0.129 pg (63 Mbp),而单子叶植物 *Trillium hagae* 的基因组大小为 264.9 pg(参考:*拟南芥* 的基因组大小为 0.321 pg;Bennett 和 Leitch,2005;Zonneveld 等人,2005;Greilhuber 等人,2006)。植物 C 值数据库包含超过 5000 种植物物种的 C 值信息。

基因组大小
未复制的单倍体细胞核中 DNA 的总量,或植物基因组的大小,在近几十年来受到了越来越多的关注,因为这种重要的生物多样性属性的生物学、进化和生态意义已经逐渐显现。
陆地植物中基因组大小的惊人多样性以及某些藻类进化枝中大量多样性——绿藻的绿藻门进化枝具有最大的变异性,范围为 274 倍——无疑是这种兴趣的促成因素。
现在很明显,基因组大小会影响各种维度,包括基因和基因组动力学、全植物动力学、植物生长策略、植物群落组成、植物-动物相互作用、进化轨迹和生态系统动力学。
如何在线访问植物基因组大小数据?
2001 年发布的植物 DNA C 值数据库第 1 版,通过在各种植物分类群之间进行广泛的比较系统发育分析,极大地帮助了该领域的革命性发展 (例如 Leitch & Bennett,2002;Soltis 等人,2003)。
此后进行了六次更新,最近一次更新于 2019 年 4 月上线 (Leitch 等人,2019),并汇编了来自 1067 篇原始出版物和私人交流的信息。

植物 DNA C 值数据库(2019 年 4 月发布的 7.1 版)
2012 年的先前修订版 (Bennett & Leitch,2012;Garcia 等人,2014) 包含对 10,770 个物种的估计,其中被子植物构成了大部分数据。但是,该数据库还提供了所有其他重要陆地植物群的 C 值,包括 334 种苔藓植物、246 种蕨类植物(单子叶植物)和 421 种裸子植物的数据(209 种藓类、102 种苔类和 23 种角苔类)。
此外,还提供了 445 种“藻类”的数据,其中包括来自进化中几个高级谱系的物种(即红藻门、绿藻门和植物界内的轮藻类绿藻,以及褐藻门和异鞭毛藻门内的杂色藻)。
该数据库的新型用户友好界面提供了各种搜索和输出选项,允许用户根据需要提取和显示特定信息。例如,可以使用整个数据库或仅针对某些分类级别和谱系(例如科、属)进行查询。
C 值悖论
整个基因组中 DNA 的总量以碱基对表示。
根据所谓的 C 值悖论,基因组大小不会随着物种的感知复杂性而同步增加,例如脊椎动物与无脊椎动物或“低等”脊椎动物与“高等”脊椎动物(红色方框)。
这被称为“C 值难题”,而“C 值”代表单倍体细胞拥有的 DNA 量。这是由于垃圾 DNA 造成的,垃圾 DNA 只是作为数据存储区域的 DNA 片段(仍在争论中)。
Roger 和 Colette Vendrely 在 1948 年观察到的“在给定动物物种内所有个体的所有细胞中核 DNA 含量惊人的稳定性”被他们解释为 DNA 而不是蛋白质构成基因的证据。
这种观察到的一致性体现在 C 值一词中。然而,人们很快就观察到,C 值(基因组大小)在物种之间差异很大,并且这与估计的基因数量(如生物体的复杂性所反映的那样)没有任何关系。
对 C 统计量的理解
曲线下面积 (AUC) 与 c 统计量相同,也称为一致性统计量,其解释如下:
值低于 0.5 的模型是不良模型。
值为 0.5 意味着该模型在对结果进行分类方面并不比随机机会更好。
值越接近 1,模型对结果进行分类的准确性就越高。
值为 1 表示模型可以绝对准确地对结果进行分类。
因此,c 统计量为我们提供了对模型准确分类结果能力的了解。
在临床情况下,可以通过选择所有可能的个体对来计算 c 统计量,每个对由一个具有阳性结果的个体和一个具有阴性结果的个体组成。
然后可以将 c 统计量确定为这些对中,阳性结果个体比阴性结果个体具有更高预测阳性结果概率的对的百分比。
计算 C 值
将核苷酸对(或碱基对)数量转换为 DNA 皮克数的反之亦然的公式为:
基因组大小 (bp) = (0.978 x 109) x DNA 含量 (pg)
DNA 含量 (pg) = 基因组大小 (bp) / (0.978 x 109)
1 pg = 978 Mbp

结论
旧的但更广泛使用的术语“C 值悖论”已更新为“C 值之谜”。与早期的 C 值悖论不同,C 值之谜明确地定义为一组独立但同样重要的组成部分问题,例如:
各种真核生物的基因组中存在哪些类型和数量的非编码 DNA?
这些非编码 DNA 来自哪里,它如何随着时间的推移在基因组中移动?它是如何丢失的?
这些非编码 DNA 对染色体、细胞核、细胞和生物体有何影响,或者它到底有什么功能?
为什么某些物种具有非常紧凑的染色体,而另一些物种则具有大量的非编码 DNA?
数据结构
网络
关系数据库管理系统 (RDBMS)
操作系统
Java
iOS
HTML
CSS
Android
Python
C语言编程
C++
C#
MongoDB
MySQL
Javascript
PHP