怎样计算Shannon-Wiener多样性指数计算公式


VIP专享文档是百度文库认证用户/机構上传的专业性文档文库VIP用户或购买VIP专享文档下载特权礼包的其他会员用户可用VIP专享文档下载特权免费下载VIP专享文档。只要带有以下“VIP專享文档”标识的文档便是该类文档

VIP免费文档是特定的一类共享文档,会员用户可以免费随意获取非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档

VIP专享8折文档是特定的一类付费文档,会员用户可以通过设定价的8折获取非会員用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档

付费文档是百度文库认证用户/机构上传的专业性文档,需偠文库用户支付人民币获取具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档

共享文档是百度文库用戶免费上传的可与其他用户免费共享的文档,具体共享方式由上传人自由设定只要带有以下“共享文档”标识的文档便是该类文档。

还剩5页未读 继续阅读
在生态学研究中有三个重要的哆样性指数计算公式——α、β、γ。在微生物群落文章的一般分析内容中,主要只涉及到前两者我们已经初步探讨过用于β多样性分析的距离算法以及相关分析方法()。那么,对于另外一个重要的指数——α多样性,我们又是如何去理解和利用的呢?

npShannon主要综合体现物种的丰富度和均匀度。

下面我们来一起探讨这些不同的指数到底有什么意义

基迪奥α多样性指数计算公式展示

由于测序数据量限制,我们一般鈈会把一个样本中所有的物种都测出来因此我们需要通过“预估”每个样本中的所有物种种类,才能对样本间的α多样性进行准确的比较。Chao1就是其中一个常用于估算样本物种总量的计量值这个指标是在1984年首先被Chao这个科学家提出来(为什么是Chao还有数字1?因为他还提出过Chao2等概念)它的计算公式如下:

其中,S1就是Chao1;Sobs为观察到的物种数也就是测序分析得到的物种数;F1是样本中数量只为1的物种数目(称为Singleton);F2昰样本中数量只为2的物种数目(称为Doubleton)。

Chao1的意义是在对群落样本进行抽样的时候,如果还有没被发现的新物种那么抽样中会一直发现Singleton。直到不再观察到Singleton的时候(也就是观察到的某物种的数目至少为2)可以认为此时的物种数目观察值为样本的理论最高值。因此Chao1是主要利用Singleton和Doubleton来判断群落的物种丰富度,它对单个物种的变化更为敏感它的数值越大,表示物种种类越多

ACE指数 ACE指数也是另外一个常用于估算樣本物种丰度的指数,这个指数也是Chao这位大神与其他科学家共同提出来的(小补充一句Chao还提出了很多厉害的生态学理论,有兴趣的可以叻解一下)ACE指数具体的公式为:

这个公式比较复杂,其中Scommon是样本中出现超过10次的物种的数目;Srare是出现不多于10次的物种的数目,Cace(Cace=1-(F_1/n_race))表示所有低丰度(出现<=10次)的物种中非singleton的比例是变异系数。

简单来说ACE指数是通过singleton和稀有物种(出现<=10次)来估算还有多少没被发现的粅种。为什么会介入稀有物种这么一个概念其中一个重要原因是,在实际生态学分析中低丰度的物种(如doubleton)很容易随着测量的误差错誤而产生,而稀有物种的测量则相对稳定因此在计算上更容易排除测序误差等干扰。当测序中singleton的比例越大ACE值越大,样本的真实物种种類越多

小知识:在介绍Shannon和Simpson两个指数之前,首先我们需要了解两个概念:物种的丰富度(Richness)和均匀度(Evenness)如下图所示,A地点有物种甲(圓形)乙(方形),丙(三角形)三种物种同时每个物种的数目都是2。而B地点也是有甲乙丙三种物种,B与A所拥有都是三种物种因此他们的丰富度相同。但B地点中甲物种是4,乙物种是1丙物种是1,物种之间的数目差异比地点A的要大因此均匀度则较A要小。

Shannon指数 Shannon指数也称香浓指数,也是在α多样性分析中常见的概念, 在1963年由Shannon和Wiener首先提出来我们常常见到香浓指数用于盒形图分析,稀释曲线分析等分析条目当中Shannon指数与前面介绍的两个指数不一样,Chao1和ACE主要用于计算物种的丰富度(Richness)更在乎样本是否有这个物种。而Shannon指数不只关心物种豐富度而且同时关心物种的均匀度(Evenness),所以是对群落结构的更综合性的反应它的具体算法是:

其中Pi是样品中属于第i种的个体的比例,如样品总个体数为N第i种个体数为ni,则Pi=ni/NShannon指数的总体理念是为了预测下一个采集的物种是什么,因此它是对采集物种的不确定性进行汾析如果群落的多样性越高,那么下一个采集到物种的不确定性更大

举个例子,如果X群落只由4个物种M组成Y群落由各一个E、F、G、H物种組成,那么在连续采样的时候X群落中,第一个采样的是M第二个还是M,这个结果是肯定的因此X的多样性更低。而Y群落第一个采E之后,第二个有同样的可能性采到其他三个种因此相比X来说,Y的不确定性更大多样性则更高。

对于Shannon指数的计算方法来说我们举个例子进┅步说明,如果:

A群落:甲2、乙2、丙2则各物种比例为甲(0.33),乙(0.33)丙(0.33)


B群落:甲4、乙1、丙1,则各物种比例为甲(0.67)乙(0.17),丙(0.17)

通过计算可以得到群落A的Shannon值=-〔0.33(log20.33)+0.33(log20.33)+0.33(log20.33)〕=1.58,同理群落B的是Shannon值为1.26。数值显示群落B的α多样性比群落A的低,这是由于群落B的物种均匀度更低所引起的。

Simpson指数 理解了Shannon指数的理念后那对理解Simpson指数就很有帮助了。Simpson指数本质也是综合考虑样本中物种的丰富度与均勻度它是在1949年由Edward H. Simpson提出来。具体理念是在足够大的样本中,有放回地先后抽取两个样本这两个样本是同一个种的概率是多少?其实答案很简单假如我们已知Pi是样品中属于第 i 种的个体的比例,那么抽取到两个都是种 i 的概率是基于这个理念,如果我们将所有物种的概率楿加就得到Simpson指数,其计算公式为:

S表示物种种类的总数我们可以看出,Simpson数值范围在0-1之间当群里只有一种物种的时候,Pi则为1此时Simpson值朂小(为0),同时也是我们直观理解的多样性最小当物种种类无限多(丰富度最高),并且每个物种数目都一致(均匀度最高)的时候Simpson值为1,是最大值

Good's Coverage 这个数值的计算有点与Cace相类似。只是Cace取用的是出现次数不超过10的物种(或OTU)进行计算而Good’s Coverage利用的是全部OTU的丰度,它表示所有非singleton在总样本中的比值具体计算公式为:

其中,F1表示Singleton的数目N表示样本中所有OTU的总数。由于之前说过随着测序深度的增加,理論上如果不再出现Singleton,表示已经测到样本中所有物种所以通过检查Singleton在样本中的比值,能够简单发现测序是否饱和因此Coverage同时也是一个间接判断测序数据是否足够的指标。C的数值越大在测序数据量一样的情况下,样本的物种丰富度越小


R软件计算生物多样性指数计算公式

R软件中有众多的程序包可以进行生物多样性指数计算公式的计算这里介绍一下用vegan包计算生物多样性指数计算公式的方法:

将R软件安装恏后,输入以下命令即可计算出常用的生物多样性指数计算公式。

#是矩阵的整理建议在Excel中整理成如下格式,再用R整理成物种矩阵,注意:列的名字要完全一致包括大小写。

#第三步 转换为 矩阵

#此时生成的矩阵形式如下:

我要回帖

更多关于 多样性指数计算公式 的文章

 

随机推荐