1、 Canoco for Windows 4.5 中文简明教程 2009-9 2第一章 CANOCO 简介 一 软件功能 Canoco for Windows 是新一代的 CANOCO 软件,是生态学应用软件中用于约束与非约束排序的最流行工具。 Canoco for Windows 整合了排序以及回归和排列方法学,以便得到健全的生态数据统计模型。 Canoco for Windows 包括线性和曲线单峰方法。使用 Canoco for Windows 进行排序,能够洞察: 生物群落结构 植物与动物群落以及它们的环境之间的联系 一个对环境和(或)其生物群落的假设冲击所能造成的影响 在生物群落上进行
2、的复杂生态学和生态毒理学实验的相关处理所能造成的影响 一个排序被计算出来后,排序图可以立即显示在显示器上。 Canoco 具体独特的能力,可以说明用协变量表示的背景变异,而用它的扩展工具来进行排列测试,包括测试的互动效果。这些独特的特性使得 Canoco for Windows 能特别有效的解决应用研究方面的问题。 二 软件模块 The Canoco for Windows 软件包主要包含以下几个模块: Canoco for Windows:软件包的核心,用来指定要分析的数据和排序模型,排序方法以及分析结果的查看等基本操作命令均被集中在该模块的对话框中 WcanoImp: 将以电子表格形式(
3、Excel 等)保存的外部数据转化为 CANOCO 识别的形式 CanoDraw 4.0 for Windows:用来绘制各种类型的排序图,同时也可以生成多种等值线和回归模型图,并进一步深层次发掘排 序结果,该模块可以直接从主程序界面工具栏激活 CanoMerge:合并 Canoco 识别的 dta 类型数据文件,并可以将数据文件以带制表分隔符的文本形式输出(基本常用统计软件均兼容该类型文件) ,同时该模块具有滤掉低频率物种的功能 PrCoord:对特定数据集进行主坐标分析以及冗余分析 三 统计方法 这里只简要阐述 CANOCO 具有的统计分析方法,不做赘述,后面章节将详细论述操作步骤。主要分
4、析方法有以下四大类型: A 非约束型排序方法 ( Unconstrained ordination methods) 主成分分析 ( Principal components analysis, PCA) 对应分析 ( Correspondence analysis, CA) 降趋对应分析(去趋势对应分析) ( Detrended correspondence analysis, DCA) 主坐标分析 ( Principal coordinates analysis, PCoA 或 PCO) B 约束性排序方法 ( Constrained ordination methods) 冗余分析 (
5、Redundancy analysis, RDA) 典型对应分析(典范对应分析) ( Canonical correspondence analysis, CCA) 降趋典范对应分析 ( Detrended canonical correspondence analysis, DCCA) 典型变量分析 ( Canonical variate analysis, CVA) distance-based redundancy analysis (db-RDA) C 非约束性偏分析法 ( Partial methods of unconstrained ordination) partial PCA
6、、 partial CA、 partial DCA 3D 约束性偏分析法 ( Partial methods of constrained ordination) partial RDA 、 partial CCA 、 partial DCCA 、 partial CVA 四 软件模块界面介绍 Canoco for Windows 模块 进入软件后会出现图 1-1 界面,红色矩形所标记部分为快捷工具栏,鼠标做短暂停留会有英文提示出现,不再赘述。左侧的 Project View 窗口是数据指定,分类类型选择等一系列功能设置的引导窗口,按步骤操作即可;右边 Log View 窗口用来记录分析过程和
7、部分统计结果(如四个排序轴统计结果、轴与环境因子的相关性 、蒙特卡罗检验结果等) ,其他一些分析结果(如物种、环境因子及 样方坐标等)均保存在相应的 *.sol文件中,该文件可以用记事本打开。 图 1-1 Canoco for Windows 模块界面窗口 WCanolmp 模块 该模块在核心模块中没有快捷激活 命令,必须常规方式打开。进入后界面如图 1-2, 上边红色框标记部分是关于如何使用该模块的简短说明, 下面部分是可选框。一般情况下在 Excel 中组织原数据时,以行代表样方,以列代表变量,这时第一个选择框就不需选择; Excel 中组织数据时如果没有将第一行第一列作为样方名行和变量名
8、列,则需要选择第二和第三选择框,这样该模块会自动为导 入的数据添加样方名和变量名;最后一个选择框可以不用理会,采用默认的不选择状态。设 置完成后点击保存按钮,在弹出的对话框中命名并选择存放位置,即可将剪贴板中的数据文件(从 excel 中复制的)转化为 Canoco 能识别的类型( *.dta) 。 样方名和变量名命名规则:字符不得超过 8 个,字符类型可以为数字、字母、点、连接符和空格;超过 8 位的,在导入数据时 Wcanolmp 会默认的只保留前八位,并且以点取代不符合规定的字符 4图 1-2 WCanolmp 模块界面 CanoDraw 模块 此模块可以在核心模块中快速激活( Proj
9、ectRun CanoDraw) ,激活后界面如图 1-3 所示。此模块这里不做介绍,后面章节有详细介绍。 图 1-3 CanoDraw 模块界面 CanoMerge 模块 核心模块无快捷激活命令,需常规 方式打开。进入后界面如图 1-4所示。 “ Add file”用来添加文件,需要合并的文件全部在显示框中排列出来后点击“ Merge”按钮,在弹出的对话框中命名并选择存放位置即可。 对话框下部第一个对话框可以用来滤掉一些低频率的物种 ,框中数字代表包含某一个物种的样方如果少于 X 个,该物种将被剔除。 5图 1-4 CanoMerge 模块界面 五 说明 1 本教程只是个人能力范围之内的简明
10、教程,侧重于介绍“是什么” ,难免有错误,难免有地方过于“简”使人看后也没有“明” ,因此建议遇到具体问题或对“为什么”有强烈需求的人一定要参考相关书籍。 2 CANOCO 就像 Excel,不但界面人性易上手,最主要的是能深能浅,但问题是我们不一定玩的很转,有多少懂 Excel 的人敢说自己真正发挥了其 数据处理的高效性?所以学习CANOCO 也要多练习多总结。 3 目前你所看到的只是一时心血来潮的初稿,内容基本来自于 Multivariate Analysis of Ecological Data using CANOCO 一书,才疏学浅,至今原版书还有内容尚未看懂,欢迎交流促进初稿的完善
11、。 6第二章 CANOCO 基础 一 专业名词(CANOCO 体系中) 解释变量 ( explanatory variables) :相当于自变量,又称预测变量,经常分为主环境变量(主变量)和协环境变量(协同变量) 响应变量 ( response variable) :相当于因变量,又称物种数据 梯度分析 ( gradient analysis) :即通常所说的排序分析,是揭示物种组成数据和实测或潜在的环境因子之间关系的方法的总称,或者称 为依据出现的物种及其丰富度,将样方依次排列的多元统计技术的总称,有约束性排序(直 接梯度分析)和非约束性排序(间接梯度梯度分析)之分 约束性排序 ( con
12、strained ordination) :在特定的梯度(排序轴)上探讨物种的变化情况,冗余分析( RDA) 、典型对应分析( CCA)等均属于该范畴 非约束性排序 ( unstrained ordiantion) :在潜在的(或虚拟的)梯度上寻求代表最优的解释变量来拟合物种的回归模型,主成分分析( PCA) 、成分分析( CA)等均属于该范畴 混合排序分析 ( hybrid ordination analysis) :前面若干排序轴采用约束排序,而剩下的轴是非约束排序的梯度分析方法 偏分析 ( partical analysis) :预先剔除物种变化中由协同变量产生的那部分影响,再通过排序展
13、示剩下的变化量的排序方法,约束排序和非约束排序均有相应的偏分析方法 物种响应环境梯度模型 :所有排序方法都是基于一定的模型之上,这些反应物种和环境之间关系的以及在某一环境梯度上的种间 关系的模型最常用的有两种:线性模型( linear model)和单峰模型( unimodal model) ,如图 2-1 所示。 图 2-1 线性模型和单峰模型 二 利用 CANOCO 分析数据典型流程图 利用 CANOCO分析多元数据的一般流程如图 2-2所示, 图中前两步在上一章中已经介绍,这里主要以后面三步主要内容进行介绍: A 排序模型的决定 在 Canoco for Windows 的分析过程中,按
14、照操作步骤会出现一个关于模型的选择窗口,如图 2-3 所示,究竟是选择线性模型还是单峰模型这里有一个比较简单的判断方法:先对物种数据进行 DCA 分析,分析完成后在“ Log View”窗口中,各特征值分布部分找到“ Lengths of gradient”信息,这一信息代表的是每个排序轴的梯度长度。如果四个轴中梯度最大值超过4,选择单峰模型比较合适;如果小于 3,线性模型比较合适;介于 3 4 之间,两种模型均适合。 7注意:物种数据的量纲不同时不适合做单峰模型排序, 即便梯度长度大于 4;有空样方出现的数据不能顺利进行单峰排序分析,非要采用单峰分析,需要把空样方剔除 图 2-2 CANOC
15、O 分析数据的一般流程 图 2-3 分析模型选择窗口 B 具体排序方法的选择 排序模型确定后需要考虑的是选择何种排序方法,为 了选择更合适的排序方法,你尽可能将各种方法都尝试,选择一个你最想要的分 析结果和排序图。各种排序方法的具体的特征和操作方法将在接下来的章节详细介绍,基本的排序方法和排序模型对照表如表 2-1 所示 线性模型 单峰模型 直接梯度分析(约束性排排序) RDA CCA 间接梯度分析(非约束性排序) PCA CA、 DCA 表 2-1 基本排序方法和排序模型对照表 C CanoDraw 做图 在介绍如何使用 CanoDraw 做图之前,必须考虑以下两点: 明确环境因子里面是否有
16、定性变量,这些变量必须预先选出来,然后才能用于生成排序图,预选方法: ProjectNominal variables 8 对于分量很小,于排序图的解释没有多少参考价值的稀有种,可以将这些物种不在排序图中展示出来。一般可以通过两个标准来选择保留的物种:物种适合度(species fit)和物种的权重(species weight) 。前者表示每个物种变化被排序空间所能展示的百分比;后者等于某物种在所在样方内多度之和与所有物种 多度之和的比,且仅仅在单峰排序里面有应用价值,你可以自行设置权重值,只有高于该值 的物种才能纳入排序图里面。两个标准实现方法: ProjectSettingInclusi
17、on Rules 利用 CanoDraw 制作排序图具体操作步骤如下: 1 直接在 Canoco for Windows 窗口中“ Project View”对话框点击右侧“ CanoDraw”或通过“ ProjectRun CanoDraw”命令激活 CanoDraw 程序,出现如下对话框,作用是用来保存 CanoDraw project 文件( *.cdw) 图 2-4 CanoDraw 模块文件保存窗口 2 环境变量中如果有形式变量, 在生成排序图之前可以通过以下命令对其进行相关设置:ProjectNominal variablesEnvironmental variables,打开如下
18、对话框后,利用中间的“ Select”将左侧环境变量列表中的形式标量筛选到右侧即可 3 根据自己试验数据, 没有其他特别需要的话, 接下来就可以生成排序图了, 通过 Create菜单下的子菜单可以生成不同类型的排序图,这里我们以 Biplots and joint PlotsSpecies and evi. Variables 命令为例,生成 2-5 排序图。 4 如果对排序图标记符号、文字等不太满意还可以进行设置。首先利用鼠标(左键单击)选定你希望改变的对象(文字或线条等) ,之后利用 F5 键激活属性窗口,如图 2-6,在该窗口你可以对标记符号、文字、线条等进行相关设 置。如果你需要改动的
19、地方比较多,可以在选定一个对象后点击鼠标右键,弹出图 2-7 快捷菜单后利用 Selec Suchlike 命令选定所有类似的对象, 再利用上述方法对所有对象进行属性更改。 当然, 你也可以通过 View Visual Attributes命令激活图 2-8 对话框进行相关设置,这里不再赘述。 修改美化完成后的属性图可以保存为 *.cdg 类型文件,或直接输出为 bmp、 png 等类型的图像文件。 注意:关于排序图的解读这里不做叙述,后面有专门章节对其进行重点介绍 9图 2-5 来源于 PCA 的物种-环境双序图,图中环境变量是排序图生成后投影上去的 图 2-6 排序图属性对话框 10图 2
20、-7 排序图中快捷命令菜单 图 2-8 排序图美化设置对话框 11第三章 非约束性排序 当我们同时具有环境数据和物种组成数据的时候,首先可 以做非约束性排序分析,观察物种数据的整体情况,然后再做约束排序(将环境因子加上到排序图上) 。两种排序方法是互补的,都必须用,这样做可以保证我们既不会 丢失物种组成变化量的大部分信息,又不会丢掉与所测环境因子相关的大部分变量信息。当 然如果你手头的数据只具有多个响应变量(物种组成) ,而没有解释变量(环境数据) ,你依然可以采用非约束排序方法来分析数据。 第一节 去趋势对应分析(DCA) 一 相关知识 1 物种数据的转化 在基于单峰模型的排序分析中,所有响
21、应变量的数据 不能是负值,这就要求某些带有负值的数据必须经过转化。在 CANOCO 中常用的的转化方法有:对数转化和平方根转化。当然,如果你觉得需要其他的转化方法,还可以在数据输入到 CANOCO 之前通过别的数据软件进行转化。 2 去趋势 对应分析中样方在第二轴的位置很大程度上依赖于其 在第一轴的位置,去势的作用便是消除由这种依赖产生的 “拱形效应” 。 去趋势的方法一般有两种: 区间去趋势和多项式去趋势,后者又有二阶、三阶、四阶之分。多项式去趋势阶数的选择标准:环境因子小于 10 个,选取2 阶;小于 13 个,选 3 阶;大于 13 个,选 4 阶。 注意:对于约束排序,去趋势一般是不必
22、要的 二 分析步骤 1 进入 Canoco for windows 模块主界面后新建 Project 文件, 会自动弹出 “ Available Data”窗口,在其中选择需要分析的数据,并选择勾 选下部第二个(间接梯度分析)选择框,如图3-1。 图 3-1 数据类型框 2 点击“ Next”后,出现“ Data files”对话框,利用右侧的“ browse”指定需要分析的数据文件和数据结果输出文件( Canoco solution file name 选项)名,点击“下一步” ,出现如图 3-2 的分析类型对话框,选择其中“ DCA”选项后“下一步” 12图 3-2 分类类型选择框 3 在
23、紧着的去趋势对话框中选择“ by segments”方法,下一步,在物种数据转换对话框中选择“ Log transformation” ,默认的转换公式中参数均为 1,你可以根据自己的原始数据设置不同的参数,一般采用默认即可。点击“下一步” 4 剩下来的“ Data Editing Choices”对话框和“ Finish Options”对话框不做任何设置,一路“ Next” ,最终点击“完成”后在弹出的保存对话框中指定 Canoco Project 文件保存位置和文件名(文件类型为 *.con) 5 以上设置完成后,点击“ Project View”窗口的“ Analysis”按钮或工具栏
24、的 ,分析结果即可在“ Log View”窗口中查看,如图 3-3。图中红色标记部分即梯度长度,可以看出四个轴最大梯度为 2.001,说明该数据进一步分析应该采用基于线性模型的排序方法。 图 3-3 Log View 窗口中分析结果 6 出图。通过“ ProjectRun CanoDraw”命令激活 CanoDraw 程序。程序打开后,在弹出的对话框中为文件名 (*.cdw),并指定存放位置后,利用“ Create”菜单中子命令即可生成相应的排序图。排序图可以保存为默人的 *.cdg 文件( FileSave 命令) ,也可以输出为 bmp、png 等类型文件( Fileexport 命令)
25、。 13第二节 主成分分析(PCA) 对于一个由多个变量描述的复杂事物,人们难以认识,那 么是否可以抓住事物主要方面进行重点分析呢?主成分分析的作用就是从多元事物中解析出主要影响变量, 进行详细分析。但是一般情况下,我们并不能直接找出这些主 要影响变量,而是通过原有变量线性组合出新变量(即所谓的主成分)来表示事物的主要方面, PCA 的目标就是寻找这些虚拟的新变量。 一 相关知识 1 中心化和标准化 基于线性模型的排序方法都涉及数据中心化和标准化问题 。样方的中心化是让每行(每个样方)的平均值为零,相对应地,物种的中 心化则是让每列(每个物种)的平均值为零。物种(或样方)的标准化是让每行(或列
26、)的范数等于 1。在数值上,范数等于列(或行)内各值平方和的平方根值。物种数据经过中心 化和标准化后,各列变量的平均值均为 0,方差均为 1。 注意:中心化和标准化不是必须都得进行,几乎所有基于 线性模型分析的数据都需要中心化,但不一定需要标准化;如果都得进行,中心化必须先进行;物种数据的量纲如果不同,物种数据必须标准化(样方数据可能不需要) 2 排序尺度比例(线性模型) 这里尺度比例指排序轴坐标的相对尺度比例,具有可 选性。它可以使排序图展示不同的相对比例,以便更好解释你想要探讨的问题。 在解释排序图过程中,绝对值没有任何意义,我们使用的是相对距离,相对方向和投影点的相对次序。 CANOCO
27、 中有专门的窗口提供尺度比例的选项,如图 3-4。 图 3-4 线性模型中尺度比例选择框 首先来看左边“ Focus scaling on”部分,如果你关注的是样方,就选“ inter-sample distances”选项;如果你关注的是物种,就选择“ inter-species correlations”选项;如果你两个都关注,就选择最后一个选 项。再来看右边“ Species scores”部分,在线性模型中,你必须决定排序图中箭头的长度是 否要反映物种多度的不同 (多度大的物种箭头长 ),或者是物种多度是否要转化为可比较的尺度(所能解释的百分比) 。如果你选择“ divided by
28、the standard deviation” ,物种箭头长度表示的是在排序空间内展示的物种变化量的比例,是个相对值;如果你选择“ Do not post-tansform” ,箭头长度则表示的是物种在排序空间内的变化量,是个绝对值。 14注意:线性模型和单峰模型均具有排列尺度比例问题,这里只介绍了线性模型部分,单峰模型的尺度问题在后面章节介绍 二 分析步骤 1 前两步操作和去趋势对应分析基本一致,只是在图 3-2 的分析类型对话框中选择“PCA”,之后会出现图 3-4 对话框,根据自己分析目的进行选择,本例设置如图。 2 在接下来的数据转换对话框中选择“ Log transformation
29、” ,默认的转换公式中参数均为 1,你可以根据自己的原始数据设置不同的参数,一般采用默认即可。 3 之后出现如图 3-5 对话框。一般情况下,线性模型中物种数据都进行中心化,标准化与否视具体情况而定。 图 3-5 中心化和标准化对话框 4 之后的对话框全部默认设置,一路“ Next” ,数据分析完成会在“ Log View”窗口中找到如图 3-6 信息。图中红色线条标记部分信息表达的意思是:排序轴所能解释的物种数据比例是逐步减小的,第一二排序轴可以算是主成分轴,所能解释的无踪数据比例达 33.9%( 0.207+0.132) 。 图 3-6 PCA 分析结果(部分) 5 激活 CanoDraw
30、 模块,文件保存方法不再赘述。由于本例所采用的环境变量中具有形式变量,所以产生排序图之前需要相关设置,按照“ ProjectNominal variablesEnvironmental variables”操作,打开如下对话框,利用中间的“ Select”将左侧环境变量列表中的形式标量15筛选到右侧。 6 通过“ CreateBiplots and joint PlotsSpecies and evi. Variables”命令生成如图 2-5 形式的排序图。从图中可以看出第一轴(横轴)和环境变量 Altit 具有很强的相关性,所以可以认为 Altit 是良好的解释变量。 注意:后面的冗余分析
31、便以 Altit 作为唯一环境变量,研究其对物种群落分布的影响 图 3-7 形式变量筛选对话框 图 4-6 基于 RDA 双序图上分析物种沿海拔梯度分布情况 16第四章 约束性排序 约束排序和非约束排序的最大区别就是,后者的梯度是潜 在的、虚拟的,而前者的梯度是明确给出的。 在约束性排序中, 排序轴是参与排序的环境变量的线性组合 (多元多重回归) ,解释变量对于响应变量的影响被集中在了几个 合成的排序轴上,这种排序轴也叫典范轴。典范轴的数量和独立解释变量的数量一样多,我们一般使用的是前面的几轴。 第一节 冗余分析(RDA) 对比主成分分析可以发现,其实冗余分析就是约束化的主成分分析。 PCA
32、和 RDA 的目的都是寻找新的变量作为最好的预测器来预测 响应变量分布,它们的主要区别在于后者样方在排序图中坐标是环境因子的线性组合,具体原理不在这里阐述,有兴趣可以参考相关文献。 一 相关知识 1 蒙特卡罗置换检验( Monte Carlo permutation test) 置换检验和传统检验的区别是,前者利用自己产生的 分布作为零假设的分布,后者利用现成已知的分布作为零假设的分布,具体的区别可以参考教材 3.11 部分(参考教材为:Multivariate Analysis of Ecological Data using CANOCO)所讲述内容。该置换检验的主要作用是去检验约束排序模
33、型的显著性。 如果不考虑样方之间的空间结构,我们可以任意置换样方位置(无限限制性置换) ,利用F 值作为统计量,检验回归模型的显著性(这里的 F 统计量的算法和方差分析中 F 值意义相同,但算法不同) ;如果样方位置不能随便置换(即限制性置换,原因可能是样方按照空间或时间系列来排列) ,我们认为样方之间存在自相关,包括物种间的自相关或是环境因子间的自相关。在这种情况下 CANOCO 提供了旋转的办法来解决置换问题:即将样方头尾相连,形成一个圆筒,通过旋转来改变杨帆和环境因子的配比,取代原先的随机置换。 2 环境变量的预选 约束性排序方法实质上类似于多元多重回归,该多元 回归模型的好坏经常用响应
34、变量中有多少成分能被解释变量所解释来衡量,但我 们知道,并不是所有的解释变量对于响应变量的解释都有显著贡献,环境变量预选的目的就 是通过逐步迭代的方式筛选出有显著解释性的环境变量。在 CANOCO 中,可以用偏蒙特卡罗置换检验来评估每个备选环境便令对于响应变量的解释贡献。 在使用偏蒙特卡罗置换检验之前,我们可以分别将每 个环境因子作为独立的变量进行分析,将单独解释能力最强的环境变量标记为协 变量,然后将其他的候选变量作为唯一的主变量引入分析(此时排序模型只有一个轴) ,如果检验表明能够拒绝零假设(零假设为:响应变量不能被环境变量所解释) ,我们就可以将该环境中因子选入模型之中。你可以选择手动或
35、自动预选变量, CANOCO 中专门的选择对话框,如图 4-1,这里主要阐述如何手动预选变量。图 4-2 展示的是手动预选界面,上部列表是备选环境因子,其后面的数字代表如果将该因子引入分析,可以增加的解释量;下部列表框代 表已经被选中引入分析的环境因子,最上部红色矩形标记的数字代表已经选中的环境因子解 释量占所有环境因子解释量的比例为 57%( 0.624/1.098) 。如果将“ 6HF”也引入,则该值变为 69%( ( 0.624+0.136) /1.098) 。 二 分析步骤 1 前面操作步骤基本和主成分分析相同,不再赘述。出现“ Data Editing Choices”对话框后,差异
36、开始出现。如图 4-3,选中环境变量删除命令,点击下一步后,在出现的对话框中将左侧不需要分析的环境变量全部移除到右侧。 17图 4-1 环境变量预选对话框 图 4-2 手动预选对话框 图 4-3 数据编辑设置对话框 182 紧接着出现环境变量预选对话框,如图 4-1。由于我们这里只有一个环境变量被纳入分析,所以选择不用预选选项( “ Do not use forward selection” ) 。如若被纳入的分析的环境变量较多,可以自行尝试自动预选和手动预选,看看什么效果。 3 在置换检验对话框中,由于我们只有一个环境变量被纳入分析,所以选择第一轴显著性检验和典范轴显著性检验效果是一样,当然
37、 你也可以选择两个都检验或者不进行蒙特卡罗检验;右侧部分保留默认状态。在紧 接着出现的置换类型对话框中选定“ Urestricted permutations”类型,一路“ Next”直到结束。 4 点击“ Analysis”后,在“ Log View”窗口中找到如图 4-5 信息。这里第一轴(即典范轴)是约束性排序轴,对响 应变量的解释比例达 11.5%,后面的三个轴都是非约束性的。单从解释量来看,第二轴的解释量大于第一轴 ,但根据蒙特卡罗检验结果我们可以发现,这不影响第一轴解释量的显著性。 图 4-5 “ Log View”中分析结果 5 出图之前可以通过相关设置,使排序图中只显示能被典范
38、轴(第一轴)很好解释的物种,方法为: ProjectsettingsInclusion RulesLower Axis Minimum FitSpecies,由于第一轴对响应变量的解释量为 11.5%,这里我们可以将该值设为 11%,保存后便可以如图 4-6( 15页)所示排序图。 19第二节 典范对应分析(CCA) 典范对应分析是基于对应分析发展而来的一种排序方法, 将对应分析与多元回归分析相结合,每一步计算均与环境因子进行回归,又 称多元直接梯度分析。其基本思路是在对应分析的迭代过程中,每次得到的样方排序坐标值均与环境因子进行多元线性回归。 CCA 要求两个数据矩阵,一个是物种数据矩阵,一
39、个是环 境数据矩阵。首先计算出一组样方排序值和种类排序值(同对应分析) ,然后将样方排序值与环境因子用回归分析方法结合起来,这样得到的样方排序值即反映了样方种类组成及生态重 要值对群落的作用,同时也反映了环境因子的影响,再用样方排序值加权平均求种类排序值 ,使种类排序坐标值值也简介地与环境因子相联系。 优点 : CCA 是一种基于单峰模型的排序方法,样方排序与对象排序对应分析,而且在排序过程中结合多个环境因子,因此可以把样方 、对象与环境因子的排序结果表示在同一排序图上 缺点 :存在“弓形效应” ,克服弓形效应可以采用去趋势典范对应分析( DCCA)或变量预选以除去相关性过高的冗余变量。 一
40、相关知识 排序尺度比例(单峰模型) 这里的排列尺度比例问题是基于单峰模型而言的,和上一章介绍的线性模型排序尺度还是有区别的。 CANOCO 中该部分界面如图 4-7。 图 4-7 单峰模型排序尺度设置对话框 图中左侧部分内容和线性模型相同,不再介绍;右侧部分“ Hills scaling”选项适用于物种梯度较长尺度类型, “ biplot scaling”适用于物种比较集中,梯度较短类型。一般选择后者就行,它能为排序图提供一个更量化的解释。 一 分析步骤 1 先对先用 species-sample 资料做 DCA 分析,判断是用线性模型还是单峰模型,这一步具体步骤不再介绍,可以参照上一章相关内
41、容。假定 DCA 分析结果表明适宜用单峰模型,我们选择 CCA 来进行下面的分析。 2 指定分析类型为 CCA 后,单峰模型尺度对话框才采取默认设置,如图 4-7。之后的数据转换、数据编辑、环境变量预选对话框均采用默认设置,出现如图 4-8 对话框,选中“ Both above tests”后继续下一步,选定“ Unrestricted permutations”后下一步,完成设置。 203 CanoDraw 中直接进行下述命令操作: CreateScatter PlotsSamples。 出现如图 4-9 排序图( 22 页) 。从图中我们可以看出明显的“弓形效应” ,因此我们上述的分析方法
42、不尽合理,合理的方法是先进行去趋势典范对应分析或变 量预选以消除拱形效应,然后再以选定的变量进行 CCA 分析。 注意:进行上述三步操作的意图旨在说明,Canoco for Windows 核心模块中的不同设置,CanoDraw 中的不同出图命令均可以生成不同的排序图,有时候不合理的一意照搬分析出来的数据可能压根就是错误的。该教程只是 CANOCO 的入门皮毛,有兴趣的朋友还是需要参考相关教材,以保证分析结果的准确性。 图 4-8 置换检验设定对话框 图 4-9 基于 CCA 的样方散点图 21第五章 偏分析 这里的偏分析是指预先剔除物种变化中由协同变量产生的 那部分影响,再通过排序展示剩下的
43、变化量的排序方法。虽然偏分析方法也 有约束排序和非约束排序之分,但基本操作却是大同小异,因此这里只举例介绍一种偏分析方法偏冗余分析( partial RDA) ,其他偏分析类型可以自行摸索。 我们仍沿用前面介绍冗余分析时所采用的原始数据, 且只具体介绍有区别的步骤,相似不好步骤参考前面冗余分析章节内容: 1 图 3-1 上面部分数据类型选择第三个选项“ species、 evir. and covariable data available下面部分选择“ direct gradient analysis” 2 在指定数据文件窗口,均为协变量文件和环境变量采用相同的文件,即均为环境变量数据 3
44、一路默认直到“ Data Editing Choices”对话框出现,如图 4-3,系统会自动检测并勾选删除环境变量和协变量选项,如果没有自动勾选必须手工勾选。 4 在“删除环境变量”将变量“ 1Altit”从左侧列表框移到右侧,如图 5-1;在接下来的协变量对话框中将除“ 1Altit”外的变量全部从左侧列表框移到右侧,如图 5-2 图 5-1 环境变量删除对话框 图 5-2 协变量删除对话框 225 “环境变量预选”窗口,如图 4-1,选择“ Do not use forward selection”选项 6 “置换检验”对话框,如图 4-9,选择“ Significance of can
45、onical axes together”之后的设置全部采用默认直到结束 7 在 CanoDraw 模块中通过“ CreateBiplots and joint PlotsSpecies and evi. Variables”命令生成如图 5-3 形式的排序图,当然图中所呈现的物种依然时经过筛选的具有良好适合度的物种。 图 5-3 采用偏冗余分析生成的物种环境双序图 23第六章 排序图的解读 CANOCO 相对于 R、 Primer 等大致同功能的统计分析软件来说操作过程容易上手,界面比较直观, 不需要记忆复杂的语言代码, 做出来的排序图质量也是不用质疑。 考虑到 CanoDraw出图的多样性
46、(不同设置生成不同排序图) ,本章主要介绍排序图的解读方法并在各节最后以具体实例示范,没有涉及到的排序图可以参照相似方法解读。 第一节 基于线性模型排序图的解读 出于介绍的简洁性,采用的是分解介绍法,实际过程中可 能遇到上述某些图呈现在一个排序图中情况,解读方法类似。一幅排序图不 是想解读什么就能解读出什么,从排序图中究竟能解读出什么,附表1中列处了可供参考信息。 一 解读基础 1 物种和样方间关系 图 6-1 图 6-2 如图 6-1,带箭头射线代表物种,空心圆点代表样方。我们将物种 2( spc_2)的射线延长,五个样方均垂直投影到该射线上,以投影 点到物种实心箭头处相对距离为标准,沿着箭
47、头方向为增大,反之为减小,作用是用来说明相应样方中物种 2 的多度值大小;样方 3 的投影点在原点附近,可以认为该样方中物种 2 多度值大致等于其平均值;上图中各样方中物种2 多度值排序为: Sa4Sa2Sa3Sa1Sa5。物种 1 和各样方关系以相同方法分析。 2 物种和物种间关系 如图 6-2 两物种射线之间夹角代表其相关性,具体地说应该是夹角的余弦值在数值上等于两者的相关系数。途中两物种的夹角接近于直角,所以认为两者相关性较低。 3 物种和环境变量(数量型)间关系 如图 6-3 图中实心箭头代表物种,空心箭头代表环境变量。以环境变量 B 和两物种之间的关系为例进行阐述: B 和物种 1、
48、物种 2 夹角分别为 1, 2,前者是个钝角,后者是个锐角,相应的余弦值代表了之间的相关性,很明显,环境变量 B 和物种 2 之间呈现较好正相关,与物种 1 呈现负相关。也可以用图 6-4 的形象方法解读,将变量 B 反向延长,物种 1 和物种分别投影于其上,可以很清楚地看出物种 2 的投影与 B 同向,代表正相关;同理,物种 1 为负相关。 24图 6-3 图 6-4 4 物种与形式变量间关系 图 6-5 图 6-6 如图 6-5 实心正方形代表不同的形式变量值或者说不同的类别,射线箭头代表物种。延长物种射线,将形式变量投影于物种线上,投 影点距离物种箭头近者,代表该类别中样本所含的该物种多
49、度平均值较高。在此图中,类别 n_中样方所含的物种 2 多度相对于其他两个类别高。同理,物种 1 和形式变量关系也可以采用相同方法分析。 5 样方和样方之间关系 如图 6-6 圆点代表样方。如果要解读某一样方和其他样方之间的关系,可以如图用直线将该样方和其他样方连接起来,之间的线段长 度便是样方之间的欧几里德距离,长度越短代表两者之间的差异性越小,反之越大 。图中其他四个样方和 Sa5 差异性大小依次为:Sa1Sa4Sa3Sa2。 6 样方和环境变量间关系 25图 6-7 图 6-8 如图 6-7 将变量射线延长,样方垂直投影于射线上,沿着变量箭头方向环境变量值增大。图中样方 Sa3 和 Sa4 所对应的环境变量 A 值近似相等,所有样方中变量 A 值大小排序为:Sa1Sa4 Sa3Sa2 Sa5。变量 B 和样方间关系也采用类型方法分析,不再赘述。 7 样方和形式变量间关系 如图 6-8 想知道某一样方和形式变量之间关系?将该样方和形式变量用线段连接,线段长度代表了该样方属于某一形式变量类别的概率,距离越短,概率