1、 22121(,),(),XNx、 设 其 中则 Cov=_.103()i iiWX、 设 则服 从 。 1243,9,26_xR、 设 随 机 向 量 且 协 方 差 矩 阵则 它 的 相 关 矩 阵4、_, _,_。215,16(,)(,)54_i ppXNXAT、 设 是 来 自 多 元 正 态 总 体 和 分 别 为 正 态 总 体的 样 本 均 值 和 样 本 离 差 矩 阵 则 。2316(),0x、 设 其 中试 判 断 与 是 否 独 立 ?,123设 X=x的 相 关 系 数 矩 阵 通 过 因 子 分 析 分 解 为211h的 共 性 方 差 11的 方 差g公 因 子 f
2、对 的 贡 献 0.940.1280.934.17.357.8.7843.35 0.1321R126(90,58).4.3071628.94 4XS、 对 某 地 区 农 村 的 名 周 岁 男 婴 的 身 高 、 胸 围 、 上 半 臂 围 进 行 测 量 ,得 相 关 数 据 如 下 根 据 以 往 资 料 该 地 区 城 市 周 岁 男 婴 的 这 三 个 指 标 的均 值 现 欲 在 多 元 正 态 性 的 假 定 下 检 验 该 地 区 农 村 男 婴 是否 与 城 市 男 婴 有 相 同 的 均 值 。其 中 0.5,(,)F121423.5,(3qCeBayes、 设 已 知 有
3、 两 正 态 总 体 G与 , 且 , , ,而 其 先 验 概 率 分 别 为 误 判 的 代 价 ;试 用 判 别 法 确 定 样 本 属 于 哪 一 个 总 体 ?124(,)(0,0TXN、 设 , 协 方 差 阵(1) 试从 出发求 X 的第一总体主成分;(2) 试问当 取多大时才能使第一主成分的贡献率达 95以上。1212125(,)(,) ,00.95() 1TTXXYXZYZ 、 设 为 标 准 化 向 量 , 令 且 其 协 方 差 阵V,求 其 第 一 对 典 型 相 关 变 量 和 它 们 的 典 型 相 关 系 数 ? ,E、 设 随 机 向 量 的 均 值 向 量 、
4、 协 方 差 矩 阵 分 别 为 、试 证 : 。 2(,),PrXNAbrp1、 设 随 机 向 量 又 设 Y=+试 证 : 。1、0 2、W 3(10,) 3、 2416R4、0.872 1 1.7435、T 2(15,p)或(15p/(16-p))F(p,n-p)3212,064xyEVy、 令 则 -1230(,)N故 , 的 联 合 分 布 为故 不 独 立 。0112100.:8.,54376.9()()HXSTnSF、 假 设 检 验 问 题 : ,经 计 算 可 得 :构 造 检 验 统 计 量 :由 题 目 已 知 1,., 由 是所 以 在 显 著 性 水 平 下 , 拒
5、 绝 原 设即 认 为 农 村 和 城 市 的 周 岁 男 婴 上 述 三 个指 标 的 均 值 有 显 著 性 差 异 1121233()exp()492,68|5TBaysfWxqCddeX、 由 判 别 知其 中 , 2G121341240,xZX23、 ()由 得 特 征 根 为解 所 对 应 的 方 程得 所 对 应 的 单 位 特 征 向 量 为故 得 第 一 主 成 分195%0.432()第 一 个 主 成 分 的 贡 献 率 为得 1212212,095.95.0,T 、 由 题 得 求 的 特 征 值 , 得 1121.95.,04,.TeVXWY的 单 位 正 交 化 特
6、 征 向 量为 第 一 典 型 相 关 变 量 , 且 ( ) 为 一 对 典 型 相 关 系 数 。1()VXE、 证 明 : =故 2(),rYAXbEVN、 证 明 :由 题 可 知 服 从 正 态 分 布 ,故 。一、填空题:1、多元统计分析是运用 数理统计 方法来研究解决 多指标 问题的理论和方法 .2、 回归参数显著性检验是检验 解释变量 对 被解释变量 的影响是否著 .3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 Q型 聚类和 R型 聚类。4、相应分析的主要目的是寻求列联表 行因素 A 和 列因素 B 的基本分析特征和它们的最优联立表示。5、因子分
7、析把每个原始变量分解为两部分因素:一部分为 公共因子 ,另一部分为 特殊因子 。6、若 =1,2,3.n且相互独立,则样本均值向量 服从的分布(),)PxN: x为 _ N( , /n)_ 。二、简答1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。2、简述相应分析的基本思想。相应分析,是指对两个定性变量的多种水平
8、进行分析。设有两组因素 A 和 B,其中因素 A 包含 r 个水平,因素 B 包含 c 个水平。对这两组因素作随机抽样调查,得到一个 rc 的二维列联表,记为 。要寻求列联表列因素 A 和行因素 B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A 和因素 B 具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素 A、 B 的联系。3、简述费希尔判别法的基本思想。从 k 个总体中抽取具有 p 个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数系数:确定的原则是使得总体之间区别最大
9、,而使每个总体内部的离差最小。将新样品的 p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。5、简述多元统计分析中协差阵检验的步骤第一,提出待检验的假设 和 H1;第二,给出检验的统计量及其服从的分布;第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受) 。协差阵的检验检验 0pHI:/2/21expnpetrS00:/*nt检验 12k 12k:统计量 /2/2/211i iknpnnpi iS6、在进行系统聚类分析时,不同的类间距
10、离计算方法有何区别?请举例说明。设 dij表示样品 Xi与 Xj之间距离,用 Dij表示类 Gi与 Gj之间的距离。( 1) . 最短距离法 ,minikjrkr ijXGDdn,kpq( 2)最长距离法 ,axipjqpqijXG,ikjrkrijdax,kpqD( 3)中间距离法ijij ji, 2221pqkqkpkrD 其中( 4)重心法2()()pqpqpqDXX )(1qprXn2222pqpqkrkkrrnnD( 5)类平均法221ipjpqijXGDdn221ikjrkr ijXGrdn22pqkkrrnD( 6)可变类平均法其中 是可变的且 1( 7)可变法其中 是可变的且
11、12221()krkpqpqDD( 8)离差平方和法 1()()tntittittSXX2222kpkqkr kpqrrnnnDD7、比较主成分分析与因子分析的异同点。相同点:两种分析方法都是一种降维、简化数据的技术。两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。 主要区别是:主成分分析本质上是一种线性变换,将原始坐标变换到变异程度大的方向上为止,突出数据变异的方向,归纳重要信息。而因子分析是从显在变量去提炼潜在因子的过程。此外,主成分分析不需要构造分析模型而因子分析要构造因子模型。 9、进行相应分析时在对因素 A和因素 B进行相应分析之前没有必要进行独立性检验?为什么?有必要,如果因素A和因素B独立,则没有必要进行相应分析;如果因素A和因素B不独立,可以进一步通过相应分析考察两因素各个水平之间的相关关系。2222(1)pqkrkkpqrrn