1、 我对非参数的认识 课程名称: 非参数统计 任课老师 : XXX 姓 名 : XXX 学 号: XXXXXX 班 级: XXXZZ 2014 年 2 月 8 日 目录 一、引言 3 1.1 导语 . 3 1.2 本文主要内容 3 二、非参数统计的基础知识 . 4 2.1 非参数统计的理解 4 2.1.1 非参数统计的定义 4 2.1.2 非 参数统计与参数统计的基本区别 4 2.2 非参数统计的适用范围 4 2.3 非参数统计的优缺点分 析 5 2.3.1 非参数统计的优点 5 2.3.2 非参数统计的缺点 6 三、非参数检验 (复习总结 ) . 6 3.1 非参数检验方法 6 3.1.1 非
2、参数检验方法适用情形分析 7 3.1.2 非参数检验 与参数检验适用情形比较 8 3.2 几种情形下的非参数检验介绍 8 3.2.1 单样本均值的检验 8 3.2.2 两个独立样本分布的检验 9 四、非参数估计 . 10 4.1 非参数回归介绍 10 4.1.1 非参数回归模型 . 10 4.1.2 光滑参数(窗宽)的选取 11 4.2 非参数回归方法 . 12 4.2.1 常用方法介绍 12 4.2.2 核回归(核估计) 13 4.2.3 K 近邻估计 14 4.3 非参数估计中的问题 15 4.3.1 光滑参数的选择(窗宽的选择) . 15 4.3.2 边界点 行为 16 4.2.3 维数
3、灾难 16 五、非参数统计的应用及发展 . 16 六、总结及感想 . 17 参考文献 18 一、 引言 1.1 导语 这学期选课不是很顺利,课程设置 让人不太满意。多元统计分析、时 间序列、高等计算方法,高等计算方法讲的都是物理计算方法没法选。三选二 ,只能选多元和时序, 虽然大学 都已经学过 ,心想应该是大学所学知识的 延伸 ,也要好好学。结果和大四一起上课,时序的教科书还和我本科的一样,成了纯粹的复习。只能想反正我学的也不是太好,再学一遍也好,“学而时习之,温故而知新”嘛。 高兴的是 刘 卫东 老师开 设 了一门非参数统计, 心想这是为我们统计班专门开设的,至少也得是 大学所学知识的复习和
4、延伸, 不能只是复习,果断选了非参数统计。课程主要是让每人 讲 一 篇论文, 通 过一学期的学习,对非参数有了新的认识,学到了很多新的知识,同时 提高了阅读英文论文的水平。 作为一学期的总结,就写一些自己对非参数的认识,介绍一下非参数 统计 的基本知识,非参数检验 ,非参数估计方法 及非参数 统计的 应用和发展 等。 1.2 本文主要内容 首先给出非参数统计的定义,介绍了 对非参数统计的 理 解;指出非参数统计与参数统计的区别;指出 非参数统计方法的适用范围, 并对非参数统计的优缺点进行说明。 其次对常用的非参数检验方法的适用情形进行分类总结,并与常用 的 参数检验 方 法的适用情形进行比较
5、; 介绍 了对单样本均值 和两个独立样本 的分布进行检验的常用 方法。 然后介绍了非参数回归的一般模型, 光滑参数的 几种 选取 方法, 常用的 非参数 回归方法, 并 具体介绍了 核回归( 核估计 ) 法和 K 近邻估计法; 指出非参数回归中存在的 几个 问题。 再者介绍了 非参数统计的应用和发展,最后对文 章内容进行 概括,并总结 学习非参数统计和 写论文的感想。 二、 非参数统计 的基础知识 2.1 非参数统计 的 理解 2.1.1 非参数统计的定义 一种统计方法称为非参数的,如果它至少满足下面的法则之一:( 1)该方法适用于分析名义尺度数据。( 2)该方法适用于分析次序尺度数据。( 3
6、)该方法适用于分析区间或比率尺度数据,这里除了有无限多个未知参数外。 非参数统计也称为不计分布统计,在进行统计时,不考虑总体的分布 而对数据进行处理的方法。 主要 包括非参数检验和非参数估计。 注: 1.大部分非参数方法都是基于秩而不是原始数据。 2.非参数统计与总体分布无关,不涉及总体参数,是因为其推断方法与总体分布无关;不应理解为与所有分布(例如有关秩的分布)无关。 2.1.2 非 参 数统计与 参数统计 的基本 区别 参数统计方法要求的前提条件是,数据 应服从或近似服从正态分布, t 检验、方差分析还要求方差具有齐性。当前提条件不满足时,就不应选用参数统计方法。 t 检验、方差分析和直线
7、相关回归分析都属于参数统计方法。 非参数统计方法对数据不要求必须是正态分布,也不要求方差必须具有齐性。当对数据 的分布情况及方差情况不清楚或没把握,或者经过检验不满足正态分布或方差齐性的要求时,就应当选用非参数统计方法对资料进行统计分析。符号检验、秩和检验属于非参数统计方法。 2.2 非参数统计的适用范围 ( 1) 若需要 分析 的数据不满足参数统计分析 所要求的假定 。比如 , 污染的正态分布,有奇异值的情形, 无 法 应用参数统计方法 。 再比如 , 我们曾遇到过的非正态总体小样本 数据 , 在 t-检验法也不适用时 , 作为替代 的 方法 , 就可以采用非参数检验 。 ( 2) 需要处理
8、的数据是定类 、定序、定距或定比 的数据 。 例如 , 消费者可能被问及对几种不同商标的饮料的喜欢程度 , 虽然 , 他们不能对每种商标都指定一个数字来表示他们对该商标的喜欢程度 , 却能将几种商标按喜欢的顺序分成等级 。这种情形可以采用非参数检验 。 ( 3) 所提的问题中并不包含参数 , 也不能用参数检验 。例如 , 我们想判断一个样本是否为随机样 本 ,采用非参数检验法就是适当的 。 ( 4) 当我们需要迅速得出结果时 ,也可以不用参数统计方法而用非参数统计方法来达到目的 。一般说来 , 非参数统计方法所要求的计算与参数统计方法相比 完成起来既快且易 。 有些非参数统计方法的计算 ,就算
9、对统计学知识不熟练的人,也能在收集数据时及时予以完成 。 2.3 非参数统计的优缺点 分析 2.3.1 非参数统计的优点 可以减少模型偏差 :传统参数方法依赖于对总体分布的假定,然 而现实总体往往并不满足假定的分布形式,这就导致模型与现实相背离, 产生模型偏差。而非参数方法完全从数据本身获得所需的信息,无需对总体分布强加假定条件,可以选择与数据最为 匹配的模型,从而 修 正了传统参数方法可能导致的模型偏差。 适用范围广: 从数据角度看,非参数方法不仅像参数方法一样可用于处理定距、定比数据,还可用于定类、定序数据。而定类、定序数据在社会科学领域大量存在,故其应用范围更广。从模型角度看, 因非参
10、数方法假定条件较少,也无需检验总体的参数,故其模型适应范围更广, 在此具有广泛意义的模型基础上得出的结论也具有普遍意义。 具有稳健性: 传统参数方法对总体分布具有很强的假定,但 强假定在现实 中常常难以满足,故易产生错误结果。而非参数方法并不依赖于假定,而是立 足于数据选择方法,保证了方法与现实(即数据)的高度一致,从而避免了错误结论的产生,具有稳健性。 简单易操作: 非参数统计的基本思想是 , 在总体分布未知的情况下 ,根据与原来总体分布无关的秩及其统计量的分布进行统计推断。可 见非参数方法的核心是秩,即数据点从小至大的排列次序,其含义直观, 易于理解。因此,以之为基础构建的整个非参数统计体
11、系也具有简单易操作的优势。 2.3.2 非参数统计的缺点 ( 1) 在可以确定总体分布 类型 的情况下,非参数统计不如参数统计那样具 有 更强的 针对性, 它没有充分利用样本所携带的关于总体的信息,因而效率会低一些,或在相同精度下,非参数估计比参数估计需要更大的样本。 但研究表明非参数统计与参数统计相比,即使在最有利于参数统计的情况 下,效率损失也是很小的,在大样本情况下更是如此,更何况在总体分布未知的情形下,非参数统计具有绝对的稳健优势。 ( 2) 不能进行外推运算 ,估计的收敛速度慢 。 (3) 高维诅咒 , 光滑参数的选取一般较复杂 。 三 、 非参数检验 (复习总结 ) 非参数检验是相
12、对于参数检验而言。一般来说 , 参数检验 , 假定比较数据服从某分布 , 通过参数的估计量对比较总体的参数作检验,统计上称为参数法检。如 t, u 检验、方差分析。 非参数检验是指在统计测量中不需要假定总体分布形式 , 任何分布都可以使用。 不需要 参数估计量, 检验的目的不是对参数估计或比较,而是比较数据的分布,对总体的分布的某种假设(对称性、分位数大小)进行统计检验的方法,称为非参数检验 。 常见的非参数检验统计量有 3 类 :计数统计量、秩统计量、符号秩统计量。 3.1 非参数检验方法 非参数检验的方法有很多,主要有二项检验、符号检验( McNemar 检验)、2检验 ( Fisher
13、精确检验、中位数检验 、 2拟合优度检验) ,秩检验( Wilcoxon秩 和检验、 Wilcoxon 符号秩 检验、 Mann-whitney 检验: kruskal-Wallis 检验) 、秩相关检验 ( Spearman 和 Kendall) 等 ,下面主要 分析 各种检验方法的适用情形,并与参数检验方法的适用情形进行比较。 3.1.1 非参数检验 方法适用情形分析 二项检验 : a 只有两种结果的 n 次独立 的 基本实验, 对 某种结果 出现概率 p 的 检验 b 检验有关随机变量分位数的假设 符号检验 : a 单个样本中值的检验。 b 用于 成对数据的比较,如 检验一对变量( x,
14、 y)中的一个随机变量是否比另一随机变量大 。 c 可用于两组不成对资料的比较和多组资料的比较,只是比较粗糙,但简单。 d 检验相关性。 e 符号检验的变形 : McNemar 检验 : 对名义数据进行检验,用来检验性质或状态前后是否发生显著性变化 。 Cox 和 Stuart 趋势性检验:检验某个数列是否有趋势存在 。 2检验 : a 2x2 列联表, 来自两个总体的观测,分别归入类 “ 1” 或 类“ 2” , 检验两个总体中类 “ 1” 的比例是否相同。 注: 可用 Fisher 精确检验。 Mantel-Haenszel 检验可用于几个 2x2 列联表的检验。 b rc列联表,检验各个
15、总体中同一类的概率是否相等。检验总体的两种划分标准是否独立。 c 中位数检验: 验证不同总体中抽取的几个样本是否有相同的中位数。 d 2拟合优度检验: 检验假设的分布函数与样本数据是否“拟合”。 秩检验 : a Wilcoxon 秩 和 检验:对于配对样本, 检验两个独立样本是否服从同一分布 b Wilcoxon 符号秩检验: 单样本中位数检验,配对样本的检验 c Mann-whitney 检验: 检验两个独立样本是否服从同一分布 d kruskal-Wallis 检验 : 检验多个独立样本的分布函数是否相同 e Friedman 检验 :用于几个匹配样本的推断 秩相关 检验 : Spearm
16、an 检验 和 Kendall 检验 :两个随机变量独立性检验 注: Spearman 检验可用于做趋势性检验( Daniels 趋势性检验:检验分布与时间是否独立), Kendall 检验可用于 基于相符和不相符的配对数 的检验 。 3.1.2 非参数检验与参数检验适用情形比较 检验类型 参数 非参数 单样本 Z 和 t 检验 符号检验 , Wilcoxon 符号秩检验 两个独立的样本 Z 和 t 检验 Wilcoxon 秩 和检验 Mann Whitney( U) 检验 几个独立的样本 CRD 方差分析 kruskal-Wallis 几个匹配的样本 RBD 方差分析 Friedman 检验
17、 相关性 Pearson 检验 Spearman 秩 相关 检验 Kendall 秩相关 检验 3.2 几种情形下的 非参数检验介绍 3.2.1 单样本均 值的 检验 0: = 0 1: 0 检验 显著 水平 为 符号检验: 统计量: 计算 样本 X 中大于 0 的个数,并且把它表示为 +, X 中大于 0 的个数 为 =n+ 基本思想: 如果 0成立,即样本均值为 0 ,则 +应该 不会太大 , 如果 +很大或 很小时则拒绝 0。 确定 P 值作结论: 在 0假设下, +服从 二项分布 b(n,1/2), 对于 n20,用 大样本 正态近似, t = 1/2(n+/2), 如果 T ,则拒绝
18、原假设 0。 否则,接受原假设。大样本时, 若 n50,用正态近似: 3( 1 ) / 4()( 1 ) ( 2 1 )2 4 4 8jjT n nuttn n n 其中 n 是样本数 , 为第 j 个相同 秩次的个数。 3.2.2 两个独立样本分布的检验 0: 两样本来自相同总体 1:两样本来自不同总体(双侧) , 检验 显著 水平 为 编秩:两样本混合编秩次, 分别求得 各 样本的秩和 12,RR。 Wilcoxon 秩 和检验 : 基本思想: 如 果 0成立 , 即两组分布 相同, 则 样本 “ 1” 的实际秩和应接近理论秩和1(N+1)/2; 样本 “ 2” 的实际秩和应接近理论秩和
19、2(N+1)/2。 如果相差较大,超出了预定的界值,则可认为 0不成立。 统计量: 121 2 1 2较 小 样 本 的 秩 和 , m i n ( , ) ,nnTR R n n 确定 P 值作结论: 若 (n110, n2n110),用 查表法 , 如果 T 位于检验界值区间内, p 不拒绝 0;否则, p 拒绝 0 若 n110, n2n110 时 , 采用正态近似法: 13123| ( 1) / 2 |z()( 1) (1 )12jjT n Nttn n NNN 其中 是有相同秩号的数据个数 。 Mann-Whitney U 检验 : Mann-Whitney U 检验 与 Wilco
20、xon 秩 和检验检验完全等价 , 只是前者用 T 统计量,而后者用 U 统计量: 1 1 2 21 2 1 1 2 2( 1 ) ( 1 )m i n ( , )22n n n nU n n R n n R 同理 小样本 用 查表 法 ,大样本用正态近似。 四、 非参数 估计 非参数估计包括概率密度函数的估计和非参数回归 及其他光滑技术 等, 下面介绍 非参数回归 的一些方法 。 4.1 非参数回归 介绍 4.1.1 非参数回归模型 非参数回归模型一般形式: = ()+,i = 1,2,n 其中 (x)为未知回归函数 , 是随机干扰 , (,)=1 为样本点。非参数方法假设函数 (x)的形式
21、完全未知, 而不是预先假定的函数形式 。 可假定 E() =0,E() = 2 以及对 i j,和 j是不相关的。如果假定变量 X 和 Y 都是随机的,他们有联合分布 (x,y),而 X的边际分布为 (x),一般来说 , (x)可认为 是 Y在 给 定 了 X = x 之 后 的 条 件 期 望 , 即 m(x) = E(Y|X = x) = (y|x)dy =(x,y)dy/f(x)。 定义线性 光滑器 : ( ) ( ) iiim x l x Y 风险 (均方误差 ): 211 ( ) ( ) ( ) nh i iiR h E m x m xn其中 ()hmx是 ()mx的估计, h 是光
22、滑参数,称为带宽或窗宽 。 4.1.2 光滑参数 (窗宽 )的 选取 理想的情况是希望选择合适的光滑参数 h,使得通过样本数据拟合的回归曲线能够最好的逼近真实的回归曲线 ( 即达到风险最小 ) ,这里真实回归函数 m(x) 一 般是未知的。 可能会想到用平均残差平方和来估计风 险 ,即 : 211 R (h )= ( ) ni h ii Y m xn但是这并不是一个好的估计,会导致过拟合(欠光滑),原因在于两次利用了数据,一次估计函数,一次估计风险。我们选择的函数估计就是使得残差平方和达到最小,因此它倾向于低估了风险。 缺一交叉验证法、广义交叉验证法 是应用最广的方法 , 但作为结果的窗宽却有
23、很大差别 ; 插入法是比较稳健的方法 ; Fan 和 Gijbels 提出提前渐进置换的方法 ; Ruppert 提出了经验选 取的方法 ; Allen 提出了 PRESS(prediction sum of squares)法; Wahba 和 Wold 在样条估计中提出 了相似的技术 ; Rice 用惩罚函数证明了在固定设计模型中的相关理论。 缺一交叉验证 法 : 2()11 ( ) ( ) ni i h iiC V R h Y m xn这里 () ()ihmx是略去第 i 个数据点后得到的函数估计 。 交叉验证的直观意义: 22( ) ( 1 ) ( ( ) ) ( ( ) ( ) (
24、) ) i i h i i i i h iE Y m x E Y m x m x m x ( 1 )22( 1 )( ( ) ) ( ( ) ( ) )( ( ) ( ) )( ( ) ( ) ) i i i h ii h ii h iE Y m x E m x m xE m x m xE m x m x因此有: E()Rh 2 +R = 预测风险 广义交叉验证 法 : 若1 ( ) ( )nh j jjm x l x Y那么缺一交叉验证得分 ()Rh 能够写成: 21 ()1 () 1 n i h ii iiY m xRh hL 这里 ()ii i iL l x 是光滑矩阵 L 的第 i 个
25、对角线元素。 则: 21 ()1() 1/ n i h iiY m xG C V h hn 其中, 11/ niiin n L, ()tr L 为有效自由度。 4.2 非参数 回归 方法 4.2.1 常用方法 介绍 常用 的非参数回归方法有:核估计 方 法、 近邻估计、 局部多项式回归、正则化方法、正态 均值模型、小波方法 、向前神经网络、径向基函数网络 等 。 见参考文献 8,参考文献 13 非参数回归方法 局部回归 样条光滑 正交回归 高维非参数问题 多元局部回归、薄片样条、 可加模型、投影寻踪、 回归树、张量积 等 。 光滑样条:光滑样条、 B 样条 正交级数光滑 Fourier 级数光
26、滑 wavelet 光 滑 核回归: N-W 估计、 P-C 估计、 G-M估计 局部多项式回归:线性 、多项式 近邻回归: k-NN、 k 近邻核 、 对称近邻 稳健回归: LOWESS、 L 光滑、 R 光滑、 M 光滑 4.2.2 核 回归(核估计) 核函数 K : 函数 K(.)满足 : ( ) 0Kx ( 1) ( ) 1K x dx ( 2) ( ) 0xK x dx ( 3) 22 () K x K x d x ( 4) 2() Kc K x dx 常见的核函数: Boxcar 核: ( ) 1/ 2 ( )K x I x ()Ix为示性函数 Gaussian 核: 2 /2(
27、) 1 / 2 xK x e Epanechnikov 核: 2( ) 3 / 4 (1 ) ( )K x x I x tricube 核: 33( ) 7 0 / 8 1 (1 | | ) ( )K x x I x 其它的核函数 还有: K(x) = 1/2|, 1(1+2)1, 12(sin (/2)/2 )2 等。 ( 1) N-W 估计 N-W 估计 由 Nadaraya(1964) 和 Watson(1964)分别提出,形式 : 11() ()(), nNW hihinihjjK x Xm x YK x X01x 其中 () = (/)/, ()为核函数 , h 为带宽或窗宽 . N
28、-W 估计是一种简单的加权平均估计,可以写成线性光滑器: 1 ( ) ( ) nNWh h i iim x W x Y,1()()()hihi nhjjK x XWxK x X( 2) P-C-估计 P-C-估计 由 Priestley and Chao(1972)提出,形式: 11 ( ) ( ) ( ) , nPCh i i i h iim x x x Y K x x01x写成线性光滑器的形式: 1 ( ) ( ) nPCh h i iim x W x Y, 1( ) ( ) ( ) h i i i h iW x x x K x x 注: 在随机设计模型下 , P-C 估计可由 x 的密度
29、估计: 11( ) ( )iif x n x x 推导出来 。 (3) G-M 估计 G-M 估计 由 Gasser and Mller(1979)提出,形式如下 : 11 ( ) ( ) iisnGMh i hi sm x Y K x u d u 其中 010 , ( ) / 2 , 1 , , 1 , 1 i i i ns s x x i n s 写成线性光滑器的形式 : 1 ( ) ( ) nGMh h i iim x W x Y,1( ) ( )iish i hsW x K x u d u 注: G-M 估计是卷积形式的估计, P-C 估计可看成 G-M 估计的近似 :当 k 连续,1
30、( , ) iix s s , 11 ( ) ( ) ( ) ( ) nG M P Ch i i i h him x Y s s K x x m x。 注: 1 一般核函数的选取并不是很重要,重要的是 窗 宽的选取 。 2 核估计存在边界效应,边界点的估计偏差较大 。 4.2.3 K 近 邻估计 对于随机设计模型,近邻估计写成线性光滑器的形式 1 ( ) ( ) nk ki iim x W x Y(1) k-NN 回归 权函数: 1/()0, , xki k i JWx o th e rw is e其中, : x x k是 离 最 近 的 个 观 测 值 之 一xiJi 估计的渐近偏差和渐近方
31、差: 231 ( ( ) ) ( ) ( ) ( 2 ) ( ) ( / )2 4 ( ) kkb i a s m x E m x m x m f m f x k nfx2 ()( ( ) k xV a r m x k(2)k-近邻核回归 K 近邻核估计的权重 :1()()()Riki nRiiK x xWxK x x其中 R 为 中离 x 最近的第 k 个距离, K 为核函数 : ( ) ( ( ) / ) / R i iK x x K x x R R 估计的 渐近偏差和渐近方差: 2 3 2 ( ( ) ) ( ) ( ) ( ) ( )8 k k Kk m f m fb i a s m
32、x E m x m x x dnf 22 ( )( ( ) kKxV a r m x ck(3)对称化近邻回归 () 1 ( ) ( )1 () n n n ik h ii F x F xm x K Yn h h写成线性光滑器 :( ) ( )1 () nk h k h i iim x W Y其中权重,() 1 ( ( ) ( ) )k h i h n n iW K F x F xn这里 的 k(h)相当 于 nh, 可以看出实质上相当 于 nh 个 值加权平均 。 4.3 非参数 估计中 的问题 4.3.1 光滑参数的选择 (窗宽的选择) 任何一种 光滑技术 都涉及光滑参数的选取问题。对非参
33、数回归来讲 , 光滑参数的选取问题十分重要 , 窗宽控制估计得光滑度。小窗宽得到的估计会有很多摆动,这表明由于不够光滑而产生了高度变异;大窗宽会光滑掉很多重要的特征,因此会有偏差。即 对于非参数回归, 随便选取一个光滑参数可能会使回归曲线要么太平滑要么太不平滑。 在核回归中 ,许多作者都表明在选择窗宽时忽略误差相关的问题会产生很重要的结果 , 在局部多项式中也是如此。他们研究了误差项为自相关时的情形并且提出了修正的办法。 Hall 探讨过当局部多项式回归误差项相关时的光滑参数的选取问题 ,他们提出了核回归与局部线性回归的修正交叉核实的方法 ; Hyndman、Wand 研究了自协方差函数的局部
34、多项式估计。 Chiu、 Truong 和 Hart 假定自相关函数为参数形状并且提出了选择窗宽的许多修正办法。 Altman 提出非参数的估计均值函数与自相关函数非参数估计办法 , 并且用交叉核实 方法选择光滑参数 。见参考文 献 7 4.3.2 边界点行为 在边界点光滑方法就显得不太精确了 , 这主要是因为在边界点观察到的样本太少 , 因此方差或者误差加大 。 Rice 用 “Jackknifing” 技术解决了这个问题 ; Gasser 和 Muller 用边界核方法也讨论了这个问题 ; 对于样条函数情形 , Rice and Rosenblatt 计算了边界误差 ; Messer、 G
35、oldstein 建议用自动改变形状的变量核 ;Yang 和 Stute 提 出对称近邻估计 ; 边界点问题也可用局部多项式来修正。 见参考文献 7 4.2.3 维数灾难 将函数估计推广到高维 , 则会碰到维数诅咒 , 它意味着当观测值的维数增加时估计难度会迅速增 大。 维数诅咒有两层含义 : 一是计算的维数诅咒,指的是某些算法的计算量随着维数的增长而成指数增加。 解决方法通常采用优化算法 , 例如遗传算法 、 粒子群算法 、 蚁群 算法等。 二是样本的维数诅咒 , 指的是数据维数为 d时 , 样本量需要随着 d指数增 长。所以把 方差限制到要求的范围内所需数据量随维数的迅速增长 。 在函数估
36、计中 ,第二层含义更为重要 。 在高维问题中 , 由于数据非常稀少 , 导致局部邻域中包含极少的数据点 , 因此估计变得异常 困难, 目前有 还没 有较 好 的 解决 办法 。 五、非参数统计的应用及发展 由于 非参数统计 具有不受样本分布形式的限制 、应用范围广 、 发生模型错误的可能性较小 、 有较大的稳定性等特点 ,在各领域得到广泛 应用 。 将非参数估计应用于经济模型中,用来解决经济生活中的诸多问题 ,已被视为经济研究的前言。已经有很多人在这方面进行研究,例如 非参数统计 在市场调查、人口控制等方面 的应用 、 用非参数法研究 GDP 与固定资产投资 的 关系、 及非参数统计对房地产价
37、格 的研究 等 。 非 参数统计是 21 世纪统计理论三大发展方向之一。 考察国际非参数统计发展现状, 一些具有发展潜力与价值的领域已初露端倪,正逐渐显现出轮廓。 非参数推断 对于 非参数 统计 没有 普遍适用的原则。 Fan 和 Zhang 提出广义似然比方法并证明其具有多种统计学上的优良特征。 但仍有待深入研究以开发普遍适用的方法 。 高维非参数建模 重要的统计问题往往是多元的,高维的,且混合了离散型和连续型变量。现有的非参数模型中尽管不乏极具富创新性的例子,但他们并不能完全解决上述问题。高维分类问题便是制约的瓶颈,对该问题的解决将更加迫切,因此,高维非参数建模 技术的研究将具有重要意义
38、有着光明的前景。 功能数据分析 大规模数据集可以通过曲线和图像的形式较容易地收集。 但与之相关的基于功能数据的预测、建模、推断技术的研究尚未展开,仍存在较大的发展空 间, 这便是非参数统计的用武之地。 其他领域如电信、信息工程学、生物统计学、非线性时间序列 的许多问题都需要统计分析工具 。非参数统计必 将以其适用范围广等强大的优势,在与其他学科的结合中继续发展。 六 、 总 结 及感想 首先说一下,非参数统计给我印象最深的两点是 非参数 检验 对 秩的 巧妙应用和参数 回归中的核估计 思想 。 本文对非参数统计的基本知识 , 非参数检验 , 非参数估计,非参数统计的 应用发展做了大致的介绍,比
39、较全面的阐述了非参数统计所涉及的内容,为以后学习 使用打下了基础。 通过写这篇文章,把非参 数统计 所涉及 的基本 知识 梳理了一遍,着实学到了很多东西 。 通过 对以前非参数检验的知识进行复习总结,加强了理解。 通过 对 新知识点 的学习和 整理 , 对非参数统计有了 更进一步的认识 大学 所 学的非参数检验,比较简单,很容易理解 ,但非常经典而又实用 。书本上 有很多实例可以加深理解。检验方法 较多 ,适用 各种 不同情形, 有些方法适用情 形都有交叉 ,也不是很好明确的分类 ,根据自己的理解 大体 分了类, 虽 不一定完全正确 ,但 清晰了许多, 以后应用起来也顺手。 非参数估计 是新学
40、的知识,以前没接触过。密度函数的估计和非参数回归都是 很 重要的内容 ,不过没有 非参数检验简单易懂, 这部分 理论比较重要 ,首先要掌握好理论,再与实际应用 相结合才能够 很好的理解。 大数据时代 -以数据为中心的时代,尤其是 高维数据 , 非参数统计 或统计学将会有越来越广泛的应用。 一定要 学好统计,为以后学习使用打下坚定的基础。 参考文献 1 崔恒建,实用非参数统计 , 北京:人名邮电 出版社, 2006。 2 梁增聪,非参数统计的应用,理学硕士 论文。 3 谷彬,赵彦云,非参数统计作用与发展,中国统计, 2007。 4 非参数统计方法 , 麻省理工课件 ,百度文库 http:/ 5宋
41、昕,蔡泳,徐刚,王旸,非参数检验方法概述, 2004,13(6),561-563。 6 秩转换的非参数检验, 百度文库 http:/ 7 戴丽娜 , 非参数 技术 理论 及应用 综述 , 新乡学院学报(自然科学版) 2008,25(3): 14-16 8 戴丽娜, 非参数理论综述 ,数学的实践与认识 2008, 38(24): 186-189 9 张煜东 , 颜俊,王水花,吴乐南,非参数估计方法,武汉工程大学学报 , 2010,32(7): 99-103 10 张守一 ,葛新权,王斌,非参数回归及其应用,数量经济技术经济研究 ,1997, 10: 60-62 11 Emanuel Parzen
42、, On Estimation of a Probability Density Function and Mode ,1962,33(3): 1065-1076 12 Jacqueline K.Benedetti, On the Nonparametric Estimation of Regression Functions, 1977,39(2): 248-253 13 Wei Biao Wu& Jan Mielniczuk, Kernel Density Estimations for Liner Process 2002,30(5): 1441-1459 14 王兆军,刘民千,邹长亮,杨建峰,计算统计,北京:人名邮电出版社,2009, 228-242 15 非参数回归简介 , 百度文库 http:/