1、2010-2011-2 校选课数学文化课程论文浅谈正态分布及应用学 院(部): 机械工程学院 专 业: 机械类 学 生 姓 名: 班 级: 学号 任课教师姓名: 职称 最终评定成绩 2011 年 5 月校选课数学文化课程论文摘 要正态分布(normal distribution) ,是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。正态分布有极其广泛的实际背景, 例如测量误差, 人的生理特征尺寸如身高、体重等 ,正常情况下生产的产品尺寸:直径、长度、重量高度,炮弹的弹落点的分布等, 都服从或近似服从正态分布,以及确定医学参考值范围,药品规格,用量等。可以说
2、,正态分布是自然界和社会现象中最为常见的一种分布, 一个变量如果受到大量微小的、独立的随机因素的影响, 那么这个变量一般是一个正态随机变量。关键词:高斯分布、特征、转化、医学参考值一、正态分布(一)正态分布的由来正态分布(normal distribution)又名高斯分布(Gaussian distribution) 。正态分布概念是由德国的数学家和天文学家 Moivre于 1733年受次提出的,但由于德国数学家 Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出
3、于这一工作。正态分布是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量 X服从一个数学期望为 、标准方差为 2的高斯分布,记为:则其概率密度函数为正态分布的期望值 决定了其位置,其标准差 决定了分布的幅度。因其曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布是 = 0, = 1 的正态分布。(二)正态分布的特性如下图,正态分布的特征有:;)1(对 称曲 线 关 于 x;21)(,2f取 得 最 大 值时当 ;0)3(时当4处 有 拐 点曲 线 在 x;)5(轴 为 渐 近 线曲 线 以 ; ,)(,6轴 作 平 移 变 换着
4、只 是 沿图 形 的 形 状 不 变的 大 小 时改 变当 固 定xxf校选课数学文化课程论文(三)一般正态分布与标准正态分布的转化由于一般的正态总体 其图像不一定关于 y轴对称,对于任一正态总体 ,其取值小于 x的概率 。只要会用它求正态总体 在某个特定区间的概率即可。 “小概率事件”和假设检验的基本思想“小概率事件”通常指发生的概率小于 5%的事件,认为. ,)(,)7(图 形 越 矮 越 胖 越 大图 形 越 高 越 瘦越 小而 形 状 在 改 变图 形 的 对 称 轴 不 变的 大 小 时改 变当 固 定 xf校选课数学文化课程论文在一次试验中该事件是几乎不可能发生的。这种认识便是进行
5、推断的出发点。关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有 5%的犯错误的可能。一般而言,都是应用公式进行转化。(四)一般正态分布与标准正态分布的区别与联系正态分布也叫常态分布,是连续随机变量概率分布的一种,自然界、人类社会、心理和教育中大量现象均按正态形式分布,例如能力的高低,学生成绩的好坏等都属于正态分布。标准正态分布是正态分布的一种,具有正态分布的所有特征。所有正态分布都可以通过 Z分数公式转换成标准正态分布。 两者特点比较: (
6、1)正态分布的形式是对称的,校选课数学文化课程论文对称轴是经过平均数点的垂线。 (2)中央点最高,然后逐渐向两侧下降,曲线的形式是先向内弯,再向外弯。 (3)正态曲线下的面积为 1。正态分布是一族分布,它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。标准正态分布是正态分布的一种,其平均数和标准差都是固定的,平均数为0,标准差为 1。 (4)正态分布曲线下标准差与概率面积有固定数量关系。所有正态分布都可以通过 Z分数公式转换成标准正态分布。 二、正态分布的应用(一)综述生活中各样各类的问题都可以用正态分布来解决或体现。它主要包含这些方面:1. 估计频数分布 一个服从正态分布的变量
7、只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。2. 制定参考值范围 :(1)正态分布法 适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。 (2)百分位数法 常用于偏态分布的指标。3. 质量控制:为了控制实验中的测量(或实验)误差,常以 作为上、下警戒值,以 作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。4. 正态分布是许多统计方法的理论基础。 检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推
8、断方法也是以正态分布为理论基础的。 (二)估计正态分布资料的频数分布例 1.10 某地 1993年抽样调查了 100名 18岁男大学生身高(cm) ,其均数=172.70cm,标准差 s=4.01cm,估计该地 18岁男大学生身高在 168cm以下者占该地 18岁男大学生总数的百分数;分别求 X+-1s、X+-1.96s、X+-2.58s 范围校选课数学文化课程论文内 18岁男大学生占该地 18岁男大学生总数的实际百分数,并与理论百分数比较。本例,、 未知但样本含量 n较大,按式(3.1)用样本均数 X和标准差S分别代替 和 ,求得 u值,u=(168-172.70)/4.01=-1.17。查
9、附表标准正态曲线下的面积,在表的左侧找到-1.1,表的上方找到 0.07,两者相交处为0.1210=12.10%。该地 18岁男大学生身高在 168cm以下者,约占总数 12.10%。其它计算结果见表 3。 表 3 100名 18岁男大学生身高的实际分布与理论分布 分布 x+-s身高范围(cm)实际分布人数实际分布 百分数(%)理论分布(%)X+-1s 168.69176.7167 67.00 68.27X +-1.96s 164.84180.5695 95.00 95.00X+-2.58s 162.35183.0599 99.00 99.00(三)制定医学参考值范围某些医学现象,如同质群体的
10、身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。 医学参考值范围亦称医学正常值范围。它是指所谓“正常人”的解剖、生理、生化等指标的波动范围。制定正常值范围时,首先要确定一批样本含量足够大的“正常人” ,所谓“正常人”不是指“健康人” ,而是指排除了影响所研究指标的疾病和有关因素的同质人群;其次需根据研究目的和使用要求选定适当的百分界值,如80%,90%,95%和 99%,常用 95%;根据指标的实际用途确定
11、单侧或双侧界值,如白细胞计数过高过低皆属不正常须确定双侧界值,又如肝功中转氨酶过高属不正常须确定单侧上界,肺活量过低属不正常须确定单侧下界。另外,还要根据资料的分布特点,选用恰当的计算方法。常用方法有: (1)正态分布法:适用校选课数学文化课程论文于正态或近似正态分布的资料。 双侧界值:X+-u(u)S 单侧上界:X+u(u)S,或单侧下界:X-u(u)S (2)对数正态分布法:适用于对数正态分布资料。 双侧界值:lg-1X(lgx)+-u(u)S(lgx);单侧上界:lg-1X(lgx)+u(u)S(lgx),或单侧下界:lg-1X(lgx)-u(u)S(lgx)。 常用 u值可根据要求由表
12、 4查出。 (3)百分位数法:常用于偏态分布资料以及资料中一端或两端无确切数值的资料。 双侧界值:P2.5 和 P97.5;单侧上界:P95,或单侧下界:P5。 表 4常用 u值表 参考值范围(%) 单侧 双侧80 0.842 1.28290 1.282 1.64595 1.645 1.96099 2.326 2.576结 论正态分布不仅仅应用在医学方面,在实际中处处都可以看到正态分布,如 t分布、F 分布、分布都是在正态分布的基础上推导出来的,u 检验也是以正态分布为基础的。机械加工中的测量误差,机械设计中的 CPK,也都跟正态分布息息相关。数学研究的最终目的是服务人类,正态分布的研究成果为
13、当代人类的生活,科技都作出了巨大贡献。参考文献:【1】 周勇、朱硕.线性代数:复旦大学出版社;2010.【2】 张飞虎等.袁哲俊学术论文选集:哈尔滨工业大学出版社;2006.【3】 Yihaizhiyuan.高斯分布:CSDN 空间;2011【4】 刘东南.线性代数讲义:湖南工业大学;2010校选课数学文化课程论文本人签名:曹为 日 期:2011、4、25校选课数学文化课程论文最终成绩评定表学生姓名 学 号 班 级学 院 专 业论文名称成 绩 评 定 标 准 分值(总分 100分)论文格式符合要求。 20概念清楚,思路清晰。 20论点正确,实验方法科学。 20语言表达准确,分析归纳合理。 20结论严谨,论文观点有创新之处。 20最终评定成绩分数: 等级:评分教师签名:年 月 日