1、5 参数估计,点估计区间估计,本章的学习目的,抽样与抽样分布是推断统计的基础。 统计推断就是根据样本的信息,对总体的特征作出推断,包括参数估计和假设检验。 参数估计是在抽样及抽样分布的基础上,根据样本的统计量来推断总体参数。 一个总体参数的估计,两个总体参数的估计,样本容量的确定。,举例,一家食品厂以生产袋装食品为主,每天的产量大约为8000袋左右。按照规定,每袋的重量应不低于100g,否则即为不合格。由于产品数量大,进行全面检查是不可能的,所以需要抽样,然后用样本数据估计平均每袋的重量。 问题:抽取的样本大小?估计的误差?,基本概念,常用的估计量,样本平均数、样本方差、样本比率。 点估计:用
2、一个点(数)估计未知参数。 优点:简单,能够明确的估计总体参数。 缺点:其误差与可靠性不得而知。 区间估计:用一个区间估计未知数,把未知参数估计在某两界限之间。样本统计量加减抽样误差。,的抽样分布,点估计的最大好处:给出确定的值 点估计的最大问题:无法控制误差,68.27%,95.45%,99.73%,统计方法,统计描述,统计推断,参数估计,假设检验,点估计,区间估计,区间估计,置信区间,样本统计量,置信下界,置信上界,总体参数落在某区间内的概率,置信水平,未知总体参数落在区间内的概率 表示为 (1 )置信水平 是参数不落在区间内的概率 通常取值 99%, 95%, 90% 即 =0.01,
3、=0.05, =0.10,置信区间,90% 样本,95% 样本,99% 样本,影响区间宽度的因素,区间的宽度影响因素 1. 数据离散度 2. 样本容量 n 3. 置信水平 (1),区间估计的步骤 (以总体均值的区间估计为例),1. 确定置信水平 ; 2. 根据置信水平,查标准正态分布表确定其 值; 3. 实际抽样,并计算样本的均值 和抽样误差 ; 4. 确定置信区间:,区间估计的内容,区间估计,总体均值的 区间估计,总体比例的 区间估计,总体方差的 区间估计,两个总体 均值之差,单一总体,举例大样本或方差已知,一家食品企业以生产袋装食品为主,每天的产量大约为8000袋左右。按照规定,每袋的重量
4、应不低于100g,否则即为不合格。企业的质检部门对产品进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批产品中随机抽取了25袋,重量如下表(单位:g),举例大样本且方差已知,已知产品的重量分布服从正态分布,且总体标准差为10g,试估计该批产品平均重量的置信区间,置信水平为95%。,举例大样本方差未知,一家保险公司收集到由36个投保人组成的随机样本,得到每个投保人的年龄数据,试确立投保人年龄90%的置信区间。,由于总体方差未知,但为大样本,所以可用样本方差来求总体方差。 总体方差 2可由样本方差 s 2 代替。投保人平均年龄90%的置信区间是(37.37, 41.63) 有90%的把握说总
5、体平均值落在这个区间。,举例大样本方差未知,举例大样本方差未知,某超市通过100位顾客的随机样本研究购买额。均值为24.75元,标准差为5.50元。试求总体均值90% 的置信区间。由于是大样本,因此样本平均数的分布服从正态分布,同时可用样本标准差s估计总体标准差。有90%的把握说总体平均值落在(23.85, 25.65)区间。,样本容量的确定影响因素,总体各单位标志值的差异程度(即标准差的大小): 越大,所需样本容量越多; 推断的可靠程度,即置信度:对可靠程度要求越高,所需样本容量越大; 允许的极限误差的大小: 越大,所需样本容量越小; 抽样方法和抽样组织方式:重复抽样比不重复抽样所需样本容量要多;类型抽样比简单随机抽样所需样本容量多。,估计总体均值时: 估计总体比例时:,样本容量的确定计算,