收藏 分享(赏)

统计学分析题 ppt课件.ppt

上传人:微传9988 文档编号:2164894 上传时间:2018-09-03 格式:PPT 页数:55 大小:1,007KB
下载 相关 举报
统计学分析题 ppt课件.ppt_第1页
第1页 / 共55页
统计学分析题 ppt课件.ppt_第2页
第2页 / 共55页
统计学分析题 ppt课件.ppt_第3页
第3页 / 共55页
统计学分析题 ppt课件.ppt_第4页
第4页 / 共55页
统计学分析题 ppt课件.ppt_第5页
第5页 / 共55页
点击查看更多>>
资源描述

1、统计学原理,分析题,第4章 数据的概括性度量,分析要点: 1. 离散系数 2. 经验法则 3. 标准化分数,例1,一项关于大学生体重状况的研究发现,男生平均体重为60kg,标准差为5kg;女生平均体重为50kg,标准差为5kg。回答以下问题: 男生体重差异大还是女生体重差异大? 估计男生体重在5565kg之间的百分比? 估计女生体重在4060kg之间的百分比?,例1,因标准差相等,应当计算并比较离散系数:55kg65kg等于平均数加减1个标准差,根据经验法则,大约68%的男生体重介于该范围。 40kg60kg等于平均数加减2个标准差,根据经验法则,大约95%的女生体重介于该范围。,例2,一生产

2、线平均每天产量3700件,标准差50件。如果某天产量落在平均产量的2个标准差以外,就认为生产线“失去控制”,以下是一周的产量,问哪几天失去了控制?,例2,计算标准化分数(Z),结论:周一和周六的产量超出了控制范围(-2 z 2),第5章 概率与概率分布,要点:正态分布中的概率计算,例:用正态分布计算概率,一本书排版后一校时出现错误数服从正态分布N (200,202 ),求: 出现错误数不超过230的概率; 出现错误数在190210之间的概率。,例:用正态分布计算概率,PHstatProbability & Prob. DistributionsNormal,结论:错误不超过230的概率为93.

3、32%,例:用正态分布计算概率,PHstatProbability & Prob. DistributionsNormal,结论:错误在190210之间的概率为38.29%,第6章 统计量及其抽样分布,要点: 1. 确定样本均值的分布并计算相关概率 2. 确定样本比例的分布并计算相关概率,例1:样本均值的分布,作为市场营销研究的一部分,Food King超市连锁店随机抽取150名顾客。顾客的平均消费为31.84美元。取样之前,该公司假定顾客消费的平均水平为$ 30.00,标准差为8.00美元。如果这些假定是正确的,那么抽取的顾客平均消费在31.84美元以上的概率是多少?这个概率对于该公司先前的

4、假定意味着什么?,例1:样本均值的分布,确定样本均值的分布,例1:样本均值的分布,计算概率 PHstatProbability & Prob. DistributionsNormal,抽取的顾客平均消费在31.84美元以上的概率是0.0024;该抽样结果为小概率事件(且概率相当小),因此公司先前的假定极有可能是错误的。,例2:样本比例的分布,假定支持某项提案的真实选民比例为 p = 0.4。现在随机调查200个选民,问支持该提案的比例在0.4到0.45之间的概率是多少?,例2:样本比例的分布,确定样本比例的分布,例2:样本比例的分布,计算概率 PHstatProbability & Prob.

5、 DistributionsNormal,支持该提案的比例在0.4到0.45之间的概率是42.55%,第7章 参数估计,要点: 1. 估计总体均值的置信区间 2. 估计总体比例的置信区间,已知灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命如下。建立该批灯泡平均使用寿命95%的置信区间,例1:估计总体均值的置信区间,例1:估计总体均值的置信区间,PHstatConfidence IntervalsEstimate for the Mean, sigma unknown,例1:估计总体均值的置信区间,该种灯泡平均使用寿命的置信区间为:1476.8h1503.2h,例2:估计总

6、体比例的置信区间,某城市想要估计下岗女性职工比例,随机地抽取了100名下岗职工,其中65人为女性。试以95%的置信水平估计该城市下岗职工中女性比例的置信区间,例2:估计总体比例的置信区间,PHstatConfidence IntervalsEstimate for the proportion,该城市下岗职工中女性比例的置信区间为:55.65%74.35%,第8章 假设检验,要点: 1. 总体均值的假设检验 2. 总体比例的假设检验,总体均值的检验,总体标准差已知时,用正态分布确定样本发生概率总体标准差已知时,用 t 分布确定样本发生概率,用样本标准差s代替,应用PHstat,例:总体均值的正

7、态检验,某批发商欲从厂家购进一批灯泡,合同规定灯泡平均使用寿命不低于1000小时。已知标准差为200小时,现随机抽取100支灯泡,测得平均寿命为960小时。问该批灯泡的平均寿命是否低于合同规定?,原假设,显著性水平,总体标准差,样本容量,样本均值,左侧检验,建立假设:样本信息必须支持备选假设 H1,例:拒绝原假设时,某批发商欲从厂家购进一批灯泡,合同规定灯泡平均使用寿命不低于1000小时,已知标准差为200小时。现随机抽取100支灯泡,测得平均寿命为960小时。问该批灯泡的平均寿命是否低于合同规定?,决策:P= 0.022 = 0.05,拒绝原假设,接受备选假设。 结论:该批灯泡的平均寿命低于

8、合同规定。,例:不拒绝原假设时,某批发商欲从厂家购进一批灯泡,合同规定灯泡平均使用寿命不低于1000小时,已知标准差为200小时。现随机抽取100支灯泡,测得平均寿命为980小时。问该批灯泡的平均寿命是否低于合同规定?,决策:P= 0.022 = 0.05,不能拒绝原假设。 结论:不能认定该批灯泡的平均寿命低于合同规定。,总体比例的检验,应用PHstat,例:总体比例的检验,一项统计结果声称,某市老年人口(65岁以上)的比重为14.7%,为检验该项统计是否可靠,现随机抽选400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?,样本中具有某种特征的样

9、本个数,例:总体比例的检验,一项统计结果声称,某市老年人口(65岁以上)的比重为14.7%,为检验该项统计是否可靠,现随机抽选400名居民,发现其中有57人年龄在65岁以上。调查结果是否支持该市老年人口比重为14.7%的看法?,决策:P= 0.0799 = 0.05,不能拒绝原假设。 结论:该市老年人口比重为14.7% 。,第10章 方差分析,要点: 1. 单因素方差分析 2. 双因素方差分析,例:单因素方差分析,一管理咨询机构为不同层次管理者提供培训,为评价培训效果,对随机抽取的不同层次管理者进行满意度调查,评分结果如下:,问:管理者的层次评分是否对评分有显著影响?,例:单因素方差分析,P-

10、value(组间)0.05,拒绝H0,说明不同层次管理者的满意度评分有显著差异。,H0:管理者层次对评分无显著影响,例:可重复双因素方差分析,一超市连锁店进行一项调查,以确定超市位置和竞争者数量对销售额是否有显著影响。以下是相关数据:,超市位置对销售额是否有显著影响? 竞争者数量对销售额是否有显著影响? 超市位置和竞争者数量对销售额是否有显著的交互影响?,例:可重复双因素方差分析,Excel工具数据分析方差分析: 可重复双因素分析,三次重复试验,即每个组内包含3个数据,例:可重复双因素方差分析,P-value(行)0.05,拒绝H0,说明超市位置对销售量有显著影响 P-value(列)0.05

11、 ,拒绝H0,说明竞争者数量对销售量有显著影响 P-value(交互)0.05 ,拒绝H0,说明超市位置和竞争者数量对销售量有显著的交互影响,第11章 一元线性回归,要点:建立一元线性回归模型,解释并检验回归系数,例:P347_11.7,PHStat | regression | simple linear regression,输入待预测的自变量值,输入预测区间的置信水平,例:P347_11.7,解释回归系数:回归系数-4.7002表示航班正点率每增加1%,旅客投诉次数平均下降4.7次,检验回归系数显著性:P-value=0.00110.05,表明回归系数显著,即航班正点率对投诉次数有显著影

12、响,例:P347_11.7,航班正点率为80%时,估计投诉次数为54.139次,航班正点率为80%时,投诉次数的置信区间为(54.13916.479),航班正点率为80%时,投诉次数的预测区间为(54.13946.567),第9章 列联分析,例:列联分析,某报社想了解读者的阅读习惯是否与文化程度有关,随机调查了254位读者,得到以下数据:,例:列联分析,例:列联分析,粘贴,例:列联分析,决策: p = 0.00021 = 0.05,拒绝H0,结论: 阅读习惯与文化水平有关。,第12章 多元线性回归,例:馅饼模型,写出多元回归方程并解释回归系数; 检验模型总体的显著性和回归系数的显著性( =0.

13、05); 回归方程的解释比例(R2); 估计回归系数的置信区间(置信水平95%); 当价格为 5.5、广告费为350时,预测平均每周的馅饼销量和3季度第一周的馅饼销量 (置信水平95%) 。,用 PHstat作回归分析,PHstatRegressionMultiple linear regression,PHstat 输出结果,1.写出回归方程并解释回归系数,1 = -24.975: 如果广告费不变,价格每增加一美元,每周销量将平均下降24.975单位。,2 = 74.131:如果价格不变,广告费每增加100美元,每周销量将平均增长74.131单位。,2.检验总体显著性和回归系数显著性,总体显

14、著性检验回归系数显著性检验,p =0.012 =0.05,拒绝H0 结论:至少有一个自变量显著影响因变量。,p (价格) = 0.0398 0.05,拒绝H0; p (广告费) = 0.0145 0.05,拒绝H0。 结论:价格和广告费对销量均有显著影响,价格和广告费可以解释销量变动的52.1% 。,如果广告费不变,价格每增加1美元,销量将下降 1.37 至 48.58个单位; 如果价格不变,广告费每增加100美元,销量将上升 17.55 至 130.71个单位;,3.回归方程的解释比例(R2),4.估计回归系数的置信区间,5.预测,PHStat | regression | multiple regression ,输入自变量值,5.预测,预测平均每周的馅饼销量为391至466个单位,预测3季度第一周的馅饼销量为318至538个单位,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 中等教育 > 小学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报