收藏 分享(赏)

统计学导论34257.ppt

上传人:dzzj200808 文档编号:3320182 上传时间:2018-10-12 格式:PPT 页数:40 大小:1.76MB
下载 相关 举报
统计学导论34257.ppt_第1页
第1页 / 共40页
统计学导论34257.ppt_第2页
第2页 / 共40页
统计学导论34257.ppt_第3页
第3页 / 共40页
统计学导论34257.ppt_第4页
第4页 / 共40页
统计学导论34257.ppt_第5页
第5页 / 共40页
点击查看更多>>
资源描述

1、课程意义,统计学知识是交通调查的基础 (速度、流量、公交、OD等等) 统计已经融入到我的生活当中了 (各种经济社会参数CPI、失业率;天气预测;比赛结果预测;彩票;帮助我们看透一些新闻报道和调查结果),无处不在的统计,在诺贝尔经济学获奖者中,三分之二以上的研究成果与统计和定量分析有关。因此,著名经济学家萨缪尔森在其经典的教科书,经济学12版中特别提到:“在许多与经济学有关的学科中,统计学是特别重要的”。 1981年,首届国际红楼梦研讨会在美国召开,威斯康星大学讲师陈炳藻独树一帜,宣读了题为从词汇上的统计论红楼梦作者的问题的论文。他从字、词出现频率入手,通过计算机进行统计、处理、分析,对红楼梦后

2、40回系高鹗所作这一流行看法提出异议,认为120回均系曹雪芹所作。,美国杜邦公司的总经理理查德曾经指出“现代公司在许多方面是根据统计来行事的。”(转引自马夸德特谈统计学家的重要作用,统计教育1994年第3期)。 美国总统布什的年薪已经达到40万美元,在各国元首中名列首位,但根据美国工作等级年鉴一书的排名,总统一职并未进入最好工作之列。根据该书的统计,在美国,工作环境最好的工作是:统计学家。(转引自2002年3月7日扬子晚报),统计数字,大仲马的作品多曲折感人,而大仲马又多私生子,所以,取笑讥讽他的人,往往把他的作品比作他的私生子。最使他头痛的是巴黎统计学会的秘书长李昂纳,这人是大仲马的朋友,每

3、次举统计数字的例子,总是说大仲马的情妇和私生子有多少。有一年该统计学会开年会,大仲马估计,李昂纳又要大放厥词,说他的坏话了。于是他请求参加年会,获得了批准,果然不出大仲马所料,李昂纳又举他的情妇和私生子的例子。李昂纳报告完毕,请大仲马致词。一向不愿在大庭广众之下发表演讲的大仲马,这次却破例登台说:“所有统计数字都是撒谎的,包括有关本人的数字在内。”听众哄堂大笑。,圣元奶粉“性早熟”,婴儿配方奶粉再一次让国人的神经绷紧。武汉三名消费者声称其宝宝吃了圣元奶粉后出现性早熟,经众多媒体热炒,终于惊动卫生部组织专家调查,公布检验结果称圣元奶粉中未检出外源性性激素,内源性雌激素则在正常范围,三名女婴属于临

4、床常见的单纯性乳房早发育,与圣元奶粉无关。卫生部的权威并没能平息事态。网上的调查结果表明大部分网民都不接受卫生部的结论,认为调查组的专家被圣元公司公关。 这些人缺乏统计概念。我们只需做一番简单的计算,就可以说明他们的信念是站不住脚的。武汉人口约900万,出生率约8,即每年大约有7万名新生儿诞生,其中一半是女婴。那么现在武汉02岁的女婴大约有7万人,其中大约有65吃配方奶粉,圣元奶粉占的市场份额为10,也就是说,武汉有大约4500名02岁女婴吃了圣元奶粉。单纯性乳房早发育的发病率是千分之二,武汉这些圣元女婴中会有9人碰巧出现单纯性乳房早发育,其中有3人被媒体“曝光”并不算多。反之,如果圣元奶粉的

5、成分真的有问题,就不会只有这几个病例。吃其他品牌的奶粉的女婴当然也有性早熟的,只不过没有引起联想或关注而已。,住在高压电线附近会导致儿童得白血病吗?,美国国家癌症研究所(National Cancer Institute)花费5年的时间和500万美元为这个问题搜集资料。 结论是:在白血病和暴露在膏药电线所产生的磁场之间,找不到相关关系。,数据从何而来很重要,专栏作家兰德丝问她的读者:如果重新来过的话是否仍要生孩子?而来信回答的人中有70坚决说“不要”。 美国医学会期刊曾登过一篇文章,通过对患者的观察,声称将冷却的液体经过管子打进胃里,可以缓解溃疡症状。后来有人起疑,做了适当的对照研究,有些病人

6、接受这项治疗,有些接受安慰剂,结果使用安慰剂这组的“表现”要稍好些。,小心潜在变量,有报道说: 设有赌场的县犯罪率较高 在网上修课的学生,比在教室里修课的学生表现好 受教育多的民众,比起受教育少的民众,赚钱要多得多,第 1 章 导论,1.1 什么是统计学? 1.2 统计数据的类型 1.3 统计中的几个基本概念,学习目标,1. 理解统计学的含义 2. 理解统计数据与统计学的关系 3. 了解统计学的应用领域 4. 了解数据的类型 5. 理解统计中的几个基本概念,1.1 什么是统计学?,统计学与统计规律 统计的应用领域 历史上著名的统计学家,什么是统计学?,1. 数据搜集:取得数据 2. 数据分析:

7、分析数据 3. 数据表述:图表展示数据 数据解释:结果的说明, 收集、分析、表述和解释数据的科学,statistics的定义 (不列颠百科全书),statistics: the science of collecting, analyzing, presenting, and interpreting data. Copyright 1994-2000 Encyclopaedia Britannica, Inc.(不列颠百科全书),统计研究的过程,实际问题,统计规律 (一些例子),正常条件下新生婴儿的性别比为107:100 投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现1

8、6点的频率各为1/6 农作物的产量与施肥量之间存在相关关系,统计方法,描述统计 (descriptive statistics),内容 搜集数据 整理数据 展示数据 描述性分析目的 描述数据特征 找出数据的基本规律,推断统计 (inferential statistics),内容 参数估计 假设检验 目的 对总体特征作出推断,描述统计与推断统计的关系,反映客观现象的数据,描述统计 (统计数据的搜集、整理、显示和分析等),统计的应用领域,统计的应用领域,actuarial work (精算) agriculture (农业) animal science (动物学) anthropology (

9、人类学) archaeology (考古学) auditing (审计学) crystallography (晶体学) demography (人口统计学) dentistry (牙医学) ecology (生态学) econometrics (经济计量学) education (教育学) election forecasting and projection (选举预测和策划) engineering (工程) epidemiology (流行病学) finance (金融) fisheries research (水产渔业研究) gambling (赌博) genetics (遗传学) g

10、eography (地理学) geology (地质学) historical research (历史研究) human genetics (人类遗传学),统计的应用领域,hydrology (水文学) Industry (工业) linguistics (语言学) literature (文学) manpower planning (劳动力计划) management science (管理科学) marketing (市场营销学) medical diagnosis (医学诊断) meteorology (气象学) military science (军事科学) nuclear mate

11、rial safeguards (核材料安全管理) ophthalmology (眼科学) pharmaceutics (制药学) physics (物理学) political science (政治学) psychology (心理学) psychophysics (心理物理学) quality control (质量控制) religious studies (宗教研究) sociology (社会学) survey sampling (调查抽样) taxonomy (分类学) weather modification (气象改善),历史上著名的统计学家,Jacob Bernoulli

12、(伯努利)(1654-1705) Edmond Halley (哈雷) (1656-1742) De Moivre (棣美佛) (1667-1754) Thomas Bayes (贝叶斯) (1702-1761) Leonhard Euler (欧拉) (1707-1783) Pierre Simon Laplace (拉普拉斯) (1749-1827) Adrien Marie Legendre (勒让德) (1752-1833) Thomas Robert Malthus (马尔萨斯) (1766-1834),Thomas Robert Malthus (马尔萨斯),Pierre Simo

13、n Laplace (拉普拉斯),Leonhard Euler (欧拉),历史上著名的统计学家,Friedrich Gauss (高斯) (1777-1855) Johann Gregor Mendel (孟德尔) (1822-1884) Karl Pearson (皮尔森) (1857-1936) Ronald Aylmer Fisher (费歇) (1890-1962), Jerzy Neyman (1894-1981) Egon Sharpe Pearson (皮尔森) (1895-1980) William Feller (费勒)(1906-1970).,Friedrich Gauss

14、 (高斯),Johann Gregor Mendel(孟德尔),分类数据、顺序数据、数值型数据 观测数据和实验数据 截面数据和时间序列数据,1.2 统计数据的类型,什么是统计数据? (data),对现象进行计量的结果 不是指单个的数字,而是由多个数据构成的数据集 不仅仅是指数字,它可以是数字的,也可以是文字的,统计数据的分类,统计数据的分类,统计数据的分类 (按计量尺度分),分类数据(categorical data) 对事物进行分类的结果 数据表现为类别,用文字来表述 例如,人口按性别分为男、女两类 顺序数据(rank data) 对事物类别顺序的测度 数据表现为类别,用文字来表述 例如,产

15、品分为一等品、二等品、三等品、次品等 数值型数据(metric data) 对事物的精确测度 结果表现为具体的数值 例如:身高为175cm、168cm、183cm,统计数据的分类 (按收集方法分),观测的数据(observational data) 通过调查或观测而收集到的数据 在没有对事物人为控制的条件下而得到的 有关社会经济现象的统计数据几乎都是观测数据 试验的数据(experimental data) 在试验中控制试验对象而收集到的数据 比如,对一种新药疗效的试验,对一种新的农作物品种的试验等 自然科学领域的数据大多数都为试验数据,帮助领福利金的母亲找工作,大部分领福利金的成人,是有幼儿

16、的母亲,对福利金妈妈做的观测研究显示大部分人有能力可以增加收入,脱离领福利金的行列,有些人会利用自愿参加的工作训练计划,来增进自己的工作技能。是不是应该要求所有体格健全的福利金妈妈,都参加工作训练和寻找工作的计划呢? 在妈妈们开始申请福利金时,从当中选两组相似的人,要求其中一组参加工作训练,另外一组不参加,若干年后比较两组人的收入以及工作记录,就可以看出,参加工作计划是否有效?,统计数据的分类 (按时间状况分),截面数据(cross-sectional data) 在相同或近似相同的时间点上收集的数据 描述现象在某一时刻的变化情况 比如,2002年我国各地区的国内生产总值数据 时间序列数据(t

17、ime series data) 在不同时间上收集到的数据 描述现象随时间变化的情况 比如,1996年至2002年国内生产总值数据,1.3 统计中的几个基本概念,总体和样本 参数和统计量 变量,总体和样本,总体(population) 所研究的全部元素的集合 ,其中的每一个元素称为个体 分为有限总体和无限总体 有限总体的范围能够明确确定,且元素的数目是有限的 无限总体所包括的元素是无限的,不可数的 样本 (sample) 从总体中抽取的一部分元素的集合 构成样本的元素的数目称为样本容量,参数和统计量,参数(parameter) 研究者想要了解的总体的某种特征值 所关心的参数主要有总体均值()、

18、标准差()、总体比例()等 总体参数通常用希腊字母表示 统计量(statistic) 根据样本数据计算出来的一个量 所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等 样本统计量通常用小写英文字母来表示,变 量 (Variable),说明现象某种特征的概念 如商品销售额、受教育程度、产品的质量等级等 变量的具体表现称为变量值,即数据 变量可以分为 分类变量(categorical variable) :说明事物类别的一个名称 顺序变量(rank variable ) :说明事物有序类别的一个名称 数值型变量(metric variable ) :说明事物数字特征的一个名称 离散变量:取有限个值 连续变量:可以取无穷多个值,学生某门课成绩,统计中的几个基本概念,几种常用的统计软件 (Software),典型的统计软件 SAS SPSS MINITAB STATISTICA Excel,本章小节,1. 统计学与统计规律 统计的应用领域 统计数据的类型 统计中的几个基本概念,结 束,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 大学课件

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报