1、第 1 章 导 论,商务与经济统计(原书第11版) 安德森数理统计与数据分析(原书第3版) JohnA.Rice 统计学(基本概念和方法) 埃维森,第 1 章 导 论,1.1 统计及其应用领域 1.2 统计数据的类型 1.3 统计中的几个基本概念,学习目标,1. 理解统计学的含义 2. 理解描述统计和推断统计 3. 了解统计学的应用领域 4. 了解数据的类型 5. 理解统计中的几个基本概念,1.1 统计及其应用领域,1.1.1 什么是统计学 1.1.2 统计的应用领域,几个例子,股票预测软件赌币机,瓦里安联合公司,它是一家生产科学设备的企业,对其1000名管理人员进行了为期4天的质量管理培训。
2、在位于硅谷的公司总部到处可以听到对质量的谈论,工作团队和周期时间取代电子和x射线成为人们的口头禅。公司也开始着手更新其经营方式,这样做少平也产生了惊人的结果。为计算机无尘机房生产真空系统的部门把按时交货率从40提高到92,半导体部门也将推出新设计的时间缩短到14天。然而,仅生产高质量的产品是不够的。在完成生产计划的压力下,真空设备部门的员工不再回复顾客的电话,最终失掉了市场份额。修理放射设备的人员急着赶工期忽略了向顾客解释他们的工作。负责质量的常务副总裁理查德M列维(Richard MLeVy)说:“与质量有关的任何东西都得到了重视,但其他的东西都被忽略了。”该公司事实上在80年代末是亏损的。
3、,正如瓦里安公司的例子所表明的,对质量的追求常常是产品导向的,并以机械的方式实施,这对于顾客毫无意义。对顾客没有意义的高质量通常不会带来销售额、利润或市场份额的增长,只能是浪费精力和金钱。,联合包裹服务公司(UPS),以前一直认为按时交货是顾客最关心的问题,其他都是次要的。因此,UPS对高质量的定义几乎完全围绕时间动作研究的结果。了解在某个城市街区电梯门打开需要多长时间和计算人们应答门铃需要多长时间等,都被看作是提高质量的关键。同样,促使司机严格遵守时间安排也是关键。但是,问题是,UPS的市场调研提问的是错误的问题。公司的调查问卷询问顾客是否对递送时间满意,他们是否认为递送可以更快些。,直到最
4、近就应该怎样提高服务水平而提出一些更广泛的问题时,UPS才发现,顾客对按时递送的要求并不像公司以前想象的那么高。使UPs的管理者最吃惊的是,顾客希望能与公司的司机有更多的交流,这是他们与公司面对面接触的惟一边径。若司机们不是那么冷淡而更愿意与顾客交流的话,顾客可能会提出一些实际的建议。“我们已经发现,在我们的服务中,最受关注的要素是我们的司机。”UPS公司的服务质量经理劳伦斯E法雷尔(Lawrence EFaDel)说。于是,公司开始鼓励62万名司机与推销员一起拜访顾客。公司还允许每位司机每周可以花30分钟的时间去加强与顾客的联系,以便增加新的销售。,英国航空公司,留住顾客的能力建立在企业对顾
5、客需求详细了解的基础上。这种了解主要来自于市场调研。例如,在经过详细的市场调研后,英国航空公司改变了它在横跨大西洋航线上头等舱的服务。对跨大西洋航线头等舱,大多数航空公司强调的都是高档服务。而英国航空公司通过调研发现,大多数头至舱的乘客希望的仅仅是能够睡安稳觉。现在,该公司头等舱的顾客可以在飞机起飞前,在头等仓休息就餐:一旦登机后,他们就可以穿上英国航空公司提供的睡衣,枕在枕头上,盖上毯子,享受一次免受打扰的旅行。到达目的地后,头等舱旅客可以吃早餐,进行梳妆和洗浴,并且可以在离开前穿上熨烫平整的衣服。,优惠券该寄给谁?,有一位营销经理在考虑推出一种新的冷冻糕点时提供优惠券。优惠券可能会与电视广
6、告一起被用来引导人们尝试这种新的糕点。这样就产生了一个新的问题:谁应该接受这种优惠券呢?如果直接把优惠券邮寄给那些最有可能使用它们的家庭,营业推广费用起到的效果会越好。以往的经验表明,大量使用者也是最有可能使用新优惠券的人。那么下一个问题便是:优惠券大量使用者和少量使用者之间是否存在可识别的人口统计特征? 市场调研表明:家庭的女主人没有全职工作,未知现象的认知过程,什么是统计学? (statistics),统计学是收集、分析、表述和解释数据的科学(不列颠百科全书) 统计是一门收集、分析、解释和提供数据的科学(韦伯斯特国际辞典第3版) 统计指的是一组方法,用来设计实验、获得数据,然后在这些数据的
7、基础上组织、概括、演示、分析、解释和得出结论(Mario F.Triola,初级统计学),什么是统计学? (statistics),1. 收集数据:取得数据 2. 处理数据:整理与图表展示 分析数据:利用统计方法分析数据 数据解释:结果的说明 得到结论:从数据分析中得出客观结论 数据预测,收集、处理、分析、解释数据并从数据中得出结论的科学,信息是现实世界在人们头脑中的反映。它以文字、数据、符号、声音、图象等形式记录下来,进行传递和处理,为人们的生产,建设,管理等提供依据 数据指输入到计算机并能被计算机进行处理的数字、文字、符号、声音、图象等符号。数据是对客观现象的表示,数据本身并没有意义数据是
8、信息的表达、载体,信息是数据的内涵,是形与质的关系。数据只有经过解释才有意义,成为信息,从管理的角度看统计,真假、对错、效果与效率。决策即是选择选择是否容易做出?,讨论,统计工作如此重要,企业一碰到问题是否就需要调研呢?,缺乏资源调研结果毫无用处错过市场时机已经做出决策调研成本超过收益?管理者未对决策目标达成一致,如果市场调研告诉您的,是您通常已经知道了的事实,您会满意吗?在调研之前,您是否知道自己想要的到底是什么? 委托调研就是花钱买“事实”? 某汽车制造厂委托一家著名的市场调研公司,就将要推出的新品进行市场调研。在调研公司呈送的调研总结报告中有这样一段话:北京地区轿车用户在外型、安全、油耗
9、这3个指标中,对油耗比较敏感。就是说,北京地区轿车用户的采购敏感点是油耗。 如果读者您是该企业市场部的人员,对这个结论您满意吗?而且,这可是您支付了7位数的调研费用后得到的结论。当然,您不只得到这一个结论,还有其他的,比如他们购买车辆更多的是为了满足自己代步、旅游和交友的需要,或者为下一代考虑,为工作考虑的相对比较少。不过虽然这些结论叙述的事情与前一个不一样了,但是有一个本质的类似,那就是陈述了事实。,作为企业市场部的人员,您希望得到的是这些结论吗?或者,您得到这些(通常是您已经知道的)事实后,会做什么吗?委托调研公司难道就是要知道一些事实吗?或者,调研公司除了可以给您事实以外,难道他们没有什
10、么能力给您想要的其他东西吗? 让我们来试图理解一下,市场部的各位经理需要得到的东西是什么?其实,有关市场中潜在客户的反应、潜在客户的采购行为、他们说的话、他们问销售人员的话以及销售人员反馈的话,都已经告诉了您一些事实,您并不需要花那么多钱,请人帮您证明一个其实您非常清楚的事实。 您需要知道的是,在这些事实的基础上,我们的销售人员应该有哪些变化,应该怎样对症下药,应该如何选择产品的某些特性展示给客户从而正中客户下怀,最终促使客户在采购中偏向我们的销售人员。您可能还需要知道,如何才能让客户信赖我们的产品?客户不断要求打折、赠品及降价,是不是只要降价就真的可以提高销量了? 您需要知道的,其实都是在已
11、知事实基础上可以延伸出来的销售行为、营销对策。您最需要的,就是给一线的营销人员、销售人员一些有针对性的营销传播方式、销售介绍内容,以及客户内心真实的需求如何可以得到满足等。,几年前,一家存款额超过3亿美元的银行进行了一项大型的市场调研,目的是帮助高层管理者规划银行在以后5年中的战略方向。银行总裁听完调研汇报后说,“我完全同意你们的建议,因为我正想那么做呢!明天向董事会提交战略计划时,我将会使用你们的调研。”调研人员接着问道:“如果我的建议与您的决定恰恰相反呢?”这家银行的总裁笑着答道:“他们永远都不会知道我进行过市场调研!”这个项目不仅仅浪费了金钱,而且还让调研人员怀疑这种行为的道德性。,讨论
12、,信息能否完全消除不确定性?能否获得充足的信息?(田忌赛马)信息是否越多越好?,小结:,人们往往得不到足够的信息,甚至信息质量也不怎么高,即使信息及时有效,但是不同的人由于受其其不同的经历、认知、年龄、性别、文化以及时空关系等因素的影响,对同一信息存在着不同的利用率,决策的终极追求?有限(理性与信息)满意而非最优,统计学是帮助我们进行决策,降低决策风险的一种手段,统计方法,描述统计 (descriptive statistics),研究数据收集、处理、汇总、图表描述、概括与分析等统计方法 内容 搜集数据 整理数据 展示数据 描述性分析目的 描述数据特征 找出数据的基本规律,推断统计 (infe
13、rential statistics),研究如何利用样本数据来推断总体特征的统计方法 内容 参数估计 假设检验 目的 对总体特征作出推断,统计的应用领域,经济学,管理学,医学,工程学,社会学,统计学,统计的应用领域,actuarial work (精算) agriculture (农业) animal science (动物学) anthropology (人类学) archaeology (考古学) auditing (审计学) crystallography (晶体学) demography (人口统计学) dentistry (牙医学) ecology (生态学) econometric
14、s (经济计量学) education (教育学) election forecasting and projection (选举预测和策划) engineering (工程) epidemiology (流行病学) finance (金融) fisheries research (水产渔业研究) gambling (赌博) genetics (遗传学) geography (地理学) geology (地质学) historical research (历史研究) human genetics (人类遗传学),统计的应用领域,hydrology (水文学) industry (工业) lin
15、guistics (语言学) literature (文学) manpower planning (劳动力计划) management science (管理科学) marketing (市场营销学) medical diagnosis (医学诊断) meteorology (气象学) military science (军事科学) nuclear material safeguards (核材料安全管理) ophthalmology (眼科学) pharmaceutics (制药学) physics (物理学) political science (政治学) psychology (心理学)
16、 psychophysics (心理物理学) quality control (质量控制) religious studies (宗教研究) sociology (社会学) survey sampling (调查抽样) taxonomy (分类学) weather modification (气象改善),统计学的产生与发展,(一)统计学的萌芽期(17世纪中18世纪中) 1、政治算术学派 17世纪中叶的英国代表人物:英国的威廉配第、约翰格朗特等。威廉配第的代表著政治算术对当时的英、荷、法等国的“ 国富和力量”进行了数量的计算和比较;格朗特写出了第一本关于人口统计的著作。他们开创了从数量方面研究社
17、会经济现象的先例。,(二)统计学的近代期(18世纪末19世纪末),1、数理统计学派代表人物:法国的拉普拉斯,比利时的凯特勒。拉普拉斯把古典概率论引进统计学,发展了概率论,推广了概率论在统计中的应用。,2、德国的记述学派(国势学派康令 (16061681)阿痕瓦尔(17191772; 1764年首创统计学一词) 他们在大学中开设“ 国势学”采用记述性材料,讲述国家“ 显著事项”,籍以说明管理国家的方法。特点是偏重于事物质的解释而忽视量的分析。,凯特勒把德国的国势学派、英国的政治算术学派和意大利、法国的古典概率论家以融合改造为近代意义的统计学。他是数理统计学派的奠定人,有“ 统计学之父”之称。,2
18、、社会统计学派代表人物:德国的克尼斯、恩格尔、梅尔等。他们强调统计学是研究社会现象的科学,包括统 计资料的搜集、整理和分析研究,目的是要揭示现象内部的联系。,(三)统计学的现代期(20世纪初至今),统计学的主流从描述统计学转向推断统计学。1907年戈赛特提出了小样本t统计量, 20世纪30年代R费希尔的推断统计理论标志着现代数理统计学的确立。,60年代以后统计学发展有四个明显的趋势:,1统计学依赖和吸收数学更多; 2以统计学为基础的边缘学科不断形成; 3与电子计算机技术相结合,应用范围更广,作用更大。 4。统计的作用从描述、推断、到预测、决策的方向发展。,1.2.1 分类数据、顺序数据、数值型
19、数据 1.2.2 观测数据和实验数据 1.2.3 截面数据和时间序列数据,1.2 统计数据的类型,统计数据的分类,统计数据的分类,统计数据的分类 (按计量尺度分),分类数据(categorical data) 只能归于某一类别的非数字型数据 对事物进行分类的结果,数据表现为类别,用文字来表述 例如,人口按性别分为男、女两类 顺序数据(rank data) 只能归于某一有序类别的非数字型数据 对事物类别顺序的测度,数据表现为类别,用文字来表述 例如,产品分为一等品、二等品、三等品、次品等 数值型数据(metric data) 按数字尺度测量的观察值 结果表现为具体的数值,对事物的精确测度 例如:
20、身高为175cm、168cm、183cm,统计数据的分类 (按收集方法分),观测的数据(observational data) 通过调查或观测而收集到的数据 在没有对事物人为控制的条件下而得到的 有关社会经济现象的统计数据几乎都是观测数据 实验的数据(experimental data) 在实验中控制实验对象而收集到的数据 比如,对一种新药疗效的实验,对一种新的农作物品种的实验等 自然科学领域的数据大多数都为实验数据,统计数据的分类 (按时间状况分),截面数据(cross-sectional data) 在相同或近似相同的时间点上收集的数据 描述现象在某一时刻的变化情况 比如,2005年我国各
21、地区的国内生产总值数据 时间序列数据(time series data) 在不同时间上收集到的数据 描述现象随时间变化的情况 比如,2000年至2005年国内生产总值数据,1.3 统计中的几个基本概念,1.3.1 总体和样本 1.3.2 参数和统计量 1.3.3 变量,总体和样本,总体(population) 所研究的全部个体(数据) 的集合,其中的每一个个体也称为元素 分为有限总体和无限总体 有限总体的范围能够明确确定,且元素的数目是有限的 无限总体所包括的元素是无限的,不可数的 样本 (sample) 从总体中抽取的一部分元素的集合 构成样本的元素的数目称为样本容量或样本量 (sample
22、 size),参数和统计量,参数(parameter) 描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值 所关心的参数主要有总体均值()、标准差()、总体比例()等 总体参数通常用希腊字母表示 统计量(statistic) 用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数 所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等 样本统计量通常用小写英文字母来表示,变 量 (variable),说明现象某种特征的概念 如商品销售额、受教育程度、产品的质量等级等 变量的具体表现称为变量值,即数据 变量可以分为 分类变量(categor
23、ical variable) :说明事物类别的名称 顺序变量(rank variable):说明事物有序类别的名称 数值型变量(metric variable) :说明事物数字特征的名称 离散变量:取有限个值 连续变量:可以取无穷多个值,变 量 (其他分类),随机变量和非随机变量 经验变量(empirical variables)和理论变量(theoretical variables) 经验变量所描述的是我们周围可以观察到的事物 理论变量则是由统计学家用数学方法所构造出来的一些变量,比如,z 统计量、t 统计量、2统计量、F 统计量等,变量及其类型,统计中的几个基本概念,本章小节,1. 统计及其应用领域 统计数据的类型 统计中的几个基本概念,结 束,THANKS,