收藏 分享(赏)

统计学论文------统计学之我所见.doc

上传人:精品资料 文档编号:10680611 上传时间:2019-12-21 格式:DOC 页数:11 大小:179KB
下载 相关 举报
统计学论文------统计学之我所见.doc_第1页
第1页 / 共11页
统计学论文------统计学之我所见.doc_第2页
第2页 / 共11页
统计学论文------统计学之我所见.doc_第3页
第3页 / 共11页
统计学论文------统计学之我所见.doc_第4页
第4页 / 共11页
统计学论文------统计学之我所见.doc_第5页
第5页 / 共11页
点击查看更多>>
资源描述

1、 河南工程学院考查课专业论文统计学之我所见学生姓名: 朱秋容 学 院: 会计学院 专业班级: 会计学 1241 班 专业课程: 统计学 任课教师: 樊冬梅 2014 年 6 月 4 日目录1、摘要-2、关键字-3、前言-4、统计学基础概念-1、统计与统计学-2、统计学中的条件思想-(1)统计思想的特点-(2)比较常用的几种统计思想-5、统计数据-1、数据的搜集- (1)数据的来源-(2)调查数据-(3)实验数据-2、数据的图表展示-(1)数值型数据的整理与展示-(2)合理使用图表-3、数据的概括性度量-(1)集中趋势的度量-(2)离散程度的度量-4、分类数据分析-(1) 、分类数据与 统计量-

2、2(2) 、列联数据分析时应注意的问题-6、总结-7、参考文献-一、摘要在学习统计学之前,我一直把统计学看成另外一种数学也就是文科生的梦靥。虽然在很多方面统计学和数学存在着紧密联系,例如统计中会用大量的数学工具,所以为了掌握它,你必须要复习一下相关的数学知识,这样才能在学习中灵活运用。但是它和数学在某些方面也会存在很大的不同。在我看来,统计学更加地贴近实际,因此我们在学习中必须紧密联系到它的现实意义,在统计过后,我们还必须理解分析出来的数据所具有的实际的经济意义,这样才算是完成了整个统计的过程。二、关键词:统计学 思想 数据搜索 数据整理 数据分析三、前言在科学技术飞速发展的今天,统计学广泛吸

3、收和融合相关学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓展了新的领域。通过数据来说明问题,通过定量分析来揭示事物的本质,是人类社会提高自身认识能力的必然要求,无论是统计还是统计学,他们的产生与发展过程都说明了这一点。在当今世界,我们每时每刻都要接触到大量的数据,离开数据,我们将寸步难行。因此,学习统计学,掌握基本的统计理论与方法,具备基本的收集、整理和分析统计数据的能力。著名哲学家H.G.Wells 曾说:“就像读和写的能力一样,讲来有一天统计的思维方法会成为效率公民的必备能力。 ”可见统计学在将来的前景会发展的不错。四、统计学基础概念1、统计与统计学

4、统计一词可以有三种含义:统计活动、统计数据和统计学。统计活动是对各种统计数据进行收集、整理并作出相应的推断、分析的活动。统计数据时通过统计活动获得的,用以表现研究现象特征的各种形式的数据。统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。统计学是一门实质性的社会科学,既研究社会生活的客观规律,也研究统计方法。统计学是继承和发展基础统计的理论成果,坚持统计学的社会科学性质,使统计理论研究更接近统计工作实际,在国家和社会得到广泛发展。 2、统计学中的统计思想统计思想是根据人类社会需求的变化而开展各

5、种统计实践、统计理论研究与概括,才能逐步形成系统的统计思想。(1) 、统计思想的特点作为一门应用统计学,它从数理统计学派汲取新的营养,并且越来越广泛的应用数学方法,联系也越来越密切,但在统计思想的体现上与通用学派相比,还有着自己的特别之处。其基本特点能从以下四个方面体现出:(1)统计思想强调方法性与应用性的统一;(2)统计思想强调科学性与艺术性的统一;(3)统计思想强调客观性与主观性的统一;(4)统计思想强调定性分析与定量分析的统一。(2) 、比较常用的几种统计思想所谓统计思想,就是统计实际工作、统计学理论及应用研究中必须遵循的基本理念和指导思想。统计思想主要包括:均值思想、变异思想、估计思想

6、、相关思想、拟合思想、检验思想。现分述如下:均值思想均值是对所要研究对象的简明而重要的代表。变异思想统计研究同类现象的总体特征,它的前提则是总体各单位的特征存在着差异。统计方法就是要认识事物数量方面的差异。估计思想估计以样本推测总体,是对同类事物的由此及彼式的认识方法。相关思想事物是普遍联系的,在变化中,经常出现一些事物相随共变或相随共现的情况,总体又是由许多个别事务所组成,这些个别事物是相互关联的,而我们所研究的事物总体又是在同质性的基础上形成。因而,总体中的个体之间、这一总体与另一总体之间总是相互关联的。拟合思想拟合是对不同类型事物之间关系之表象的抽象。通过课堂现场教学,引导学生利用课余时

7、间完成项目,利用假期时间,通过参加学校组织的某些团队、小组或自己组织去开展一些与专业有关的活动,全方位地激发学生的学习兴趣、培养学生的专业能力、方法能力和社会能力。检验思想统计方法总是归纳性的,其结论永远带有一定的或然性,基于局部特征和规律所推广出来的判断不可能完全可信,检验过程就是利用样本的实际资料来检验事先对总体某些数量特征的假设是否可信。五、统计数据1、数据的搜索一个反例的启示:文学摘要预测罗斯福竞选落败在美国 1936 年的总统选举中,两位竞选者分别是民主党的罗斯福和共和党的兰登。一般民意测试认为罗斯福将获胜,例如盖洛普公司基于对 5 万选民的抽样调查,预测罗斯福的得票率为 56%。但

8、是美国著名杂志文学文摘(Literary Digest)宣布,根据他们对 240 万人的调查,兰登将获得 57%的选票。最后投票结果是,罗斯福赢得 2770 万张选票,而兰登只得到 1600 万张选票,罗斯福以绝对优势胜出。值得思考的问题是,为什么文学文摘调查的样本量如此之大,结果却那样离谱。细分析起来,他们预测失败的根本原因在于调查方案存在严重失误,违背了统计学规律,主要反映在以下两个方面:样本抽样有偏。兰登的支持者主要是富裕阶级、大资产阶级,而罗斯福的支持者主要是一般工薪阶层、中下层平民。而文学文摘调查的对象集中在富人圈,因为文学文摘是通过电话簿和俱乐部进行调查的。所以说样本抽样有偏。没有

9、考虑缺失数据的影响。 文学文摘在进行调查时发放了 1000 万份问卷,但只收回了近 240 万份就充分说明了这一点。所以我们应该重视数据的搜集和整理。(1) 、数据的来源数据来源包括数据的直接来源和间接来源。直接来源是指直接获得的一手资料;间接来源是指对原信息重新加工、整理,使之成为我们进行统计分析可以使用的数据。(2) 、调查数据1)概率抽样和非概率抽样概率抽样A、简单随机抽样 B、分层抽样 C、整群抽样 D、系统抽样非概率抽样A、方便抽样 B、判断抽样 C、自愿抽样 D、滚雪球抽样E、配额抽样概率抽样与非概率抽样的比较由于非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,因而

10、无法使用样本的结果对总体相应的参数进行推断。而随机抽样时依据随机原则抽选样本,这时样本统计量的理论分布式存在的,因此可以根据调查的结果对总体的有关参数进行估计,计算估计误差,得到总体参数的置信区间,并且在进行抽样设计时,对估计的精度提出要求,计算为满足特定精度要求所需要的样本量。2)搜集数据的基本方法搜集数据不同方法的特点项目 自填式 面访式 电话式调查时间 慢 中等 快调查费用 低 高 低问卷难度 要求容 易 可以复 杂 要求容易有形辅助物的使用中等利用充分利用 无法利用调查过程控制 简单 复杂 容易调查员作用的发挥无法发挥充分发挥 一般发挥回答率 最低 较高 一般(3) 、实验数据搜集数据

11、的另一种方法是通过实验,在实验中控制一个或多个变量,在有控制的条件下得到观察结果。所以,实验数据(experiment data)是指在实验中控制实验对象而搜集到的变量的数据。例如,对在一起饲养的一群牲畜,分别喂给不同的饲料,以检测不同饲料对牲畜增重的影响。实验室检验变量间因果关系的一种方法。实验法案例:现场实验帮助 A 公司胜诉美国 A 公司生产著名的运动包,该公司发现 B 公司(一个大型的中心商业集团)引进一条生产线,生产的运动包与 A 公司生产的运动包形状几乎完全一样,消费者难以区分。A 公司指控 B 公司,说 B 公司误导消费者,让消费者觉得自己买的是 A 公司的产品,而实际买的却是

12、B 公司的产品。为了证实这一点由第三方进行了一场现场的实验。实验中选择了两位妇女,给第一组妇女看的是 A 公司生产的包,包面上的所有标签都去掉,所有的标识、说明都印在包的里层。给第二组妇女看的是 B 公司生产的包,包上有明显的标识。这样做的目的是希望通过这种实验了解妇女们购买包时的选择标准。每组样本都是 200 人,实验分别在芝加哥、洛杉矶和纽约大商场进行。调查采用拦截式面访,被调查者是配额样本,即按妇女不同的年龄比例分配样本单位。实验结果表明,大多数消费者无法区别两种包的不同来源,她们买包时的依据主要是包的款式,而 A 公司生产的包时名牌商品,这种包的款式是人们所熟悉的。这个结果支持了 A

13、公司的立场。调查数据帮助 A 公司在法庭上胜诉,B 公司同意停止销售自己所生产的包。2、数据的图表展示(1) 、1) 、数值型数据的整理与展示数据分组是根据统计研究的需要,将原始数据按照某种标准分成不同的组别,分组后的数据称为分组数据(grouped data) 。它是将全部变量值依次划分为若干个区间,并将一个区间的变量值作为一组。在组距分组中,一个组的最小值称为下限;一个组的最大值称为上限。例: 某电脑公司 2005 年前 4 个月每天的销售量数据(单位:台) 。试对数据进行分组。某电脑公司 2005 年前 4 个月的销售量A B C D E F G H I J1 234 159 187 1

14、55 172 183 182 177 163 1582 143 198 141 167 194 225 177 189 196 2033 187 160 214 168 173 178 184 209 176 1884 161 152 149 211 196 234 185 189 196 2065 150 161 178 168 174 153 186 190 160 171根据分组整理成频数分布表如下:某电脑公司销售的频率分布表2) 、数值型数据的图示与条形图相比,直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度表示各组的组距,因此高度与宽度均有意义。同时还有的是条

15、形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。6 228 162 223 170 165 179 186 175 197 2087 153 163 218 180 175 144 178 191 197 1928 166 196 179 171 233 179 187 173 174 2109 154 164 215 233 175 188 237 194 198 16810 174 226 180 172 190 172 187 189 200 21111 156 165 175 210 207 181 205 195 201 17212 203 165 196 172 176

16、 182 188 195 202 213A B C1按销售分组(台) 频数(天) 频率(%)2 140-150 4 3.333 150-160 9 7.54 160-170 16 13.335 170-180 27 22.56 180-190 20 16.677 190-200 17 14.178 200-210 10 8.339 210-220 8 6.6710 220-230 4 3.3311 230-240 5 4.1712 合计 120 100(2) 、合理使用图表具体来说,设计和使用统计表时要注意一下几点:要合理安排统计表的结构,比如行标题、列数据、数据资料的位置应安排合理;表头一般

17、应包括表号、总标题和表中数据的单位等内容。总标题应简明确切地概括出统计表的内容,一般需要说明统计数据的时间、地点以及何种数据。即标题内容应满足 3W 要求;表中的上下线两条横线一般用粗线,中间的其他线要用细线,这样使人看起来清楚、醒目;同时还要在表的下方加上注释。3、数据的概括性度量(1) 、集中趋势的度量A、分类数据:众数B、顺序数据:中位数和分位数C、数值型数据:平均数(2) 、离散程度的度量A、分类数据:异众比率B、顺序数据:四分位差C、数值型数据:方差和标准差D、相对离散程度:离散系数4、分类数据分析(1) 、分类数据与 统计量2例如在泰坦尼克号海滩的例子中,当时船上共 2208 人,

18、其中男性 1738 人,女性 470 人。海滩发生后,幸存者 718 人,其中男性 374 人,女性 344 人。这里,性别是分类变量,有两个类别:男性和女性;幸存的男性 374 人和女性344 人都是事件结果,以频数的方式表现。由该例可得分类数据的结果是频数,检验是对分类数据的频数进行分析的统计方法。2若用 表示观察值频数,用 表示期望值频数,则 统计量可以写为:ef ef 2202)(ef2、列联数据分析时应注意的问题条件百分表的方向表一: 家庭状况与青少年犯罪表一是调查结果的条件分布。由表一可以计算其条件百分表,如表 2 所示:表二:家庭状况与青少年犯罪百分表(一)由表二得到的结果是,在

19、完整家庭接受调查的 130 人中,犯罪青少年所占的比例是 29%,这个比例高达近 1/3,这是令人吃惊的。其实,这个比例是歪曲的,这是由于抽样时夸大了对犯罪青少年抽取的数量。如果把计算百分表的方向变换一下,改变按因变量方向计算,则得到表三:表三;家庭状况与青少年犯罪百分表(二)从表三看出,在完整家庭中,未犯罪青少年的比例占 92%,而在离异家庭中,这个比例仅占 8%。完整家庭的青少年未犯罪率远远高于家庭的这个比例。家庭状况对青少年行为的影响得到了比较真实的反映。家庭状况青少年行为完整家庭 离异家庭 合计犯罪 38 37 75未犯罪 92 8 100合计 130 45 175家庭状况青少年行为完

20、整家庭 离异家庭犯罪(%) 29 82未犯罪(%) 71 18合计 130 45青少年行为家庭状况犯罪(%) 未犯罪(%)完整家庭 51 92离异家庭 49 8合计(人) 75 100(2) 、 分布的期望值准则2前面谈到的用 分布进行独立性检验,要求样本量必须足够大,特别是2每个单位中期望频数(理论频数)不能过小,否则应用 检验可能会得出错误2的结论。关于小单位的频数通常有两条准则:一条准则是,如果只有两个单元,每个单元的期望频数必须是 5 或 5 以上; 另一条准则是,倘若有两个以上的单元,如果 20%的单元期望频数 小于 5,则不能应用 检验。ef 2六、总结统计学的运用与生活息息相关,所以我们需要结合实际的相关要求好好学习这门课,希望在以后工作中能够用它来进行数据的搜集、整理、分析和描述等,就数据型的信息转化成通俗易懂的理论信息。但它目前还面临着重大的挑战,所以我们应该通过具体的措施来克服和解决这个问题,并且最终让它发扬光大。参考文献:1贾俊平.统计学【M】.北京:中国人民大学出版社.2000.2庞有贵.统计工作及思想【J】科技情报开发与经济.2004.3王维鸿.EXCEL 在统计中的应用【M】.北京.中国水利出版社.2004.4王怀伟.统计学教程【M】.北京:清华大学出版社.2004.

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报