收藏 分享(赏)

基础统计学笔记.doc

上传人:scg750829 文档编号:8274331 上传时间:2019-06-17 格式:DOC 页数:7 大小:71.50KB
下载 相关 举报
基础统计学笔记.doc_第1页
第1页 / 共7页
基础统计学笔记.doc_第2页
第2页 / 共7页
基础统计学笔记.doc_第3页
第3页 / 共7页
基础统计学笔记.doc_第4页
第4页 / 共7页
基础统计学笔记.doc_第5页
第5页 / 共7页
点击查看更多>>
资源描述

1、一、统计学概论:分理论统计和应用统计:应用统计分为描述统计学和推断统计学。描述统计为一组数据的中(位置:均值、中位数) 、散(极差、方差、标准差) 、形|(偏度)描述。推断统计分为参数估计和假设检验。技能:1、经验数据收集加工画成图形数理(规律)(数据不等于数字)PPT 原则:用图不用表、用表不用栏、用栏不用字实际问题:5M1E组成过程产品(结果)属性(包括:几何(形位方尺) 、物理、生化、人文)集合统计问题:(构成)总体样本数据类型:分计数型(离散性)和计量型(连续性) ,即概率分布为计量型分布和技术型分布)规律分描述和推断。1、 总体与样本中间有一种学问:抽样:验收抽样、统计抽样样本量2、

2、样本和数据中间有一门测量技术:MSA3、分布规律总体参数:平均值()标准差()总位数()比例(p)样本统计量的特点:随机变化,不要轻易用样本下结论。拉丁字母在数学上用于总体参数阿拉伯字母表示样本统计量希腊字母表示计算总体参数统计分参数统计和非参数统计。推断统计分估计:总体总体某参数未知,用对应的样本统计量去猜测。检验:假设总体某参数已知,用对应的样本统计量去验证。二:统计数据收集与整理:1、 数据不等于数字2、数据的两种类型:描述性分类响应变量(因变量)和预报因子(独立变量)如性别叫因子,男女叫水平。四种尺度:定类、定序、定距、定比3数据管理的 7 个层次:无 假 不 乱 浅 深 系4软件每一

3、列表示一个变量,每一行表示一个样本鱼骨图只适用于一个为什么,变量程序图 IPO 适用于多个为什么。I (变量) P O水质 烧开水 色香味器皿材质火燃料风压强目的要抓住关键的变量。2、 统计数据的表现形式:绝对数时期数和时点数相对数比例:部分比总体比率:部分比部分统计的数据来源:直接来源和间接来源。1、数据收集:分被动收集(利用历史和现场)和主动收集(DOE 试验设计)现场收集数据是被动收集,分临时数据和常态数据。试验是临时数据。数据好的特征:。 。 。 。数据不好的 7 个陷阱:缺少假混窄异病缺:缺失(数据表中类型有 N(计数型)T (文本类型)D(时间类型)少:样本量少假:不真实混:混杂(

4、没有可比性)窄:x 的水平设计过窄。因子的范围过窄,没有相关性。异:夹杂异常数据。病:病态(变异系数太小) ,变异系数:=/ (注意:连续数据:非偶尔发生的问题的计数最好当作连续数据离散数据:包括百分数,技术,数据分析的前提条件:1、 判测:MSA2、 判异常3、 判独(效果独立性:标识该变量还受到其它原因的干扰)4、 判量:求样本量。统计抽样(非验收抽样) 。5、 判形:分布的识别正态性验证6、 判散:黑带工具:MSA CPK SPC 假设检验 试验设计(DOE )(主动研究) (静态被动研究) (动态被动研究) (被动研究) (主动研究)MSA过程现状水平评估统计分析改善后的效果验证。QC

5、 老 7 大工具:直排散分鱼查图QC 新 7 大工具:P 箭双阵关系亲P:PDPC 过程决策程序图、箭:箭条图(统筹法):计算关键路劲。阵:矩阵图:数字矩阵图、一半矩阵图关:关联图系:系统图(树图)亲:亲和图:归纳、总结统计描述:1、图示化:用图形(表)描述数据的分布规律。2、求统计量(数值量度:中(位置):均值:算数平均。缺点:对偏态分布没有代表性。中位数:具有稳健性、抗干扰性。众数:数量最多的一个数,一般用于计数型数据的平均值。但不一定唯一,不一定在中心。散:极差(R)=max-min,适合于两本量不多的情况下,一般 NC10方差:标准差形 偏度:分右偏分布(正偏)和左偏(负偏)峰度:尖峰

6、0、正态=0、平峰0求统计量路径:1、 一次求一个:计算列统计量2、 一次求多个:统计基本统计量显示描述性统计工具一、直方图1、 用途、目的:用来揭示一组数据的分布状态,并识别异常。2、 条件:长用于计量型数据也可用于大概率计数型数据。3、 统计路径:图形直方图4、 结构:图形由点、线、柱、框、轴组成。直方图为两轴多柱结构。5、 解读:中散形异比(比:和规格比,和两两比。 )6、 拓展(注意事项):统计基本统计显示描述性统计。两图比较选择右键选平铺和工具二:点图用途、目的:用来揭示一组数据的分布状态,并识别异常。条件:长用于计量型数据也可用于大概率计数型数据。适合于小样本。统计路径:图形点图结

7、构:两轴多点解读:中散形异比(比:和规格比,和两两比。 )能够抓捕异常点点右键笔刷框异常点。拓展(注意事项):统计基本统计显示描述性统计。两图比较选择两个列三、箱线图:用途、目的:用来揭示一组数据的分布状态,并识别异常。条件:长用于计量型数据也可用于大概率计数型数据。统计路径:图形箱线图结构:两轴一筐三线若干点 解读:中散形异比(比:和规格比,和两两比。 )中位线、上 4 分:Q3、下 4 分位 Q1Max(minQ1-1.5 (Q3-Q1 ) )点:可等于最大点或小于做大点,如大于最大点则能够抓捕异常点点右键笔刷框异常点。拓展(注意事项):了解变化的工具:时序图控制图频率:以上三种均属于排列

8、图工具四、柏拉图:1、用途:用来识别关键少数,28 原则。2、条件:XY 都是计数型数据,常常用于分类的。偶尔 Y 可以用于计量型3、 路径:统计质量工具pareto4、 结构:三轴多柱一线5、 解读:看高低,判主次。原始数据格式:汇总格式列联表指示变量6、 注意事项:每一个柱子不能太相近,近乎等概率其它不能太高,没有分解完。排列图一定要有时效性确保相对高度如果等概率:解决方法1、 换一种分类方法2、 调整 Y 轴分类方法3、 把 Y 的同规格放大。 (数据规范化)工具五:条形图(柱状图)1、 用途:用来比较各自的权重2、 条件:XY 都是计数型数据3、 路径:图形条形图4、 结构:两轴多柱5

9、、 解读:看到底 看轻重知识学来的,搜索能力 (术:工具技能练来的 (法:观念解放思想,靠修 悟 (道:工具六:散点图1、 用途:揭示两个变量相互关系用的2、 条件:XY 两个计量3、 路径:图形散点图4、 解读:看分布,判相关:强正、强负、弱正、弱负、不相关、完全相关5、 结构:6、 扩展:两个 X 一个是计数、一个是计量截止上面的图均为静态图。以下静态图:工具七:时间序列图(时序图)1、用途:按时间的顺序的数据图形2、条件:要求时间,时效型数据3、结购:两轴多点线4、解读:看趋势 判异常(聚类、混合等)或判独力性5、拓展:工具八:运行图(链条图)1、用途:按时间的顺序的数据图形2、条件:要

10、求时间,时效型数据3、路径:统计质量工具运行图3、结购:两轴多点一线4、解读:看趋势 判异常(聚类、混合等)或判独力性中位数的游程个数,如果少很多,为少聚多混。期望游程个数检验聚类性的近似 P 值0.5混合近似 P 值0.5,向上或向下的游程个数:期望游程个数检验趋势性的近似 P 值0.5检验振动性的近似 P 值0.5,5、拓展:总结:小分类大分类 中分类X Y工具名称 路径 解读直方图点图数 量箱线图条形图比较数 数排列图静态关系 量 量 散点图时序图动态 研究趋势 时 量运行图二、推断统计:概率与概率分布:当无限量由频率成概率。计量型数据没有点概率,有概率密度(即 PDF)计数型数据有点概率随机变量及其分布:离散:二项分布超几何分布泊松分布连续1、 正态分布:用途:1、自然界中大部分现象服从正态分布,2、多次抽样的样本均值所构成的分布往往近似正态分布(即中心极限定理)3、其它分布在某种条件下可转化为正态分布。条件:1、计量型2、大概率计数型3、决定参数: 4、学会模拟仿真:数据和图形学图纸:形位方尺学分布:形状 位置 阈值 尺度路径:图形概率分布图1、会求概率 P(计数型) 2、会概率密度 PDF(计量型) 3、会累计概率密度 CDF(计数和计量) 4、分位数 Z 或 P(计数和计量)已知 XZ 求 Y (PDF)已知 XZ 求 CDF(左面积)已知左面积求 X 或 Z

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报