1、第六章 感官分析统计方法学,统计学是感官研究的一个重要组成部分,要成为一名专业感官研究人员,必须具备比较全面的统计学知识。 感官评价中误差产生的根源: 不同的人,生理构造有差异 环境因素的影响 人们在语言表达上有所差别,使用标度的方式也不同,结果分析中图的好处,在统计学中把利用统计图形表现统计资料的方法叫做统计图示法。其特点是:形象具体、简明生动、通俗易懂、一目了然。,“条形图”的特点是对各个时期或时点的数据有直接对比的作用,对其数值大小,一目了然。,“折线图”的特点是对时期数列的数据的运动轨迹以及发展趋势有较强的指示作用。,“扇形图”的特点是对数据中的各个分组的大小和结构有明显的比较作用。,
2、统计表的作用是: 用数量说明研究对象之间的相互关系。 用数量把研究对象之间的变化规律显著地表示出来。 用数量把研究对象之间的差别显著地表示出来。这样便于人们用来分析问题和研究问题。,图的误用,面积?,美国国家食品药品管理局(FDA)要求新药的研发试验中,必须有统计学家来指导研究的设计、数据的分析、报告的呈递等。,统计学在感官分析中的应用,描述:结果的简单描述(数据的收集、加工处理、显示方法、分布特征的概括等) 推论:为实验处理提供根据 衡量:估计变量间的相关程度(研究如何根据样本信息来推断总体的特征),研究的过程,实际问题,收集数据 (取得数据),分析数据 (研究数据),数据整理 (处理数据)
3、,解释数据 (结果说明),分析方法,1定性分析 2定量分析 (统计分析),描述统计 推论统计 复杂统计分析 计算机统计分析,平均数 标准差,Z检验 t检验 X2检验 F检验,方差分析、回归分析、聚类分析、判别函数分析、主成分分析、因素分析、路径分析、结构方程模型,产品质量,分析 结果,分析 结果,分析 结果,分析 结果,分析 结果,单变量分析,色香味形,多元回归,因子分析,主成分分析,相关分析,图表描述条形图、柱形图、折线图、雷达图、箱线图等。,数据描述集中程度:平均数 变异程度:标准差分布的对称、陡峭程度;偏斜度、峭度,推论剔除极端值/缺失值选择显著性水平 统计试验,通过检验样本平均数、标准
4、差、方差、相关系数与相应的总体参数或样本统计量之间是否存在差异,进而检验样本与总体或样本与样本之间是否存在显著差异,并得出结论和对结论进行推论。,统计检验,常用统计数据的计算,1、数值的计算 (1)平均值:是对数据分布的中心中心趋势的估计,公式为:,(2)样本标准差:是对平均值的波动幅度或覆盖范围的估计,公式为:,(3)中值:在所有数据中排序处于中间位置的数值。(4)标准误差:SE=S/(n)1/2 S为样本的标准差,2、置信区间置信区间是某参数真实值的可能变化范围,可用来判断数值是否精确,试验敏感参数,,也叫-风险,是统计学上的名词,他的定义是错误的估计两者之间的差别存在的可能性,也叫第类错
5、误。,也叫-风险,他的定义是错误估计两者之间的差异不存在的可能性,也叫第类错误。 Pd,是指能够分辨出差异的人数比例。,在统计学上,值在10%5%(0.10.05),表明存在的差异程度是中等。 值在5%1%(0.050.01),表明存在的差异程度是显著。 值在1%0.1%(0.010.001),表明存在的差异程度是非常显著。 值低于0.1%(0.001),表明存在的差异程度是特别显著。,值的范围在表明差异不存在的程度上,同值有着同样的规定。 Pd 值的范围意义如下: Pd 值25%表示比例比较小,即能够分辨出差异的人的比例比较小。 25%Pd 值35%表示能够分辨出差异的人的比例中等。 Pd
6、值35%表示能够分辨出差异的人的比例较大。,假设检验,统计假设检验也称为显著性检验,即指样本统计量和假设的总体参数之间的显著性差异。 假设检验时提出的假设称为原假设或无效假设,就是假定样本统计量与总体参数的差异都是由随机因素引起,不存在条件变动因素。,假设检验的基本思路,首先,对总体参数值提出假设(原假设); 然后,利用样本数据提供的信息来验证所提出的假设是否成立(统计推断)。 如果样本数据提供的信息不能证明上述假设成立,则证明该假设为错误; 如果样本数据提供的信息不能证明上述假设不成立,则证明该假设成立。,假设检验的基本步骤,提出原假设(或称“零假设”,H0); 选择检验统计量; 根据样本数
7、据计算检验统计量观测值的发生概率(相伴概率,p); 根据给定的小概率事件界定标准(显著性水平,如0.05,0.01)做出统计推断。,为什么要设计并计算检验统计量?,在假设检验中,样本值(或更极端的取值)发生的概率不能直接通过样本数据计算,而是通过计算检验统计量观测值的发生概率而间接得到的。 所设计的检验统计量一般服从或近似服从某种已知的理论分布(如t-分布、F-分布、卡方分布),易于估算其取值概率。 对于不同的假设检验和不同的总体,会有不同的选择检验统计量的理论和方法。,计算检验统计量观测值的发生概率,在假定原假设成立的前提下,利用样本数据计算检验统计量观测值发生的概率(即p值,又称“相伴概率
8、”指该检验统计量在某个特定的极端区域在原假设成立时的概率)。该概率值间接地给出了在原假设成立的条件下样本值(或更极端值)发生的概率。,进行统计推断,依据预先确定的 “显著性水平” (即值),如0.01或0.05,决定是否拒绝原假设。 如果p值小于值,即认为原假设成立时检验统计量观测值的发生是小概率事件,则拒绝原假设。否则,就接受原假设。,显著性水平,在假设检验中,显著性水平(Significant level,用表示)的确定是假设检验中至关重要的问题。 显著性水平是在原假设成立时检验统计量的制落在某个极端区域的概率值。因此,如果取= 0.05,如果计算出的p值小于 ,则可认为原假设是一个不可能
9、发生的小概率事件。当然,如果真的发生了,则犯错误的可能性为5%。 显然,显著性水平反映了拒绝某一原假设时所犯错误的可能性,或者说, 是指拒绝了事实上正确的原假设的概率。,的取值,一般在进行假设检验前由研究者根据实际的需要确定。 常用的取值是0.05或0.01。对于前者,相当于在原假设事实上正确的情况下,研究者接受这一假设的可能性为95%;对于后者,则研究者接受事实上正确的原假设的可能性为99%。 显然,降低值可以减少拒绝原假设的可能性。因此,在报告统计分析结果时,必须给出值。,在进行假设检验时,各种统计软件均会给出检验统计量观测值以及原假设成立时该检验统计量取值的相伴概率(即检验统计量某特定取
10、值及更极端可能值出现的概率,用p表示)。 p值是否小于事先确定的值,是接受或拒绝原假设的依据。 如果p值小于事先已确定的值,就意味着检验统计量取值的可能性很小,进而可推断原假设成立的可能性很小,因而可以拒绝原假设。相反,如果p值大于事先已确定的值,就不能拒绝原假设。,当检验统计量服从标准正态分布的,可以直接查阅事先准备好的标准正态分布函数表,从中获得特定计算结果的相伴概率。而对于服从t-分布、F-分布、卡方分布或其它特殊的理论分布的检验统计量(大多数的假设检验是这样),无法直接计算相伴概率,可以查阅各类假设检验的临界值表进行统计推断。这些表格以自由度和几个相伴概率(通常为0.1、0.05和0.
11、01)为自变量,以检验统计量的临界值为函数排列。,在进行统计推断时,人们使用上述临界值表根据事先确定的显著性水平,查阅对应于某一自由度和特定相伴概率的检验统计量的临界值,然后将所计算出的检验统计量与该临界值相比较。如果检验统计量的计算值大于临界值,即实际的相伴概率小于事先规定的显著性水平,便可拒绝原假设。否则,可接受原假设。,在假设检验中,只有 “显著”和 “不显著”,没有“极显著”这样的断语。只要计算出的检验统计量的相伴概率(p值)低于事先确定的值,就可以认为检验结果“显著”(相关分析的原假设是“相关系数为零”,故此处的“显著”实际意味着“相关系数不为零”,或说“2个随机变量间有显著的相关关
12、系”);同样,只要计算出的检验统计量的相伴概率(p值)高于事先确定的值,就可以认为检验结果“不显著”。,置信度,置信度:也称为可靠度,或置信水平、置信系数 ,是指被考虑的量值在给定区间内的概率(选定的或规定的)。 置信区间:是指在某一置信水平下,样本统计值与总体参数值间误差范围。 置信区间越大,置信度越高。,置信水平就是变量落在置信区间的可能性,就是相信变量在设定的置信区间的程度,是个01的数,用1-表示。 显著性水平就是变量落在置信区间以外的可能性,“显著”就是与设想的置信区间不一样,用表示。 显然,显著性水平与置信水平的和为1。显著性水平如果为,则置信度为1- ,显著性水平为0.05时,=
13、0.05,1-=0.95 如果置信区间为(-1,1),即代表变量x在(-1,1)之间的可能性为0.95。 显著性水平取0.05就是置信度为95%,取0.01置信度就是99%。具体选哪个就看得到的结果了,如有大部分都得P值都非常小,那就取0.01了,要是P值都很大,那就取0.05好了。一般情况下,0.05就可以,当然0.01就更精确了。,1-表示置信度,置信度表示原假设成立的概率,如果原假设成立的概率大,就接受原假设,而概率的大小标准就是显著性水平,在显著性水平为5%的时候,认为95%为大概率事件,在显著性水平为1%时,则认为99%为大概率事件。 总之,置信度越高,显著性水平越低,代表假设的可靠
14、性越高,越好。,显著性水平选择,容易产生严重后果,实验条件不易控制或 容易产生较大误差,=0.05,=0.01,95%的置信区间,99%的置信区间,显著性水平选择的实际应用,品质管理消费者调查政策性的调查,0.1,0.05,0.01,实验设计的基本原则,对照,随机化,重复,均衡,显示 处理的 效应,针对大量、 不可控制的 非处理因素,足够的 样本量、 足够的功效,处理组,对照组,处理因素,非处理 因素,比较结果,非处理 因素,处理组与对照组之间 非处理因素均衡一致,异常值,系统误差/随机误差/过失误差 样本异常值:明显偏离所在样本的观测值 异常值可能仅仅是数据中固有的随机误差的极端表现,也可能
15、是过失误差。,异常值的剔除,将一组数据从小到大排列,计算的平均值和标准偏差,计算统计量T,根据n和查表,判断,对于色泽: 结果排列:2,1,1,.5, 计算平均值和标准差计算最大值Ta和最小值Tb。结论:查T值表,n=15,a=0.01,Tn ,a=2.71Ta=2.91,所以5为异常值。Tn,a=2.71Tb=0.97,所以1为非异常值。,样品,品评员,交互作用,样品编码,样品间差异,品评员间差异,品评员筛选,样品编码的随机化 心理效应 顺序效应 生理效应 感觉残留,数字,符号,中性字,字母,品评员品评时的随机化(样品呈送时) 成对比较(AB、BA) 二三点法固定参照RAAB、RABA平衡参
16、照RAAB、RABA、RBAB、RBBA 三点法(AAB、ABA、BAA、BBA、ABB) A非A法(AA、BB、AB、BA),样品间差异比较时方法的选择,两个样品成对比较、二三点法、三点法、评分、A-非A 三个以上样品排序、评分、选择、五取二 嗜好型品评成对比较、选择、排序,【例】评分,原料配比不同的四种香肠制品,通过评分法判定这四种香肠的弹性、色泽等有无差别。,差异程度?,方差分析:,误差校正值(CF)=评分总和2/试验总次数=182/32=10.125 样品平方和=(各样品合计评分的平方和/各样品的试验次数)- CF=(-7)2+192+22+42/8-CF=53.75 -10.125=
17、43.625 品评员平方和=(各品评员合计评分的平方和/各品评员的试验次数) - CF=32+22+(-1)2+62+52+62+02+(-3)2/4 -CF=120/4 -10.125=19.875 总平方和=各评分分数的平方和- CF=(-2)2+12+32+22+(-2)2+12 -CF=156 -10.125=43.625 样品自由度=3,品评员自由度=7,误差自由度=21,以样品自由度为分子自由度,误差自由度为分母自由度,查F分布表中相应的临界值,比较。若所计算的F值大于某显著水平的F临界值,表示在此显著水平存在差异。 F值(3.7072)大于临界值(3.07),说明在5%显著水平存
18、在差异。 结论:A、B、C、D四个样品,由于原料配比不同,成品的弹性在5%显著水平存在显著差异。,差异程度?,【例】分类,由于加工工艺不同,通过检验,了解加工工艺对制品质量的影响。1进行分类(如级别:级)2检验分类之间有无显著性差异。X2=(AT)2/T A-观察值 T-期待值,22列联表的一般形式,四种样品,通过检验分成为三类。为了解工艺的不同对产品质量造成的影响,让30个品评员按三类的划分进行了实验:,x2(4*3列联表),期待值,观察值期待值,X2=19.49X2(41)(31),0.05)=12.59,结论:三个类别在0.05水平上有差异(工艺对质量有影响)。,【例】选择,A、B、C三
19、个以上样品中最喜欢(最不喜欢)哪个样品。某厂把自己生产的产品X,与市场上销售的其他三个同类产品A、B、C进行比较,经过60名品评员进行评价,并选择一个最喜欢的样品。,1样品间差异判断。2被多数人判断为最好的样品与其他样品间的差异判断。,【例】风味剖析,一般步骤,整理描述词汇,评价产品,分析结果,用于删减描述词的标度,运用几何平均值M将它们初步分级:F描述词实际被述及的次数占该描述词所有可能被述及总次数的百分率; I评价小组实际给出的一个词的强度占该描述词最大可能所的强度的百分率。,18个评价员用9个描述词检验5种产品。每一个描述词可被述及的次数为90次(产品数5乘以评价员数18)。每一个描述词最大可能的强度为450(强度标度最大值5乘以产品数5乘以评价员数18)。,描述词分类,列在最后两位的词3和词8可删除。,用多元分析和方差分析二次删减描述词数目。如:对6个产品的描述词1进行分析,通过方差计算后值很小,即该6个产品在这一特性上差别很小,那么可以将其删除。,统计学家与科学研究者的合作者应该在实验设计阶段,而不是在需要数据处理的时候。 试验完成后再找统计学家,无异于请统计学家为试验进行“尸体解剖”。统计学家或许只能告诉你试验失败的原因。,感悟统计,