1、,总体,样本,参数,统计量,y,p,平均数,总 量, 比 例,单指标,2.2 比率估计量,一、问题的提出 (1)在许多实际问题中常常涉及两个调查变量(指标)Y 和X 。常常要估计总体比率R。 (2)总体比率在形式上总是表现为两个变量总值或均值之比。 (3)如:估计家庭中用于食品的支出在总支出中的比重;在校的儿童对全体学龄儿童的比重等等 (4)比率ratio与比例proportion的区别:比例中总体的容量已知,仅需调查一个指标;比率中需要调查样本的两个指标。,二、使用场合 (1)调查目标就是想要估计总体比率,应用比率估计量,此时两个变量均为调查变量。 (2) 一个变量为调查变量,另一个变量是辅
2、助变量。在对调查变量的目标量进行估计时,利用已知的辅助变量信息构造比率估计量可以改进估计的精度。限制条件:要求辅助变量的总体总量或均值是已知的。,三、辅助变量(auxiliary variable) (1)与调查变量密切相关的变量 (2) 如:在调查家庭用于食品支出的平均费用,则可利用家庭总收入或总支出作为辅助变量。 (3)在实际问题中,辅助变量常采用调查指标的前期资料。 (4)充分利用辅助变量的信息,可以提高估计的精度。,设调查指标为Y,辅助变量为X,所用的符号,比率估计量(Ratio estimator),比率估计量,比估计与简单估计之比较,统 计 思 想 上,简单估计只利用了样本中指标y
3、的信息(线性组合,称为简单估计),比估计不仅利用了样本中指标y的信息,同时利用了与y密切相关的x的信息以及辅助变量X的信息,(非线性组合,称为复杂估计),比估计性质,先来研究一个从人为的小总体中抽取的全部可能样本的比估计及其偏倚。,根据要求分别计算每个可能样本的,(3)比估计是有偏估计!,(4)比估计的偏倚不大,随着样本量的增大,偏倚将趋于零。,比估计的性质,性质1比估计是有偏估计。,性质2比估计是渐近无偏估计。,性质3比估计的均方误差,性质4,性质5,由Taylor公式在x=x0点展开,性质2,3的证明,性质4的证明,性质1比估计是渐近无偏估计。,性质2,其他比估计的性质,性质3,具体例子,
4、例1:在二十世纪90年代初的一项工资研究中,人们发现IT行业中,从业者的现薪与起薪之间相关系数高达0.88,已知某IT企业474名员工的评鉴起薪为17 016.00元/年,现根据对100个按简单随机抽样方式选出的员工现薪的调查结果,估计该企业员工的现薪平均水平。数据如下:,,,,,解:简单估计,95的置信区间,比估计,95的置信区间,例:现设某地区45万户居民1998年底的居民储蓄存款余额为135亿元,而调查300户居民家庭得知户均年总收入为1.8万元,户均储蓄存款余额为2.6万元,用比估计法估计该市居民总体的户均年总收入及年总收入。,比估计与简单估计精度的比较,例:交通运输统计中有三个重要的指标,即运量、周转量与平均运距,其中平均运距是总周转量除以运量所得的商,为估计公路载货汽车的平均运距,在总体中用简单随机抽样抽取32辆货车,记录每辆车在一个月内的运量xi与周转量yi,统计计算结果如下:试估计平均运距R并给出它95%的置信区 间。,例 某系统共有N=687个单位,为预估当年全系统的工资总额,用简单随机抽样抽取一个n=26个单位的样本。下表是这26个单位当年及上一年工资总额数。已知上一年全系统工资总额为70523.16万元。(1)估计当年全系统的工资总额及估计的标准差;(2)求当年的工资总额的置信度为95%的置信区间。,