1、1,总体与样本,2,一. 总体和个体,定义,数理统计中,我们把所研究对象的全体称为总体;总体中的每个元素称为个体,例1.,当研究某地区职工收入平均水平时,这地区 所有职工的月收入组成了总体;而每个职工月 收入就是个体。,(1),(2),研究某批灯泡的质量,则该批灯泡寿命的全体 就组成了总体;而每个灯泡的寿命就是个体。,总体,3,注:,总体依其包含的个体总数分为有限总体(个体的个 数是有限) 和 无限总体(个体的个数是无限的)。但当有限总体它所含的个体的个 数很大时也可视其为无限总体。,4,总体可以用一个随机变量来表示,设该大学一年级学生的年龄分布如下表,若从该大学一年级学生中任意抽查一个学生的
2、年龄,所得结果为一随机变量,记作X.,5,X的概率分布是:,可见,X的概率分布反映了总体中各个值的分布情况. 很自然地,我们就用随机变量X来表示所考察的总体.,也就是说,总体可以用一个随机变量及其分布来描述.,6,又如:研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示.,某批 灯泡的寿命,总体,寿命X可用一概 率分布来刻划,鉴于此,常用随机变量的记号 或用其分布函数表示总体. 如 说总体X或总体F(x) .,7,二. 抽样和样本,为推断总体分布及各种特征,按一定规则 从总体中抽取若干个体进行观察试验,以 获得有关总体的信息,这一抽取过
3、程称为 “抽样”,所抽取的部分个体称为 样本, 样本中所包含的个体数目称为 样本容量。,从某批国产轿车中抽5 辆进行耗油量试验。这一过程即为“抽样”,这 5 辆轿车为一个样本,其样本容量为 5,抽样,例如:,8,为了使得样本能很好的反映总体的情况,从总体中抽取样本,必须满足下述两个条件:,随机性:为了使样本具有充分的代表性,抽样必须是随机的,总体中的每个个体都有同等的机会被抽到;,独立性:各次抽取必须是独立的,即每次抽样的结果既不影响其它各次抽样,也不受其它各次抽样的影响,这种随机的、独立的抽样方法称为简单随机抽样 由此得到的样本称为简单随机样本,以后我们涉及的抽样和样本都是指简单随机抽样和简
4、单随机样本,9,定义,设总体X是具有某一概率分布的随机变量。如果 相互独立,且都与X具有相同的概率分布,则称其为来自总体X的简单随机样本,简称为样本,n称为样本容量。,在对总体X进行一次具体的抽样并观测之后,得到样本 的确切数值 ,称为样本观察值(观测值),简称为样本值,10,且总体X 的分布函数为 F( x ),概率密度为f (x),则 :,联合概率密度为:,联合分布函数为:,如果把容量为 n 的样本看作 n 维随机变量。,11,事实上我们抽样后得到的资料都是具体的、确定的值. 如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本. 我们只能观察到随机变量取的值而见不到随机变量.,三. 总体、样本、样本值的关系,12,统计是从手中已有的资料-样本值,去推断总体的情况-总体分布F(x)的性质.,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.,样本是联系二者的桥梁,