1、20112012 学年第二学期社会统计学与 SPSS 应用练习题一、单项选择题1只能把研究对象分类,即只能决定研究对象是同类或是不同类的,具有与的数学属性,例如:性别,民族等变量,该类变量是(A )A.定类变量 B.定序变量 C.定距变量 D.定比变量2根据上题内容,在操作 SPSS 软件时,在 Measure 选项中选择正确的是( B)A.B.C.D.3针对出生婴儿性别状况的多年调查发现,新生婴儿男女性别比一直在 50%左右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。这说明新生婴儿性别状况属于(D) 。A.非统计现象 B.统计现象 C.非随机现象 D.随机现象4针对出生婴儿性
2、别状况的多年调查发现,新生婴儿男女性别比一直在 50%左右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。这体现新生婴儿性别状况具有(D) 。A.确定性 B.因果性 C.必然性 D.随机性5为调查不同年龄段群体对某商品的偏好程度,把年龄划分为:婴幼儿、青少年、成年、中年、老年,那么,年龄划分违背了变量取值的 原则。 (B)A.完备 B.互斥 C.整体 D.差异6下列哪类变量能用折线图表示其分布状况?(C)A.定类变量 B.定序变量 C.定距变量 D.虚拟变量7下列某变量取值状况的累积图,其中正确的表现形式是(B) 。8下两图是正态分布密度曲线,两图的 2 相同,图 1 较之图 2
3、的密度曲线向左移了一些,这说明(C) 。A.1 2 B.1=2 C.1 2 D.1 29在 SPSS 软件中,对于多选项分析而言,如下所示首先应该操作步骤的是(C)A BC D图 1 图 210下图所示的若为了测量集中趋势,需要在哪个前打“”的是(B) 。A. FrequenciesB. DescriptivesC. Define Variables SetsD. Frequencies11下图包含两条正态分布密度曲线,它们的 相同,那么上方曲线的 1 与下方曲线 2 的关系是(C) 。A. 1 2 B. 1=2 C. 1 2 D. 1 212下列哪类分布图形随着自由度 k 无限增加,逐渐趋于
4、标准正态分布。 (D )A.E 分布 B. 2 分布 C. F 分布 D.t 分布13在进行区间估计时,置信度与显著性水平之和为(C) 。A. 0 B. 1 C. 1 D. 2A. QuartilesD. RangeC. VarianceB.Mode14在进行区间估计时,显著性水平为 ,置信度为(C) 。A. 0 B. C. 1 D. 215在拒绝原假设时出现的错误称为(D) 。A.第二类错误 B.纳伪的错误 C.以假当真错误 D.弃真的错误16大样本二总体均值差进行统计检验时与单样本均值检验相比,主要区别是(A) 。A.标准差 B.均值 C.统计量分布 D.临界值17大样本二总体成数差进行统
5、计检验时与单样本成数检验相比,主要区别是(A) 。A.标准差 B.均值 C.统计量分布 D.临界值18如下表所示,求出 22 表中相关强度 系数为(C) 。群体划分消费状况市民 民工大型超市 30 10消费场所小型商店 10 30A. 1 B. 0.3 C. 0.5 D. 0.419如下表所示,求出该表中同序对的个数为(B) 。父辈受教育状况大学 中学 小学大学 10 6 3中学 8 10 7子辈小学 2 4 10A.310 B.624 C.524 D.31420两个定序变量之间 Gamma 系数取值范围为(A ) 。A. 1 ,1 B. ,0 C. 0,+ D. 0,121为测量两个定类变量
6、相关系数,需要在下列哪项功能前打“”?(A)二、填空题1所有变量值百分比对的集合称作百分比分布,又称变量的频率或相对频次分布。2在制作统计表时,需要对变量取值进行分组,一般分组点比原统计资料的精度要高一位,例如,原统计资料的年龄以年计算,统计范围为 12 岁、34 岁、56 岁、78 岁等分为四组,实际分组为 0.52.5 岁、2.54.5 岁、4.56.5 岁、6.58.5 岁等四组,那么,原统计资料的分组组界称为标明组界。3统计表必须具备的内容有表号、表头、标识行、主体行、表尾等五部分组成,这样才能构成一份完整的统计表。4某村家庭子女数量频次分布:2、3、1、4、2、4、3、2、1、2、0
7、、1、2、3、1、3、2、0、4、2,在家庭子女数量这个变量取值中众值是 2 。5某社区六个家庭人口数量分布:3、4、5、8、9、9 在家庭人口数量这个变量取值中中位值是 6.5 。6方差与标准差用来度量定距变量的离散程度的测量方法。7当变量的取值满足了完备性和互不相容性,那么取值和概率对的集合就是随A.B.D.C.机变量的概率分布。8古典法产生于概率论发展的早期,以“在相似的条件下进行无数次实验”的观点来思考问题,以对象本身所具有的对称性而事先得到的,故被称为先验概率。9统计推论的基础是概率论,内容包括两部分:参数估计与假设检验。10从总体中抽取容量为 n 的样本,可以看作 n 个独立同总体
8、分布的随机变量1, 2, n,那么,随机变量 1, 2, n 的任何函数 f( 1, 2, n )也是随机变量。我们把函数 f( 1, 2, n )叫作统计量。11根据随机变量的观测值 X1 , X2 , , Xn 计算得到的一切统计数字特征(例如均值、方差)可以看作是相应统计量的观测值,统计量的分布又称抽样分布。12原假设(H 0)又称虚无假设或解消假设,常常是根据已有的资料,或根据周密考虑后确定的。13备择假设(H 1)又称为研究假设,当经过抽样调查,有充分根据否定原有假设时,就产生了需要接受其逻辑对立面的假设。14假设检验的基本原理是小概率原理。15在某个列联表中,只观察其中某一变量的分
9、布,而不管另一个变量的取值,这样就得到边缘分布。16协方差表示两个定距变量观测值相对其各自均值所造成的共同平均偏差。17两个定距变量的相关系数 r 是度量变量间的线性相关程度的,具有 PRE 性质,r 的平方又称为判定系数有着直观的解释意义。18方差分析是研究定类变量与定距变量之间相关关系,主要分析或检验总体间的均值是否有所不同。19方差分析中把被解释掉的误差在总体误差中所占的比率称为相关比率。20非参数检验是指“对分布类型已知的总体进行参数检验”之外的所有检验方法。 21非参数检验方法是指这类方法的使用不需要对总体分布作任何事先的假定,也不是检验总体分布的某些参数,而是检验总体某类有关的性质
10、。三、判断题(根据题意,表述正确的在后面括号内打“” ,表述错误的在后面括号内打“” )1在选用社会统计分析方法时,需要注意区分研究的是单变量还是多变量,前者往往分析存在的关系及其强度,后者分析变量的集中或离散的特征情况。()2在绘制统计表时,对于定序变量而言需要注意次序排列、变化趋势。 ()3直方图可以用来反映定类变量的取值状况。 ()4直方图与条形图形状相同,没有什么本质区别。 ()5中位值比较适用于定距变量。 ()6某个变量取值呈正态分布,它的众值、中位值重叠,与均值不重叠。 ()7某个变量取值呈正态分布,它的众值、均值重叠,与中位值不重叠。 ()8统计推论是根据局部资料(样本资料)对总
11、体的特征进行推断。 ()9 “抽样结果与总体参数不一致”是随机现象在推论中所特有的。 ()10总体分布为正态分布 N(, 2) ,且方差已知,随着样本容量 n 的增加,也不能减少样本均值抽样分布的分散程度。 ()11若总体分布为正态分布,且方差已知,样本均值分布服从 t 分布。 ()12若总体分布为正态分布,大样本均值的极限分布不是 N(0,1) 。 ()13在区间估计中,置信度表示用置信区间估计的可靠性。 ()14在区间估计中,显著性水平表示用置信区间估计不可靠的概率。 ()15大样本二总体均值差的分布不服从正态分布。 ()16大样本二总体成数差的分布不服从正态分布。 ()17两个定类变量之
12、间以 2 为基础的相关性测量得到 C 系数具有减少误差比例性质。 ()18两个定类变量之间相关性测量得到 系数不具有减少误差比例性质。 ()19Gamma 等级相关的 G 系数具有减少误差比例的性质。20斯皮尔曼等级相关系数 rs 具有减少误差比例的性质。四、计算题(要求步骤完整,计算结果正确)1根据下表 2008 年某班级 Q 课程成绩统计分布情况,求某班级 Q 课程成绩的中位值。2008 年某班级 Q 课程成绩统计分布情况成绩等级 频次 累计频次不及格 3 3及格 12 15中 18 33良好 22 55优秀 5 602根据下表某城市抽样调查家庭月收入统计分布情况,求该市家庭月收入的中位值
13、。某城市抽样调查家庭月收入统计分布情况家庭月收入 频次 累计频次(cf) 累计百分比(%) 500 及以下 10 10 10 5001000 20 30 30 10002000 35 65 65 20003000 25 90 90 3000 及以上 10 100 100 3下列统计表反映是抽取两个社区部分居民受教育年限的统计分布状况:社区类别 抽样数量(个) 受教育年限分布状况(年)A 5 7、3、11、10、4B 6 6、5、5、8、10、8根据抽样数据,求出两个社区的平均受教育年限各是多少?相同吗?4某系大学一年级共 550 人,Z 课程期末考试成绩统计如下表,求该课程的平均分数是多少?某
14、系大学一年级 Z 课程期末考试成绩统计分布状况分数 学生数量50 1560 2863 4070 29074 16080 17总和 5505针对某村返乡人口状况进行调查,抽取 11 户大型联合家庭进行调查,各自家庭返乡人口数量分别为:2、2、3、4、4、4、5、5、6、6、7。求样本中返乡人口数量的四分互差是多少?答案:Q=36为了解某种新型奶制品的消费者偏好状况,访问了 80 个消费者,其中,选择喜欢的有 25 个,选择一般的有 30 个,选择不喜欢的有 20 个,选择无所谓的有 5 个。求反映偏好状况的四分互差是什么?答案:有 50%的消费者在喜欢与不喜欢之间。7设某工厂妇女从事家务劳动时间
15、服从正态分布 N(,0.66 2) 。根据 36 人的随机抽样调查,每天平均从事家务劳动时间为 2.65 小时,求 的双侧置信区间(置信度 0.95,Z /2=1.96,保留小数点后两位)答案:2.44 ,2.878为了对某工厂职工休闲时间进行研究。根据一次样本(n=33)的调查,平均每天看电视时间为: =0.96 小时,S=0.47 ,试求全厂职工平均每天看电视时间的区间估计(置信度为 95%) 。假定看电视时间服从正态分布 N(, 2) ,其中2 未知。解析:只知道总体的分布状况而不知道方差,只是样本均值分布服从 t 分布,需要查表,并且要注意 t 分布是对称分布。 X查表:t /2 =2
16、.03692.04 t /2 =2.04答案:0.79 ,1.139设某社区受教育程度服从正态分布 N(,3.6 2) ,根据 25 人的随机调查,平均受教育年限均值为 11.5 年,求 的双侧置信区间(1-=0.99,Z /2=2.58,保留小数点后两位)9.64, 13.3610为了验证统计报表的正确性,作了共 50 人的抽样调查,人均收入的结果有 =871 元, S=21 元,问能否证明统计报表中人均收入 =880 元是正确的(显著性水平 =0.05,Z /2=1.96) 分析与解析步骤: (一)原假设 H0 := 0 =880(二)备择假设 H1: 0880 (三)统计量与拒绝域:根据
17、显著性水平 =0.05,查表拒绝域临界值:Z /2=1.96(四)判断:Z=3.031.96,拒绝原假设,即根据抽样调查不能认为人均收入为 880 元,统计报表是有误的。 11某地区成年人中吸烟者占 75%,经过戒烟宣传之后,进行抽样调查,发现100 名被调查的成年人中,有 63 人是吸烟者。问戒烟宣传是否收到了成效?(=0.05,Z =1.96)解析步骤: (一)原假设 H0 :p=p 0 =0.75(二)备择假设 H1:pp 0= 0.75(三)统计量与拒绝域:根据显著性水平 =0.05,查表拒绝域临界值:Z= 1.96(四)判断: Z=2.771.96,否定原假设,即认为戒烟宣传是有成效
18、的,吸烟比例有所下降。 12已知初婚年龄服从正态分布,根据 9 个人的抽样调查有: =23.5 岁,S=3 岁,问是否可以认为该地区平均初婚年龄已超过 20 岁( =0.05)?解:原假设 H0 :=20 岁备择假设 H1: 单边 20 岁 统计量查表自由度为 8, =0.05 ,t 临界值为 1.86,小于 3.5,所以拒绝原假设,认为平均初婚年龄超过了 20 岁。 13就近上学(表示为 A)与乘车上学(表示为 B)对学习影响,抽样结果如下: 问两者学习成绩是否有差别,如果有,哪种方式更好些?( =0.05) 解:(1)原假设 H0 : A B =0备择假设 H1: A B 0(2)统计量
19、(3)拒绝域 查表 =0.05,Z /2=1.96,小于 7.04,所以,认为有差别,而且就近入学要好。14以下表中是 5 对子代和父代之间年收入状况的抽样调查,求两者回归直线方程。代际差别 年收入状况(万元)父代 2 4 6 8 10子代 4 5 8 7 9解析过程:=11=1=1=24=121( =1) 2=40=0.6=3=+=3+0.615以下表中是 5 对子代和父代之间人际网络(好朋友数量)的抽样调查,求两者回归直线方程。代际差别 好朋友数量(个)父代 2 4 6 8 10子代 4 5 8 7 9解析过程:=11=1=1=24 =121( =1) 2=40=0.6 =3 =+=3+0
20、.616求下列表的 系数与 系数(=0.05) 。 (1)检验相关;(2)求 系数;(3) 系数表 4-3:某地区男女工作经历状况(单位:个)不同状况 男 女 共计无“跳槽”经历 30 120 150有“跳槽”经历 30 20 50共计 60 140 200答案:检验两者之间存在相关。17为了解学生活动能力与智商间是否有关,作了 10 名学生的抽样调查,结果如下:学生 活动能力名次 智商A 1 110B 2 110C 3 105D 4 95E 5 120FJ 6 94G 7 100H 8 105I 9 105J 10 110问:学生活动能力与智商是否有显著差异(=0.05)?答案:无显著性差异,0.542.30解答思路:参见 320321 页例 2,首先对智商进行排序,相同智商名次求取平均名次,然后按照以下步骤:(1)原假设: 0=0 或变量是相互独立的,备择假设(2)统计量:(3)临界值确定,做出判断。 841.3)(2