1、1学生作弊现象与赌博行为的调查和估计摘要本文通过作弊和赌博问题的调查,深入研究敏感类问题的调查方法。利用Simmons 模型,使被调查者的合作态度进一步提高。进而对两个彼此无关的敏感问题发生的概率进行研究。1. 针对于问题(1) ,假设所有被回答者真实回答问题的概率为 1(即为必然事件) ,无放弃回答问题者。利用全概率公式,联立对两组调查求解,分别求出其概率 , 。2112121()Appp 2121Bp再利用无偏估计,求出其概率估计值 ,2112121()A 及方差估计2121Bpp,1 22 122 11 ()(1)()MMAj jjDXDYppp1 22 122 211 ()(1)()(
2、)()mmBj jpM 针对于问题(2) ,在实际问题中,对于类似敏感问题,学生真实回答问题的概率不可能为 1,现假定曾作过弊学生真实回答问题 A 的概率为 ,参加过AT赌博的学生真实回答问题 B 的概率为 ,且 均已知,而其他情形均真实BT,AB作答。由全概率公式得,11()()ABpTp ( -。22T(联立并利用无偏估计则可得 的估计为,AB2,121212AAppT。212122 BBp与问题(1)的解法相类似,最后我们可以得到方差估计分别为: 1 22 122 11 ()(1)()mmAj jjDXDYpm 1 22 122 211 ()(1)()()()()Bj jj Yp p 关
3、键字:敏感问题 全概率 无偏估计 Simmons 模型问题的提出作弊与赌博是两个不相关的敏感问题,调查者的目的是估计学生中曾有作弊和赌博行为的比例,为此设计了如下的问题:问题 A:你在考试中做过弊吗?问题 B:你从未参加过赌博吗?这样设计提问也能为被调查者提供足够的保护。为实现此调查方案,选取两组学生独立进行调查,并设计两套外形相同的卡片,其中第 i 套卡片中写有问题A 的比例为 (i=1,2) ,写有问题 B 的比例为 ,且 ,第 i 组被调查ip1ip12学生的人数为 ,他们从第 i 套卡片中随机选择一张,真是作答后放回,其中im回答“是”的人数为 。()Yi(1) 分别估计学生中曾有作弊
4、和赌博行为的比例,并给出他们的估计方差。(2) 假定曾作过弊学生真实回答问题 A 的概率为 ,参加过赌博的学生真实AT回答问题 B 的概率为 ,且 均已知,而其他情形均真实作答。试BT,B分别重新估计学生中曾有作弊和赌博行为的比例以及它们的估计方差。模型假设2. 对于问题(1)中,假设所有被回答者真实回答问题的概率为 1(即为必然事件) ,无放弃回答问题者。3. 曾作过弊学生真实回答问题 A 的概率为 ,参加过赌博的学生真实回答问AT3题 B 的概率为 , 均已知(即为常数) ,而其他情形均真实作答。BT,A字符说明1. 1, 1,20iX ini 若 第 一 组 第 个 被 调 查 学 生
5、回 答 “是 ”, 若 第 一 组 第 个 被 调 查 学 生 回 答 否 ,, ,iY ii 若 第 二 组 第 个 被 调 查 学 生 回 答 “是 ”, 若 第 二 组 第 个 被 调 查 学 生 回 答 否 ,2. 分别为在第 i 组中对问题 A,B 回答“ 是”的概率。(1,2)i3.问题(1)中: 分别表示 A 题回答“是”和 B 题回答“否”的概率。,AB4.问题(1)中: 表示 的无偏估计,B5.问题(2)中: 分别表示 A 题回答“是”和 B 题回答“否”的概率。,AB6.问题(2)中: 表示 的无偏估计,B7.曾作过弊学生真实回答问题 A 的概率为 ,参加过赌博的学生真实回
6、答问题ATB 的概率为 BT问题分析学生在考试中的作弊行为是一个严重困扰学校的学风问题,为了对这种现象的严重程度有一个定量的认识,需要通过调查来估计有过作弊行为的学生到底占多大的比例,作弊行为是不光彩的,很难再学生中做直接调查以得到可靠的数据,因此需要设计合理的调查方案,来提高应答率并降低不真实的回答。调查方案设计的基本思想是,让被调查者从包含是否作过弊和是否参加过赌博的若干问题中,随机地选答其中一个,同时让调查者也不知道被调查者回答的是哪一个问题,从而保护被调查者的隐私,消除他们的顾虑,能够对自己所选的问题真实回答,模型建立问题(1):我们要分别估计的是有过作弊现象和有过赌博行为的学生比例,
7、可以看做一个被调查学生做过弊的概率和有过赌博行为的概率,即对问题 A 回答“是”的概率(记为 )和对问题 B 回答“否”的概率(记为 )A B引入随机变量41, 1,20iX ini 若 第 一 组 第 个 被 调 查 学 生 回 答 “是 ”, 若 第 一 组 第 个 被 调 查 学 生 回 答 否 ,, ,iY ii 若 第 二 组 第 个 被 调 查 学 生 回 答 “是 ”, 若 第 二 组 第 个 被 调 查 学 生 回 答 否 ,独立同分布1212,.,nnXY ,现已知,第 i 套卡片中写有问题 A 的比例为 (i=1,2) ,写有问题 B 的比例为ip,且 ,第 i 组被调查学
8、生的人数为 ,他们从第 i 套卡片中随机选ip12im择一张,真是作答后放回,其中回答“是”的人数为 。()Yi则第 i 组回答对问题 A、B 回答“是”的概率 的估计值为i()Yii故两组的期望和方差值分别为: 1122(),()(),(,()1)i i i iEXDEYD按照假设所有被调差同学的回答都是真实的,于是由全概率公式知 11()ABp22P联立解之,得 ,2112121()Appp 2121Bp则可得 的估计为,B,2112121()Appp 2121Bpp是无偏估计,即 的期望分别为,B,AB1 21 211 2()()()1m mAj j BAj jEXpEXppp 1 21
9、 211 2()()()()()mBjAjABj j 因两组调查结果相互独立,故有 的方差分别为,AB51 22 122 11 ()(1)()MMAj jjDXDYppp1 22 122 2 2111 ()(1)()()()mmB j jj YMpp 问题(2):在实际问题中,对于类似敏感问题,学生真实回答问题的概率不可能为 1,现假定曾作过弊学生真实回答问题 A 的概率为 ,参加过赌博的学生真实回答AT问题 B 的概率为 ,且 均已知,而其他情形均真实作答。我们再重新估BT,AB计上述问题。假设对问题 A 回答“是”的概率为 和对问题 B 回答“否”的概率为A B由全概率公式得 11()()
10、ABpTpT ( -22(联立以上两式得 121212AAppT212122BBp则可得 的估计为,AB121212ATpp212122 BBp其中 为无偏估计,即 的期望为,A ,AB121111122212() ()()mj BBjjA AjEXpTpTmpp T 6121111 221212()()()()mBjBAjj BjEXpTpTmp 因两组调查结果相互独立,故有 的方差为,AB1 22 122 11 ()(1)()mmAj jjDXDYpppm 1 22 122 211 ()(1)()()()()Bj jj Yp 通过计算可知,若考虑实际情况(即学生真实回答以上两敏感问题的概率
11、不为1) ,假定曾作过弊学生真实回答问题 A 的概率为 ,参加过赌博的学生真实回AT答问题 B 的概率为 , ,则会对问题 A 回答“是”的概率估计和对问题 B 回答BT“否”的概率估计均有影响。但在实际问题中,我们虽通过 Simmons 模型,使被调查者的合作态度进一步提高,但对敏感问题真实回答的概率不可能为 1,故模型所求概率的估计值与实际定存在偏差,但是在求此概率估计值的方差时,由于曾作过弊学生真实回答问题 A 的概率为 ,参加过赌博的学生真实回答问AT题 B 的概率为 ,均看作已知值,则作为方差中的常数项,对其方差值无影响,BT即无论真实回答敏感问题的概率是否看为必然事件,对该敏感问题
12、回答“是”的概率估计的方差不变。这对我们研究实际问题带来很多便利。误差分析与模型评价(1)误差分析如果不考虑模型自身的缺陷,模型的误差主要来自两个方面:一是我们假设所有被回答者真实回答问题的概率为 1(即为必然事件) ,无放弃回答问题者。忽略了每个人不同的心理因素;二是没有考虑到利用 Simmons 模型依旧具有一定的误差性,所以所得结果并非是精确值。(2)模型评价本模型利用 Simmons 模型,有效地避免了被调查者对于敏感问题回答的不真实性,虽然仍具有一定的误差,但较之直接对被调查者进行调查,所得的结果以具有更高的真实性和可靠性。加之对全概率、无偏估计和方差估计等知识内容的应用,求出了对于
13、学生作弊和赌博情况的行为的比例和它们的估计方差。总体来说,本模型较为合理,调查结果和所求比例及方差也较为可靠。7参考文献1.姜启源、谢金星、叶俊, 数学模型 ,高等教育出版社,2011 年。2.茆诗松、程依明、濮晓龙, 概率论与数理统计 ,高等教育出版社,2004年。3.佚名, 数学建模(1) ,http:/ 年 6 月 23日。4.周国宏、李加芙、谢云霞、沈 毅、刘先林, 敏感问题的调查与统计处理技术及其在学生考试作弊行为调查上的应用 ,郧阳医学院学报,(J YMC) 1997 年12 月。5.张文红,敏感性问题的调查技术与模型 ,研究论坛,总第期。6.于 东 、 肖玉平, 敏感性问题调查的技巧 ,JournalofMathematicalMedicine,文章编号:100424337(2008)0620652203,收稿日期:2008206222。