1、基于校园霸凌行为的模型的建立与分析摘 要校园霸凌,又称校园欺凌或校园暴力,是各种形式校园暴力中的一种,从某种意义上说, 也是危害程度较高的一种。近年来, 我国发生的多起校园霸凌事件在媒体的报道下引发了许多国人的关注。科学技术和网络的的飞速发展,给青少年带来的不仅仅是积极的影响。各类霸凌事件的发生经媒体和互联网报道出,让许多青少年在思想意识不健全的情况下吸收性的接收这些信息,对青少年的身心造成了更直接的伤害。在这个问题提出时,我们已经明确,使青少年施加暴力行为的原因很多,但最主要的原因还是年龄。青少年由于年龄较小,不知道如何应对和转化暴力性冲动,才造成对自身和他人的伤害。所以这篇文章我们将以年龄
2、作为最主要的自变量。针对不同年龄段青少年的心理状况,本文第一部分,主要通过建立合理的数学模型,并以一种科学合理的方式判断评价各个年龄段的心理状况是否有显著差异的量化方法。针对该问题,应用数理统计的相关概念,对该数据进行显著性分析、单因素方差分析,采用 F 检验、K-W 检验对实验结果再一次检验核对,利用 excel 对数据结果进行绘图分析,分析得出青少年存在一些潜在心理问题的可能性。本文第二部分,涉及生命教育、生活方式、娱乐三个领域,分别包括正向和负向两个框架,其中因变量被设计成一种二选一式的评价变量,使用 A 或 B 来表示。自变量包括风险偏好、认知需要、决策风格(包括理智型、直觉型、依赖型
3、、回避型、冲动型)这 5 个维度三个主要方面,主要分析不同框架的主要影响因素。针对该问题,首先从变量开始着手,通过因子分析和主成分分析分析相关数据,并通过卡方检验和框架效应等方法得出科学合理的结论,用 R 软件,SPSS, excel 等软件对数据进行分析,最后提出抑制校园霸凌事件发生的主要策略。关键词: 校园霸凌 单因子方差分析 显著性检验 主成分分析一、问题重述1.1 问题背景近年来,我国发生的多起校园霸凌事件在媒体的报道下引发了许多国人的关注。霸凌事件对学生身体和精神上的影响是极为严重而长远的,因此对于这些情况我们应该给予高度的重视。驱使青少年施加暴力行为的原因很多,但最主要的诱因还是年
4、龄。青少年由于年龄较小,不够成熟,不知道如何应对和转化暴力性冲动,才造成对自身和他人的伤害。1.2 需要解决的问题问题一:通过统计分析, 判断各个年龄段的心理状况是否有显著的差异。问题二:建立合理的数学模型,分析不同框架的主要影响因素。根据建立的数学模型,得到的不同年龄段青少年的心理状况,向当地报纸 写一份 500 字左右的分析报告,阐述你对抑制校园霸凌事件发生的主要策略。二、问题分析2.1 基本信息针对校园霸凌行为,我们设计了一次针对不同年龄段青少年的心理状况的问卷调查,试图建立一个模型来判断青少年存在一些潜在心理问题的可能性。调查分为 5 个年龄段,这要涉及生命教育、生活方式、娱乐三个领域
5、,分别包括正向和负向两个框架。其中因变量被设计成一种二选一式的评价变量,使用 A 或 B 来表示。自变量包括风险偏好、认知需要(包括 18 个题目)、决策风格(包括理智型、直觉型、依赖型、回避型、冲动型,这 5 个维度,每个维度下包括 5 个题目)三个主要方面,每个方面的题目可以按照选择的答案来计算相应的得分。2.2 相关数据依据附件给出的问卷的调查结果进行模型建立与分析。2.3 问题分析本题主要是考察青少年的心理状况,年龄为自变量,通过 9、11、13、15、17 岁组别的比较,找出青少年心理状况与年龄的关系;此外,同一年龄组的人,在风险偏好、认知需要以及决策风格方面也有显著差异,必须探究这
6、些差异对青少年心理状况的影响;最后,问卷对五个年龄段的青少年在生命教育、生活方式、娱乐三个领域,又做了评价,我们必须得出评价的结论和相关度。为解决上述两个问题,我们将采用 Excel、SPSS、MATLAB 等软件来协助分析。第一问将主要运用显著性分析和单因子方差分析,通过 F 检验判断各个年龄段的心理状况差异性;第二问将主要运用主成分分析、卡方检验、框架效应等方法,通过 T 检验分析不同框架的主要影响因素,并提出对抑制校园霸凌事件发生的主要策略。三、 模型假设(1) 本次采用抽样调查,每张问卷均认真填写且数据真实可靠(2) 数据明显不符的问卷视为无效问卷(3) 青少年的心理状况仅由年龄、风险
7、偏好、认知需要与决策风格决定(4) 同一年龄组的青少年的心理状况无显著差异四、 符号说明SS 方差 Sig 显著性差异df 自由度 R2 决定系数MS 均方差 V 本征矢量矩阵F 两个均方的比较 Y1 自定义变量,9 岁综合主成分P-value 确定某个因子是否显著 Y2 自定义变量,11 岁综合主成分F crit 相应水平下的 F 临界值 Y3 自定义变量,13 岁综合主成分K 主成分个数 Y4 自定义变量,15 岁综合主成分Y 自定义变量(F-F crit)Y5 自定义变量,17岁综合主成分Z 自定义变量五、问题一模型的建立与求解5.1 模型准备 显著性检验理论显著性检验就是事先对总体(随
8、机变量)的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设(原假设)是否合理,即判断总体的真实情况与原假设是否显著地有差异。或者说,显著性检验要判断样本与我们对总体所做的假设之间的差异是纯属机会变异,还是由我们所做的假设与总体真实情况之间不一致所引起的。抽样实验会产生抽样误差,对实验资料进行比较分析时,不能仅凭两个结果(平均数或率)的不同就得出结论,而是要进行统计学分析,鉴别出两者差异是抽样误差引起的,还是由特定的实验处理引起的。通常引入 p 值(p-value)作为检验样本观察值的原假设可被拒绝的最小显著性差异水平。公式 1 P(X=x)0.05,所以可得出不显著的结论。其次,
9、上面 7 张表得出的总均值,可能表示在这一因素下,影响最大的年龄段。如果上述假设成立,我们对这七个因素的总均值求平均取整为 13。结合表中数据可以看到,风险偏好、认知需要等对 13 岁以下的青少年影响尤为强烈,即 13 岁以下较显著,13 岁以上无显著差异。综上所述,青少年各年龄段的心理状况总体无显著差异。5.3 可信分析 数据的可信度数据来源于一次针对不同年龄段青少年的心理状况的问卷调查,每个方面的题目按照选择的答案来计算相应的得分。在调查问卷中,由于不同年龄的青少年在生命教育、生活方式、娱乐等领域存在差异,导致不同年龄段青少年对相同题目的评分差异很大,通过此问卷来判断青少年存在一些潜在心理
10、问题的可能性不能完全得出正确的结论。其次,不排除乱填问卷的可能,且样本容量有限,抽样人群可能不具备良好的代表性等,所以在初步筛选阶段,我们只能剔除不完整数据,但我们并不能剔除这些“脏数据” 。因此,实验结论可能有偏差。 统计结果的置信度由于本次实验主要在 SPSS 环境下完成,在分析可靠度、F 检验时,本身有置信区间,即对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。置信区间给出的是被测量参数的测量值的可信程度,即前面所要求的“一定概率” 。这个概率被称为置信水平,通常状况下设为 95%,因为在许多研究领域,0.05 的 p 值通常被认为
11、是可接受错误的边界水平) 。这意味着我们将 95%近似认为 100%,其余 5%认为偶然发生,若考虑真实情况也有可能对实验结果造成影响。 结论具有武断性我们认为结果无效而被拒绝接受的水平的选择具有武断性。实践中,最后的决定通常依赖于数据比较和分析过程中结果是先验性还是仅仅为均数之间的两两比较,依赖于总体数据集里结论一致的支持性证据的数量,依赖于以往该研究领域的惯例。通常,许多的科学领域中产生 p 值的结果0.05 被认为是统计学意义的边界线,但是这显著性水平还包含了相当高的犯错可能性。结果 0.05p0.01 被认为是具有统计学意义,而 0.01p0.001 被认为具有高度统计学意义。但要注意
12、这种分类仅仅是研究基础上非正规的判断常规。六、问题二模型的建立与求解6.1 模型准备 因子分析因子分析法是指从研究指标相关矩阵内部的依赖关系出发,把一些信息重叠、具有错综复杂关系的变量归结为少数几个不相关的综合因子的一种多元统计分析方法。基本思想是:根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同组的变量不相关或相关性较低,每组变量代表一个基本结构,即公共因子。 主成分分析(PCA)主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。其方法主要是通过对协方差矩阵进行特征分解,以得出数据的主成分(即特征向量)与
13、它们的权值(即特征值) 。PCA 是最简单的以特征量分析多元统计分布的方法。定义一个 nm 的矩阵,XT 为去平均值(以平均值为中心移动至原点)的数据,其行为数据样本,列为数据类别(注意,这里定义的是 XT 而不是 X) 。则 X 的奇异值分解为 X=WVT,其中 mm 矩阵 W 是 XXT 的本征矢量矩阵, 是 mn 的非负矩形对角矩阵,V 是 nn 的 XTX 的本征矢量矩阵。据此,公式六 TTWVY当 m0.6 时,表明两变量之间拟合度较好,我们发现,所有变量与年龄的拟合度很差,所以,表明这些变量无相关性,即表明上述除理智型和依赖型以外,都是青少年心理状态的主要影响因素。 框架效应针对本
14、题数据,我们认为,A 表示风险规避,B 表示风险偏好。在同一维度下,比如生命教育的生命正向和生命负向,该个体的两种表现均为 A,则在生命教育这一个维度该个体的表象是比较强烈的。该个体的两种表现均为 B,则在生命教育这一个维度该个体的表象是比较较弱,或者说没有明显的个体表现。该个体一栏为 A 一栏为 B(不考虑到底是生命正向还是生命负向) ,我们就说该个体的生命教育表现程度中等,不过非强烈,也不偏向表现弱这一程度。6.3 可信分析 因子分析产生误差对于高维数据来说,主成分个数 K 过大,数据压缩率不高,在极限情况 K=n 时,等于是在使用原始数据(只是旋转投射到了不同的基) ;相反地,如果 K
15、过小,数据的近似误差太太。决定 K 值时,我们通常会考虑不同 K 值可保留的方差百分比。具体来说,如果K=n,那么我们得到的是对数据的完美近似,也就是保留了 100%的方差,即原始数据的所有变化都被保留下来;相反,如果 K=0,那等于是使用零向量来逼近输入数据,也就是只有 0%的方差被保留下来。在数学模型中,我们将不同年龄组的数据合并成为一张表,就造成 K 值过大的问题,所以为顺利得出数据,我们将部分边缘数据删除,可能造成较大误差。 统计结果的可信度在这里,我们把所有检验统计都认为是正态分布的。但实际并非总是如此,但大多数检验都直接或间接与之有关,可以从正态分布中推导出来,如 F 检验或卡方检
16、验。这些检验一般都要求:所分析变量在总体中呈正态分布,即满足所谓的正态假设。许多观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本特征的原因。当人们用在正态分布基础上建立的检验分析非正态分布变量的数据时问题就产生了。这种条件下有两种方法:一是用替代的非参数检验(即无分布性检验) ,但这种方法不方便,因为从它所提供的结论形式看,这种方法统计效率低下、不灵活。另一种方法是:当确定样本量足够大的情况下,通常还是可以使用基于正态分布前提下的检验。后一种方法是基于一个相当重要的原则产生的,该原则对正态方程基础上的总体检验有极其重要的作用。即,随着样本量的增加,样本分布形状趋于正态,即使所研究的变
17、量分布并不呈正态。七、问题模型的评价与检验7.1 模型的评价 模型的优点从题意出发,充分运用 SPSS、excel 等程序绘制了大量的图表,使得数据分析和处理更加具备科学性和合理性。在分析问题的过程中建立的合理的模型和方法,主要运用显著性分析、单因子方差分析、F 检验等模型,判断各个年龄段的心理状况差异性;运用主成分分析、卡方检验、框架效应等方法,判断出影响校园霸凌事件的主要影响因素。运用主成分分析,可消除评价指标之间的相关影响,减少指标选择的工作量,当评级指标较多时还可以在保留绝大部分信息的情况下用少数几个综合指标代替原指标进行分析,反映了该主成分包含原始数据的信息量占全部信息量的比重,它克
18、服了某些评价方法中认为确定权数的缺陷,这样确定权数是客观的、合理的,分析不同框架的主要影响因素。 模型的缺点显著性检验在一定程度上会产生抽样误差,由于定量数据较少,定性成分多,在比较分析实验资料时,不能仅凭部分结果的不同就得出结论,鉴别两者差异是抽样误差引起的,还是由特定的实验处理引起的还是需要大量的数据进行验证。在主成分分析中,我们首先应保证所提取的前几个主成分的累计贡献率达到一个较高的水平,在实际问题中,通常第一主成分的特征值远远大于其他主成分的特征值,所以第一主成分 F1 的方差贡献也常常很大,而其他主成分的方差贡献却很小,这样 F 未能对 m 个主成分起到一定的综合作用。在处理数据和求
19、解过程中不可避免各种误差,在一定程度上也影响到模型求解的精确度。7.2 模型的检验经检验证实模型均基本符合建立模型的初衷,有助于合理地分析数据、处理数据,最终得出具有置信度的结论。八、给当地报纸的分析报告校园霸凌事件分析报告近年来,我国发生的多起校园霸凌事件在媒体的报道下引发了许多国人的关注。校园霸凌事件对学生身体和精神上的影响是极为严重而长远的,因此对于这些情况我们应该给予高度的重视。针对不同年龄段青少年的心理状况的问卷调查,我们通过对数据处理,数学建模等分析得到一些结论,根据这些结论,我们认为可以从以下三方面抑制校园霸凌事件的发生。开展生命教育。主要是指通过对学生进行生命的孕育、生命的发展
20、、生命价值的引导和教育,让他们对自己有一定的认识,对他人的生命抱有珍惜和尊重的态度,并让学生在受教育的过程中,培养对社会及他人的爱心,使学生在价值观、人格等方面获得全面发展。开展安全自护教育。学校不仅要给学生正面教育,也要教给学生抗暴御辱的道理和方法,教给学生面对危险的方法,提高学生抗非安全因素的能力。进行生活指导教育。生活指导教育是指帮助学生加深个人对自身的认识,最充分的发挥自己的能力与兴趣,完满的适应自身所处的环境,能够做出明智的决定,对社会作出独有的贡献,同时加强生活技能的训练。此外,防治校园霸凌还须由家长、学校和社会三方面共同综合治理。家长多关心孩子在校生活的各个方面,如有问题才能及早
21、发现,及时与学校联系,及时解决。学校要加强管理和教育,成立监督和处理机构,对实行霸凌者严格管制,对被霸凌者要加强保护和自我保护能力,防止反复发生。社会公共机构、社会团体、警政等系统要提供强而有力的后盾,建立专业支援网络与机制,以预防并处理霸凌事件。最后,我相信,校园霸凌现象定会减少!九、参考文献1.郭丰波.覃伟 校园霸凌行为中的心理因素及其干预期刊论文-科教文汇 2011(31)2.盛骤.谢式千.潘承毅 概率论与数理统计 单因素方差分析 假设检验的置信区 间多元线性回归 教材-浙江大学3.陈少卿.陈青丽 单因子方差分析在数据分析中的应用期刊论文-中国石油和化工标准与质量 2006(7)4.刘雪
22、峰.张志学.梁钧平.Liu Xuefeng.Zhang Zhixue.Liang Junping 认知闭合需要、框架效应与决 策偏好期刊论文-心理学报 2007(4)5.邢航 多因素方差分析中数学模型的建立与检验方法期刊论文-电大理工 2008(2)6.陈慧媛.岳鹏飞.李寿欣.Chen Huiyuan.Yue Pengfei.Li Shouxin 青少年的决策风格与认知需求和 控制源的关系期刊论文-山东教育学院学报 2010(2)7.邢航 试论多因素无交互作用方差分析中数学模型的建立与应用期刊论文-科技创新导报 2009(12)8.尤阳 受网络欺凌行为问卷的修订及其影响因素的分析学位论文硕士
23、20139.郭丰波.覃伟 校园霸凌行为中的心理因素及其干预期刊论文-科教文汇 2011(31)十、附录10.1 平均值(:9 岁组 :11 岁组 :13 岁组 :15 岁组 :17 岁组)认知需求1 2 3 4 5 6 7 8 9 4.45 4.88 4.98 5.39 5.54 4.88 4.35 5.20 4.46 4.39 4.72 5.08 5.51 5.55 4.72 4.42 5.29 4.61 4.26 4.54 4.90 5.65 5.49 4.80 4.36 5.28 4.63 4.19 4.66 5.22 5.59 5.62 4.65 4.35 5.34 4.64 4.05
24、 4.74 4.90 5.40 5.46 4.82 4.33 5.26 4.49 10 11 12 13 14 15 16 17 185.29 4.88 5.03 4.64 3.51 3.78 4.64 5.31 3.82 5.01 4.36 5.15 4.26 3.50 3.59 4.87 5.41 3.66 5.26 4.45 4.96 4.34 3.66 3.80 4.65 5.29 3.87 5.21 4.34 5.19 4.38 3.65 3.63 4.67 5.31 3.78 5.42 4.33 5.26 4.28 3.31 3.58 4.50 5.32 3.52 理智型B1 B1
25、0 B15 B20 B25 3.54 3.60 3.43 3.48 3.48 3.83 3.63 3.52 3.61 3.70 4.03 3.85 3.63 3.78 3.53 4.19 4.00 3.62 3.73 3.70 4.09 3.85 3.65 3.73 3.74 直觉型C2 C8 C11 C18 C23 2.91 2.79 3.29 2.90 3.34 2.94 2.99 3.39 3.08 3.46 3.05 2.88 3.34 3.27 3.36 3.00 2.90 3.54 3.21 3.46 2.98 2.97 3.46 3.30 3.45 依赖型D3 D7 D12 D1
26、7 D22 3.12 2.68 3.26 3.26 3.13 3.11 2.47 3.33 3.38 3.40 3.07 2.66 3.37 3.39 3.37 3.21 2.62 3.58 3.62 3.54 3.26 2.53 3.49 3.65 3.52 回避型E4 E6 E13 E16 E21 2.46 2.36 2.45 2.86 2.43 2.36 2.35 2.38 2.87 2.42 2.45 2.51 2.53 2.95 2.52 2.63 2.59 2.59 3.05 2.49 2.55 2.40 2.37 3.00 2.39 冲动型F5 F9 F14 F19 F24 2.
27、37 2.57 2.86 2.56 3.24 2.13 2.45 2.52 2.55 3.35 2.24 2.43 2.55 2.37 3.30 2.22 2.35 2.48 2.47 3.43 2.23 2.31 2.58 2.35 3.49 10.2 方差认知需求1 2 3 4 5 6 7 8 9 2.45 2.01 2.15 2.33 1.65 2.15 2.76 2.29 2.58 2.58 2.40 2.33 2.06 1.85 2.65 2.91 2.38 2.55 2.11 1.99 1.92 1.66 1.60 2.37 2.83 2.26 2.41 2.40 2.06 1.4
28、5 1.58 1.40 2.31 2.71 2.06 2.07 2.13 1.65 1.69 1.58 1.34 1.72 2.27 1.83 1.81 10 11 12 13 14 15 16 17 18 2.30 1.97 2.14 2.40 1.85 2.38 2.73 2.25 3.11 2.89 2.71 2.40 3.09 3.31 2.50 2.67 2.36 3.41 1.94 1.92 2.25 2.54 1.85 2.02 2.44 2.61 3.07 2.12 1.69 1.92 2.13 1.70 1.62 2.02 2.11 2.86 1.66 1.65 1.46 1
29、.88 1.48 1.74 1.90 1.68 2.47 理智型B1 B10 B15 B20 B25 1.35 1.23 1.03 1.23 1.15 1.21 1.34 1.19 1.17 1.11 1.00 0.98 0.90 0.97 0.98 1.03 0.89 0.87 0.99 0.85 0.94 0.95 0.77 0.84 0.81 直觉型C2 C8 C11 C18 C23 1.16 1.13 0.96 1.28 1.04 1.19 1.00 1.03 1.10 1.04 0.82 1.01 0.80 1.02 0.92 0.91 1.00 0.84 1.18 0.88 0.7
30、2 0.88 0.86 0.93 0.71 依赖型D3 D7 D12 D17 D22 1.25 1.36 1.14 1.13 1.28 1.26 1.27 1.14 1.13 1.09 0.95 1.10 1.07 1.02 1.04 0.93 1.26 0.80 0.92 0.89 0.81 1.24 0.77 0.79 0.76 回避型E4 E6 E13 E16 E21 1.30 1.16 1.04 1.36 1.35 1.31 1.24 1.33 1.46 1.35 1.22 1.19 0.94 1.00 1.25 1.35 1.30 1.10 1.07 1.20 1.00 0.97 0.84 1.04 0.99 冲动型F5 F9 F14 F19 F24 1.21 1.29 1.15 1.09 1.02 1.21 1.29 1.03 1.25 1.04 0.92 1.27 0.84 1.20 0.99 0.87 1.00 0.71 0.97 0.85 0.87 1.08 0.76 0.97 0.75 10.3 因子分析的解释总方差和碎石图11 岁组13 岁组15 岁组17 岁组