收藏 分享(赏)

SPSS在犯罪学研究中的应用——以刑事发案率的多元线性回归为例(1).docx

上传人:微传9988 文档编号:2157085 上传时间:2018-09-02 格式:DOCX 页数:15 大小:19.89KB
下载 相关 举报
SPSS在犯罪学研究中的应用——以刑事发案率的多元线性回归为例(1).docx_第1页
第1页 / 共15页
SPSS在犯罪学研究中的应用——以刑事发案率的多元线性回归为例(1).docx_第2页
第2页 / 共15页
SPSS在犯罪学研究中的应用——以刑事发案率的多元线性回归为例(1).docx_第3页
第3页 / 共15页
SPSS在犯罪学研究中的应用——以刑事发案率的多元线性回归为例(1).docx_第4页
第4页 / 共15页
SPSS在犯罪学研究中的应用——以刑事发案率的多元线性回归为例(1).docx_第5页
第5页 / 共15页
点击查看更多>>
资源描述

1、SPSS 在犯罪学研究中的应用以刑事发案率的多元线性回归为例(1)导 言在犯罪与罪犯研究领域,常常会遇到彼此有关系的两列或多列变量。对于这些变量之间的关系,可以根据不同的研究目的,从不同的角度去分析。如果要分析变量之间关系的强度,我们可以采用相关分析的方法,但是,如果要确定变量之间所可能具有的数量关系,并将这种形式表示为某个数学模型,就需要用回归分析。回归分析应用非常广泛。在犯罪学领域,如果建立了变量之间的数学模型,实际上就是确立了变量之间的关系模型,从而可以从某些变量的变化来预测其他变量的变化情况。例如,我国台湾学者杨家騄建立了物价指数与盗窃犯罪案件之间的数学模型,从而依据某年度的物价指数来

2、预测该年度的盗窃案件数量;1我国学者高树桥等在犯罪人的受教育年限与犯罪次数之间建立了数学模型,根据某犯罪人的教育年限,我们就可以预测其可能的犯罪次数。2但是,由于犯罪现象是一种非常复杂的社会现象,往往牵扯到多个变量之间的关系问题。因此在回归分析中常常需要分析两个及两个以上的自变量,分析变量之间的关系,推导出含有多个自变量的函数,这种方法就是多元回归分析。多元回归分析要比一元回归分析更为科学,这是由事物的复杂性决定的。例如,盗窃案件的数量不单与价格指数有关,还受其他一系列因素的影响,国外有学者甚至研究了防盗门的销售量与盗窃案件的关系。可见,当我们研究某一个犯罪问题时,多元回归分析更为准确和有效。

3、多元回归自变量的个数很多,计算相当繁琐,一般手工计算几乎不大可能,我们可以借助 SPSS 来满足计算要求。一、多元线性回归分析方法多元线性回归的数学模型为:其中,为应变量;为 p 个自变量。为常数项,称为偏回归系数;为随机误差,又称残差,它是的变化中不能用自变量解释的部分,服从)分布。多元线性回归分析的前提条件是:线性、独立、正态和等方差,在进行回归分析时,应当首先进行这些假设检验。还有一个重要问题就是如何选择自变量。实际上,模型中包含的自变量是无法事先确定的,如果把一些不重要的或者对应变量影响很弱的变量引入模型,则会降低模型的精度。所以自变量的选择是必要的,基本思路是:尽可能将对应变量影响大

4、的自变量选入回归方程中,并尽可能将对应变量影响小的自变量排除在外,这样才能建立最优方程。这里就涉及到筛选自变量的方法,现在比较常用的是逐步回归法。这种方法的特点在于,每引入一个自变量,都会对已在方程中的变量进行检验,对符合剔除标准的变量要逐一剔除。另外,在进行多元线性回归分析中,由于自变量之间还可能具有高度相关关系,导致所建立的模型的解释力受到削弱,因此,还要对模型进行多重共线性检验,最后计算出相对更优的数学模型。二、对刑事发案率的多元线性回归分析刑事发案率的影响因素很多,有经济、政治、文化等社会因素,也有个体性因素,所涉及的变量相当复杂,创建一个完全周延的数学模型几乎是不可能的。鉴于本文主要

5、是介绍 SPSS 在犯罪学研究中的意义,同时也为了深化法律发展报告中关于犯罪率与社会发展指标的研究,因此在社会指标的选择上,仍然参照报告所采用的指标,包括人均 GDP、受教育状况、城市化和基尼系数。 报告中只是计算了这四项指标与刑事发案率的相关系数3,如果要确定他们之间的数量关系,就需要建立数学模型,进行回归分析。表 SEQ 表*ARABIC1 刑事发案率与其他社会指标统计表年份刑事发案率人均 GDP受教育状况城市化基尼系数1992199319941995394241996199719981999XXXXXX642XX341数据来源:朱景文, 中国法律发展报告 ,中国人民大学出版社,XX;中国

6、统计年鉴(1993-XX) 。其中,刑事发案率是指每 10 万人口的(公安机关)立案数量;GDP 按照人均国内生产总值指数计算,1978 年为 100;城市化按照城镇人口占总人口的比例计算;受教育状况按照每100000 人口大学生数量计算;4.基尼系数是笔者根据中国统计年鉴中的收入分组数据计算得出。首先绘制散点图(见图 1) ,判断这四个变量对刑事发案率有无影响,借助的是 SPSS 软件中的多元线性回归分析,使用 Stepwise 法来进行判断。图 SEQ 图*ARABIC1 发案率对学生化残差的散点图图中观察点学生化残差的绝对值均小于 2,也没有发现极端点,这表明人均 GDP、城市化、受教育

7、水平和基尼系数对刑事发案率均有影响,该回归模型符合假设,无需重新拟合。其次,对 SPSS 生成的结果进行解释。首先看模型的筛选过程(见表 2) ,模型 1 用逐步法选入了城市化,然后模型 2 用逐步法选入了人均 GDP,城市化仍在模型 2 中;模型3 用逐步法选入了基尼系数,城市化、人均 GDP 扔在模型 3中;模型 4 用逐步法选入了教育状况,城市化、人均 GDP、基尼系数仍在模型 4 中。表 SEQ 表*ARABIC2 模型的筛选过程VariablesEntered/RemovedModelVariablesEnteredVariablesRemovedMethod1城市化.Stepwis

8、e.2人均 GDP.Stepwise.3基尼系数.Stepwise.4教育状况.Stepwise.a DependentVariable:发案率表 3 是拟合的四个模型决定系数的变化情况,从调整的决定系数来看,随着人均 GDP、基尼系数、教育状况等变量的载入,模型 4 可解释的变异占总变异比例比模型1、2、3 均高,但是,高出的数值有限。表 SEQ 表*ARABIC3 拟合的四个模型决定系数的改变情况表 4 是对拟合的 4 个模型的方差分析检验结果。由结果可知,四个模型都有统计学意义。但是,模型有统计学意义不等于模型内所有的变量都有统计学意义。还需要进一步对各自变量进行检验。表 SEQ 表*A

9、RABIC4 对拟合的 4 个模型的方差分析检验结果ModelSumofSquaresDfMeanSquareFSig.1Regression1.000Residual2471Total24722Regression2.000Residual2470Total24723Regression3.000Residual2469Total24724Regression4.000Residual2468Total2472a Predictors:,城市化b Predictors:,城市化,人均 GDPc Predictors:,城市化,人均 GDP,基尼系数d Predictors:,城市化,人均 G

10、DP,基尼系数,教育状况e DependentVariable:发案率表 5 是对 4 个模型中各个系数检验的结果,用的是 t检验。从结果可以看出,模型 4 中四个变量的系数都有统计学意义。城市化的偏回归系数为,标准化回归系数为;人均 GDP 偏回归系数为-,标准化回归系数为-;基尼系数的偏回归系数为,标准化回归系数为;教育状况的偏回归系数为-,标准化回归系数为-通过比较这四个变量的标准化回归系数的绝对值,可以将这四个变量对发案率的贡献度进行排序,依次是城市化、人均 GDP、基尼系数和教育状况。表 SEQ 表*ARABIC5 对 4 个模型中各个系数的检验结果(作者:未知本文来源于爬虫自动抓取,如有侵犯权益请联系 service立即删除)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 学术论文 > 大学论文

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报