收藏 分享(赏)

数据分析课程设计 - NBA球员技术统计分析报告.doc

上传人:精品资料 文档编号:10415779 上传时间:2019-11-08 格式:DOC 页数:20 大小:184.46KB
下载 相关 举报
数据分析课程设计 - NBA球员技术统计分析报告.doc_第1页
第1页 / 共20页
数据分析课程设计 - NBA球员技术统计分析报告.doc_第2页
第2页 / 共20页
数据分析课程设计 - NBA球员技术统计分析报告.doc_第3页
第3页 / 共20页
数据分析课程设计 - NBA球员技术统计分析报告.doc_第4页
第4页 / 共20页
数据分析课程设计 - NBA球员技术统计分析报告.doc_第5页
第5页 / 共20页
点击查看更多>>
资源描述

1、数据分析方法课程设计成 绩 评 定 表学生姓名 严震 班级学号 1109010114专 业 信息与计算科学课程设计题目 NBA 球员技术统计分析报告评语 组长签字:成绩日期20 年 月 日数据分析方法课程设计课程设计任务书学 院 理学院 专 业 信息与计算科学学生姓名 严震 班级学号 1109010114课程设计题目 NBA 球员技术统计分析报告实践教学要求与任务:设计要求(技术参数):1、熟练掌握 SPSS 软件的操作方法;2、根据所选题目及调研所得数据,运用数据分析知识,建立适当的数学模型;3、运用 SPSS 软件,对模型进行求解,对结果进行分析并得出结论; 4、掌握利用数据分析理论知识解

2、决实际问题的一般步骤。设计任务:1、查阅相关资料,找到 NBA 球员技术的相关指标,获得相关数据;2、利用数据分析的理论,建立线性回归模型,以及对其进行主成分分析;3、利用 SPSS 软件求解,并给出正确的结论。工作计划与进度安排:第一天第二天 学习使用 SPSS 软件并选题 第三天第四天 查阅资料 第五天第六天 建立数学模型 第七天第九天 上机求解并完成论文第十天 答辩指导教师:201 年 月 日专业负责人:201 年 月 日学院教学副院长:201 年 月 日数据分析方法课程设计I摘 要数据分析析的主要应用有两方面,一是寻求基本结构,简化观测系统,将具有错综复杂关系的对象(变量或样品)综合为

3、少数几个因子(不可观测的,相互独立的随机变量) ,以再现因子与原变量之间的内在联系;二是用于分类,对 个变量或 个样pn品进行分类。聚类分析一般有两种类型,即按样品聚类或按变量(指标)聚类,其基本思想是通过定义样品或变量间“接近程度”的度量,将“相近”的样品或变量归为一类。本文利用利用数据分析中的因子分析和聚类分析对多个变量数据进行了分析。就是分析和处理数据的理论与方法,数据分析中提出了广泛的多元数据分析的统计方法,包括线性回归分析、方差分析、因子分析、主成分分析、典型相关分析、判别分析、聚类分析等。关键词:spss 软件;聚类分析;因子分析;线性规划数据分析方法课程设计II目 录1 数据分析

4、的任务和目的 .11.1 问题的背景 .11.2 任务和目的 .12 数据的搜集与整理 22.1 数据的来源 .22.2 数据的处理 .23 利用 SPSS 软件对结果进行分析 .3总 结 13参考文献 .14数据分析方法课程设计01 数据分析的任务和目的1.1 问题的背景一年一度的 NBA 赛季让全世界的篮球迷为之疯狂,NBA 赛事之所以如此受欢迎,最主要的原因在于 NBA 球员高超的球技。球队中灵魂人物的个人发挥能够直接影响其球队的成败。因而对他们的技术统计与分析是一件十分重要的事情。众所周知,科比-布莱恩特和阿伦-艾弗森是深受大家喜爱的两位球员,两位球员在赛季的发挥也在一定程度上影响着两

5、队的战绩。因此,通过两位球员在以往的赛季中的发挥及表现,可以大概的预测两人的得分及表现,为 NBA相关的商业活动和广大球迷提供数据上的参考。1.2 任务和目的1、频数分析(对两人平均每场上场时间进行频数分析)2、基本描述统计量(用基本描述统计量的计算结果对两人技术进行分析比较)3、单样本 t 检验(检验科比-布莱恩特和阿伦-艾弗森平均每场犯规次数的均值是否为 2.7)4、两独立样本 t 检验(科比-布莱恩特和阿伦-艾弗森平均每场犯规次数比较)5、 单样本非参数假设检验(检验科比-布莱恩特平均每场进攻次数与首发的关系基本是否为 1:1:10:10:10:10:10:10:10:10:2)6、单样

6、本非参数假设检验(检验科比-布莱恩特和阿伦-艾弗森平均每场盖帽次数总体的分布是否为正态分布)7、 单样本非参数假设检验(检验科比-布莱恩特在某段时间内平均每场得分是否持续正常)8、单因素方差分析(用单因素方差分析,分别分析科比-布莱恩特和阿伦-艾弗森平均每场防守次数对平均每场得分有无显著影响)数据分析方法课程设计19、相关分析(研究平均每场三分球命中率与平均每场得分之间是否具有较强的线性关系)10、偏相关分析(以平均每场失误次数为控制变量,研究平均每场罚球命中率与平均每场得分的偏相关关系)11、线性回归分析(用逐步筛选法找科比-布莱恩特的平均每场得分的线性回归方程)12、曲线回归分析(用曲线回

7、归分析法分析科比-布莱恩特的平均每场得分)数据分析方法课程设计22 数据的搜集与整理2.1 数据的来源NBA 球员科比-布莱恩特和阿伦-艾弗森 11 个赛季技术统计表下载自 NBA中文官方网站 ,具有可信度。2.2 数据的处理定义视图数据分析方法课程设计3数据视图:数据分析方法课程设计43 利用 SPSS 软件对结果进行分析(1)频数分析(对两人平均每场上场时间进行频数分析)数据文件中增加一个变量 scsj。NBA上 上 * 上 上 上 上 上 上 上 CrosstabulationCount1 10 117 4 118 14 22三 三 -三 三 三三 三 -三 三 三 三NBA三 三Tot

8、al1 2三 三 三 三 三 三 三Total输出 1Chi-Square Tests7.071b 1 .0084.911 1 .0277.719 1 .005.024 .01222Pearson Chi-SquareContinuity CorrectionaLikelihood RatioFishers Exact TestN of Valid CasesValue df Asymp. Sig.(2-sided) Exact Sig.(2-sided) Exact Sig.(1-sided)Computed only for a 2x2 tablea. 2 cells (50.0%) ha

9、ve expected count less than 5. The minimum expected countis 4.00.b. 输出2分析:从输出 1 中看出,阿伦-艾弗森平均每场上场时间在 10-40(分钟)的频数为1,在 40-50(分钟)的频数为 10;科比-布莱恩特平均每场上场时间在 10-40(分钟)的频数为 7,在 40-50(分钟)的频数为 4;两人平均每场上场时间在 10-40(分钟)的频数为 8,在 40-50(分钟)的频数为 14。从输出 2 中看出,交叉分组下的频数分析卡方检验结果的相伴概率为 0.008,小于显著性水平 0.05,故拒绝原假设,认为两人的平均每场

10、上场时间存在显著性差异。(2) 基本描述统计量(用基本描述统计量的计算结果对两人技术进行分析比较)实现按 NBA 球员拆分,输出结果放在同一张表中。数据分析方法课程设计5Descriptive Statistics11 .4170 .449364 .005401 .0179124 -.580 .66111 .2500 .324636 .012164 .0403442 -.503 .66111 .7940 .831909 .005513 .0182836 -.736 .6611111 .3870 .419636 .006128 .0203237 .666 .66111 .2340 .300909

11、 .009339 .0309724 -.706 .66111 .7020 .778818 .016848 .0558799 .248 .66111三 三 三 三 三 三 三 三 三三 三 三 三 三 三 三 三 三 三三 三 三 三 三 三 三 三 三Valid N (listwise)三 三 三 三 三 三 三 三 三三 三 三 三 三 三 三 三 三 三三 三 三 三 三 三 三 三 三Valid N (listwise)NBA三 三三 三 -三 三 三 三三 三 -三 三 三Statistic Statistic Statistic Std. Error Statistic Statis

12、tic Std. ErrorN Minimum Mean Std.Deviation Skewness输出3分析:从输出 3 中看出,科比-布莱恩特的平均每场投篮命中率、平均每场三分球命中率和平均每场罚球命中率的均值均比阿伦-艾弗森高,但标准差有高有底,说明在投篮方面科比-布莱恩特比阿伦-艾弗森发挥出色,但稳定程度高低不定。均值的统计误差均小于 0.05(比较小) ,说明数据没有不均衡现象,说明两人的发挥都比较稳定。(3) 单样本 t 检验(检验科比-布莱恩特和阿伦-艾弗森平均每场犯规次数的均值是否为 2.7)实现按 NBA 球员拆分,输出结果放在同一张表中。One-Sample Test-4

13、.799 10 .001 -.6818 -.9984 -.3652.297 10 .773 .0473 -.3079 .4025三 三 三 三 三 三 三 三三 三 三 三 三 三 三 三NBA三 三三 三 -三 三 三三 三 -三 三 三 三t df Sig. (2-tailed) MeanDifference Lower Upper95% ConfidenceInterval of theDifferenceTest Value = 2.7输出4分析:从输出 4 中得,阿伦-艾弗森单样本假设的相伴概率为 0.001,小于显著性水平 0.05,故拒绝原假设,认为阿伦-艾弗森平均每场犯规次数的

14、均值与 2.7 有显著性差异;科比-布莱恩特单样本假设的相伴概率为 0.773,大于显著性水平0.05,故接受原假设,认为科比-布莱恩特平均每场犯规次数的均值与 2.7 无显著性差异。(4) 两独立样本t检验(科比-布莱恩特和阿伦-艾弗森平均每场犯规次数比较)数据分析方法课程设计6Independent Samples Test.019 .893 3.414 20 .003 .7291 .21355 .28363 1.174553.414 19.740 .003 .7291 .21355 .28326 1.17492Equal variances assumedEqual variances

15、notassumed三 三 三 三 三 三 三 三F Sig.Levenes Test forEquality of Variancest df Sig. (2-tailed) MeanDifference Std. ErrorDifference Lower Upper95% ConfidenceInterval of theDifferencet-test for Equality of Means输出5分析:从输出 5 中看出,两独立样本 F 检验结果的相伴概率为 0.019,小于显著性水平 0.05,故拒绝原假设,认为阿伦-艾弗森与科比-布莱恩特平均每场犯规次数的方差有显著性差异;两独

16、立样本 t 检验结果的相伴概率为 0.003,小于显著性水平 0.05,故拒绝原假设,认为阿伦-艾弗森与科比-布莱恩特平均每场犯规次数的均值有显著性差异。(5)单样本非参数假设检验(检验科比-布莱恩特平均每场进攻次数与首发的关系基本是否为 1:1:10:10:10:10:10:10:10:10:2)上 上1 .1 .91 1.2 -.21 1.2 -.21 1.2 -.21 1.2 -.21 1.2 -.21 1.2 -.21 1.2 -.21 1.2 -.21 1.2 -.21 .2 .8111234567891011TotalObserved N Expected N Residual输出

17、6Test Statistics9.29110.505Chi-SquareadfAsymp. Sig.三 三11 cells (100.0%) have expected frequencies lessthan 5. The minimum expected cell frequency is .1.a. 数据分析方法课程设计7输出7分析:从输出 7 中看出,非参数假设检验卡方分布的相伴概率为 0.505,大于显著性水平 0.05,故接受假设,认为样本来自的总体分布与理论分布无显著差异,即科比- 布莱恩特与首发的关系基本是为1:1:10:10:10:10:10:10:10:10:2。(6)

18、单样本非参数假设检验(检验科比-布莱恩特和阿伦 -艾弗森平均每场盖帽次数总体的分布是否为正态分布)实现按 NBA 球员拆分,输出结果放在同一张表中。One-Sample Kolmogorov-Smirnov Test11.5855.27145.159.159-.149.526.94511.1773.09111.212.212-.143.702.709NMeanStd. DeviationNormal Parametersa,bAbsolutePositiveNegativeMost ExtremeDifferencesKolmogorov-Smirnov ZAsymp. Sig. (2-tai

19、led)NMeanStd. DeviationNormal Parametersa,bAbsolutePositiveNegativeMost ExtremeDifferencesKolmogorov-Smirnov ZAsymp. Sig. (2-tailed)NBA三 三三 三 -三 三 三 三三 三 -三 三 三三 三 三 三三 三 三 三Test distribution is Normal.a. Calculated from data.b. 输出8分析:从输出8看出,科比-布莱恩特的平均每场盖帽次数非参数检验结果的相伴概率为0.945,大于显著性水平0.05,故接受原假设,认为科比

20、-布莱恩特的平均每场盖帽次数服从正态分布;阿伦-艾弗森的平均每场盖帽次数非参数检验结果的相伴概率为0.709,大于显著性水平0.05,故接受原假设,认为科比-布莱恩特的平均每场盖帽次数服从正态分布。(7)单样本非参数假设检验(检验科比-布莱恩特在某段时间内平均每场得分是数据分析方法课程设计8否持续正常)Runs Test24.156114-1.254.210Test ValueaCases = Test ValueTotal CasesNumber of RunsZAsymp. Sig. (2-tailed)三 三 三三 三 三Mediana. 输出9分析:从输出9看出,随机性检验结果的相伴概

21、率为0.210,大于显著性水平0.05,故接受假设,认为科比-布莱恩特平均每场得分是随机的。(8)单因素方差分析(用单因素方差分析,分别分析科比-布莱恩特和阿伦-艾弗森平均每场防守次数对平均每场得分有无显著影响)ANOVA三 三 三 三 三 三415.614 4 103.903 4.280 .056145.673 6 24.279561.287 1011.128 1 11.128 .873 .374114.668 9 12.741125.796 10Between GroupsWithin GroupsTotalBetween GroupsWithin GroupsTotalNBA三 三三 三

22、 -三 三 三 三三 三 -三 三 三Sum ofSquares df Mean Square F Sig.输出10分析:从输出10中看出,科比-布莱恩特单因素方差分析结果的相伴概率为0.056,大于显著性水平0.05,故接受假设,认为科比-布莱恩特的平均每场防守次数对平均每场得分无显著影响;阿伦-艾弗森单因素方差分析结果的相伴概率为0.374,大于显著性水平0.05,故接受假设,认为科比-布莱恩特的平均每场防守次数对平均每场得分无显著影响。数据分析方法课程设计9(9)相关分析(研究平均每场三分球命中率与平均每场得分之间是否具有较强的线性关系).40.38.36.34.32.30.28.26.

23、24.22403020100输出11Correlations1 -.218. .32922 22-.218 1.329 .22 22Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N三 三 三 三 三 三三 三 三 三 三 三 三 三 三 三三 三 三三 三 三 三 三 三 三 三三 三 三 三 三输出12分析:从输出11中看出,平均每场三分球命中率与平均每场得分之间不具有较强的线性关系;从输出12中看出,相关分析的相伴概率为0.329,大于显著性水平0.05,故接受原假设,认为平均每场三分球命中率与平均

24、每场得分之间不具有较强的线性关系。两种方法得到结果一致。数据分析方法课程设计10(10) 偏相关分析(以平均每场失误次数为控制变量,研究平均每场罚球命中率与平均每场得分的偏相关关系)- - - P A R T I A L C O R R E L A T I O N C O E F F I C I E N T S - - -Controlling for V15V17 V9V17 1.0000 .3626( 0) ( 19)P= . P= .106V9 .3626 1.0000( 19) ( 0)P= .106 P= .(Coefficient / (D.F.) / 2-tailed Signi

25、ficance)“ . “ is printed if a coefficient cannot be computed输出13分析:从输出 13 中看出,偏相关分析结果的相伴概率为 0.106,大于显著性水平0.05,故接受假设,认为以平均每场失误次数为控制变量,平均每场罚球命中率与平均每场得分的偏相关关系不显著。(11) 线性回归分析(用逐步筛选法找科比-布莱恩特的平均每场得分的线性回归方程)Variables Entered/Removeda三 三 三 三三 三 三 三 .Stepwise(Criteria:Probability-of-F-to-enter =.100).Model1V

26、ariablesEntered VariablesRemoved MethodDependent Variable: 三 三 三 三 三 三a. 输出14数据分析方法课程设计11Model Summary.901a .813 .792 3.4196Model1R R Square AdjustedR Square Std. Error ofthe EstimatePredictors: (Constant), 三 三 三 三 三 三 三 三a. 输出15ANOVAb456.047 1 456.047 39.000 .000a105.240 9 11.693561.287 10Regressio

27、nResidualTotalModel1Sum ofSquares df Mean Square F Sig.Predictors: (Constant), 三 三 三 三 三 三 三 三a. Dependent Variable: 三 三 三 三 三 三b. 输出16Coefficientsa-6.612 4.955 -1.334 .215.839 .134 .901 6.245 .000(Constant)三 三 三 三 三 三 三 三Model1 B Std. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientst Sig

28、.Dependent Variable: 三 三 三 三 三 三a. 输出17Excluded Variablesb.267a 1.395 .200 .442 .515-.267a -1.376 .206 -.438 .504.255a 1.880 .097 .554 .885.132a .725 .489 .248 .668-.162a -.930 .380 -.312 .701-.066a -.140 .892 -.049 .106-.066a -.169 .870 -.060 .154.301a 1.216 .259 .395 .324-.200a -1.365 .209 -.435 .

29、886-.031a -.103 .921 -.036 .256-.433a -1.626 .143 -.498 .248三 三三 三 三 三 三 三 三 三 三三 三 三 三 三 三 三 三 三 三三 三 三 三 三 三 三 三 三三 三 三 三 三 三 三 三三 三 三 三 三 三 三 三三 三 三 三 三 三 三 三三 三 三 三 三 三 三 三三 三 三 三 三 三 三 三三 三 三 三 三 三 三 三三 三 三 三 三 三 三 三Model1 Beta In t Sig. PartialCorrelation ToleranceCollinearityStatisticsPredict

30、ors in the Model: (Constant), 三 三 三 三 三 三 三 三a. Dependent Variable: 三 三 三 三 三 三b. 输出18分析:从输出14中看出,本次多元分析回归分析采用的是逐步筛选法,且回归系数显著性F检验的相伴概率值小于0.05的自变量引入了回归方程,大于0.1的自变数据分析方法课程设计12量剔除了回归方程。自变量进入回归方程的次序是:平均每场上场时间。从输出18中看出,科比 -布莱恩特的平均每场得分的最终线性回归方程为平均每场得分=0.839* 平均每场上场时间+6.612 。(12)曲线回归分析(用曲线回归分析法分析科比-布莱恩特的平均

31、每场得分)MODEL: MOD_1._Independent: V7Dependent Mth Rsq d.f. F Sigf b0 b1 b2 b3V17 LIN .250 9 3.00 .117 -70.332 209.155V17 QUA .770 8 13.43 .003 -4386.5 19633.2 -218199 V17 CUB .771 8 13.45 .003 -2962.2 9973.17 -16414Notes:9 Tolerance limits reached; some dependent variables were not entered.输出19.47.46.

32、45.44.43.42.41403020100ObservedLinearQuadraticCubic输出20数据分析方法课程设计13分析:从输出19中看出,线性模型的相伴概率为0.117,大于显著性水平0.05,故接受原假设,认为线性模型的方程不显著;二次曲线与三次曲线的相伴概率均为0.003,小于显著性水平0.05,故拒绝原假设,认为线性模型的方程显著;且三次的曲线拟合度最高,因此选定三次曲线模型。具体模型是:平均每场得分= -2962.2+ 9973.17*平均每场投篮命中率 -16414*平均每场投篮命中率3 数据分析方法课程设计14总 结经过这次的大作业的锻炼,是我对这学期所学到的数

33、据分析方法和对 SPSS的操作有了更加深刻的理解和认识,在课设的过程中不断有问题出现,又不断地查资料或请教老师同学的情况下,终于对 SPSS 有了进一步的了解。这份作业以深受大家喜爱的 N 球星的技术分析为例 , 探讨了如何用统计软件 SPSS 对原始数据进行科学的统计分析。虽然完成了此次课程设计,但是我深刻地感觉到数据分析在现实生活中的重要作用,并且认识到以前学到的东西还是非常浅显的,还要在以后的学习过程中注意多思考、多应用。在此还要特别感谢马建军老师的指导,是我学会了一些科学的数据分析方法。数据分析方法课程设计15参考文献1.SPSS 17.0 中文版常用功能与应用实例精讲 ,电子工业出版社2.数据统计与分析技术SPSS 软件实用教程 ,高等教育出版社

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报