1、统计软件教学大纲英文名称:Statistical Software课程编号:91114107学分/总学时:2/36(其中课堂:0 学时;课内实验:36 学时)先修课程:统计学、概率统计授课对象:统计学、应用统计学、经济统计学、信用管理专业学生一、教学性质与目的:统计软件是在学习统计学、专业课理论基础上的一门利用各种统计软件讲解完整数据分析过程的综合课程。主要从多个实际案例的分析需求出发,讲解各类方法的综合运用和实战操作,案例涉及到的有复杂数据的处理过程,市场研究、电信、金融、互联网等多个行业完整的数据分析实战,涉及到的软件有 SPSS、JMP、R 语言或 SAS 等国际流行统计分析软件。旨在使
2、学生对目前众多统计软件有更多的认识和了解,以便选择自己适用的统计软件,进一步学习掌握利用软件解决实际问题完整的过程,达到理论和实践的统一。二、教学内容与要求:第一章 案例 1事实型和量表型问卷(22 学时)【基本内容】1. 数据清理2. 事实型问卷分析思路及方法3. 量表型问卷分析信度分析和效度分析4. 量表型问卷分析思路及方法5. 二元 logistic 回归6. 多元 logistic 回归7有序 logistic 回归8. 多重对应分析9. 分类变量的聚类分析【基本要求】1. 综合掌握数据的整理和清理2. 掌握分类变量的基本分析方法:频数分析和交叉列联表分析3. 掌握卡方检验和 fish
3、er 精确检验4. 掌握量表的信度分析和效度分析5. 掌握独立样本 t 检验和单因素方差分析6. 熟练掌握二元 logistic 回归分析7. 了解多项 logistic 回归8. 理解有序 logistic 回归及模型假设9. 掌握多选题方式的应用和转化10.掌握对应分析、多重对应分析11.掌握非类变量的聚类分析【重点及难点】重点:事实型和量表型问卷分析思路,卡方检验和 fisher 精确检验的使用条件,量表的信度分析和效度分析,二元 logistic 回归,有序 logistic 回归及模型假设,多选题编码方式的应用和转化,对多个分类型变量的深入市场细分的分析方法:多重对应和两步聚类难点:
4、有序 logistic 回归及模型假设,多重对应,两步聚类【教学活动与教学方式】本部分将采用两个市场调查问卷数据来贯穿讲解事实型问卷和量表型问卷的分析思路和所用到的统计方法,并最终形成报告。具体根据研究目的分解,采用任务式教学方式,先让学生分组讨论分析思路,再在教师的启发指导下修正方案,同时通过上机实现方案,写出分析报告。第二章 JMP(6 学时)【基本内容】1. 数据处理2. 基本分析功能3. JMP 交互式制图4. 制作中国地图5. 加载各省地级市 shape 文件和制造地级市地图【基本要求】1. 了解 JMP 数据录入2. 掌握与其他数据格式的转化3. 掌握用 JMP 处理博物馆数据4.
5、 掌握用 JMP 制作中国地图5. 掌握以及各省的地级市 shape 文件加载和制造地图【重点及难点】重点:用 JMP 数据处理、制作中国地图、以及各省的地级市地图难点:各省的地级市地图的加载【教学活动与教学方式】本章内容主要是以讲授和软件演示为主,结合上机课让学生自行讨论 JMP 的应用。第三章 R 语言编程(8 学时)【基本内容】1. R 语言创建数据集2. 读取各种格式数据3. 角谷猜想的实现4. 数据汇总5. 统计计算与基本统计分析6. 数据可视化【基本要求】1. 掌握数据集的创建;2. 熟练掌握 excel、文本格式的读取、网络表格数据的基本抓取3. 掌握条件、循环语句的应用;4.
6、掌握定义自己的基本统计分析编程。5. 掌握基础包和 ggplot2 包的可视化功能【重点及难点】重点:利用条件、循环语句和向量化函数编写自己的程序,定义自己的基本统计分析编程,ggplot2 包的可视化功能难点:利用条件、循环语句和向量化函数编写自己的程序【教学活动与教学方式】根据本章内容的特点采用学生先分组讨论,自行编写任务程序,再在教师的指导下修改自己的程序,以便让学生更好地学习编程语言。三、学时分配教学内容 讲课学时 课内实验学时第 1 章:案例一:事实型问卷 0 6第 1 章:案例二:量表型问卷 0 6第 1 章:logistic 回归 0 6第 1 章:深入市场细分 0 4第 2 章
7、:JMP 分析 0 6第 3 章:R 语言编程 0 8四、考核方式本课程所采用或建议使用的考核方法是开卷考试;平时成绩占 30%,期末考试占 70%五、教材与主要参考资(二)参考教材1.SPSS 统计分析基础教程、SPSS 统计分析高级教程(第二版),张文彤主编,高等教育出版社,2013 年版2.JMP 使用指南,SAS Institute Inc., SAS Institute publishing,20123.统计建模与 R 语言,薛毅 陈立萍编著,清华大学出版社,2009 年4.R 语言实战(第 2 版),Robert I.Kabacoff 著,高涛等译,人民邮电出版社,2016 年5.
8、SAS 编程技术教程,朱世武主编,清华大学出版社,2007 版六、实验项目设置与内容序号 实验项目名称 内容提要 学时 性质 要求1 事实型问卷案例 问卷研究思路与方法 6 综 合 性 必做2 量表型问卷案例 问卷研究思路与方法 6 综 合 性 必做3 logistic 回归 因变量为分类变量的回归 6 验 证 性 必做4 深入市场细分 多重对应分析 4 验 证 性 必做5 JMP 分析 JMP 文件建立与管理 2 验 证 性 必做6 JMP 可视化 制作河南省地级市地图 4 验 证 性 必做6 R 语言读取数据和基本管理外部不同格式数据读取、编写自己的函数 4 验 证 性 必做7 R 可视化 ggplot2 包的可视化作图 4 验 证 性 必做注 : 项 目 性 质 : 演 示 性 、 验 证 性 、 综 合 性 、 设 计 研 究 性 、 其 他 等项 目 要 求 : 必 做 、 选 做 、 其 他 等编写人: 审定人: 批准人: 2017 年 4 月 20 日