1、本科生毕业论文(设计)计划书题 目 数据挖掘在学生信息系统中的应用学生姓名 肖希杰 学 号 200717020324 专业班级 信息管理与信息系统 07103 班 指导老师 沙伯海 2010 年 11 月 8 日论文(设计)题目 数据挖掘在学生信息系统中的应用一、目标:1.1、根据计划书能完成毕业设计所需资料和要求。1.2、保障毕业设计有质量的按时完成。二、措施:2.1 充分利用本校图书馆和互联网的资源,查阅更多的相关专业知识。以获取毕业设计研究动态灵感。2.2 学习数据挖掘相关概念知识,为顺利完成论文编写打下基础。2.3 为完成合格的毕业设计,不能脱离学校,必须遵守学校的各种制度,按学校下达
2、有求完成各项任务。2.4 保持与指导老师的联系,多与指导老师交流各阶段任务。三、课题目的、意义及相关研究动态:1、课题目的:根据教育部提出的高等教育由精英化逐步转向大众化教育的思路,我国从 1999 年开始,大学本科生招生规模逐年扩大。由于学生人数的大幅增加给到校学生管理工作带来了诸多问题。学生管理者越来月感到管理的复杂性,对于学生的发展状态越来越难以预测。因此学生管理信息系统不能只满足于对海量数据进行简单第备份和查询,而应具备辅助决策的功能。为了解决这些问题,引用以数据挖掘技术为核心建立一套科学而完善的学生管理信息系统,从而进一步提高学生管理水平和管理效率。2、课题意义:数据挖掘是一门能够从
3、大量数据中发现有用知识的技术学科,是从大型数据库或数据仓库中提取隐含的,未知的,非平凡的极有潜在应用价值的信息或模式,是数据库研究中的一个很有应用价值的新领域,融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。利用这一技术,我们可以通过客观统计和分析, 从大量数据中发现潜在规律,找出隐含的模式,准确掌握未来的信息动态,将数据挖掘技术与教学管理相结合,建立完善的学生管理系统,从中提取出隐藏在数据之中的有用信息使学生信息系统的功能得到最大程度的利用并使之能在功能上更加满足学校教学和管理的需要.提高学生管理水平和加快学生管理专业化建设,同时为学校管理决策起到指导和辅助作用。3、相关研究
4、动态:数据挖掘和知识发现(Knowledge Discovery in Databases,KDD)正成为计算机科学于技术应用的一大研究热点。由美国人工智能所会主办的 KDD 国际研讨会已经烧开了 7 次,研究重点逐渐从发现方法转向系统应用。一些专题会议也把 KDD 列为会题之一,数据库、人工智能、信息处理、知识工程等领域的国际学术刊物也纷纷开辟 KDD 专题或专刊。Gartner Group 的一次高级技术调查结果显示, “未来 35 年内将对工业产生深远影响的 5 大关键技术”之首的是数据挖掘和人工智能, “未来 5 年内投资焦点的 10 大新兴技术”的前两位是并行处理体系和数据挖掘;麻省
5、理工学院的科技回顾公布“改变未来的 10 项新兴科技趋势”之一是数据挖掘;美国国家科学基金会的数据库研究项目中,KDD 被列为最有价值的项目。有利益就有市场,因此就,国内外的很多大型计算机公司都着力于研究数据挖掘系统。目前,国外比较有影响的典型数据挖掘系统有 SAS 公司的 Enterprise Miner、IBM 公司的Intelling Miner、SGI 公司的 MinerSet、SPSS 公司的 Clementine、RuleQuest Research 公司的 See5、还有 CoverStory、EXPLORA、KDW、DBMiner 和 Quest 等。四、课题的主要内容、创新之
6、处:1、主要内容:本课题的内容主要由 6 部分构成:第一章 绪论。简要的介绍课题提出的背景及研究意义、分析国内外的研究现状,并介绍本文的主要工作及结构安排;第二章 数据挖掘的概念。介绍数据挖掘的基本概念、数据挖掘的功能、数据挖掘的过程,数据挖掘的应用领域;第三章 数据挖掘的常用技术。着重介绍数据挖掘的关联规则和决策树两种技术;第四章 数据准备。第五章 数据挖掘 提出一个灵活使用面向招生就业的数据挖掘系统模型,介绍系统的主要功能,分析数据挖掘技术在系统中的应用;第六章 总结。对本论文做总结和展望。2、创新之处:本文从介绍数据挖掘技术产生的背景入手,阐述了数据挖掘的概念、功能、研究方向和挖掘步骤。
7、结合具体的项目-湖南文理学院招生就业数据挖掘系统,介绍了有关数据挖掘的原理及方法。以实际数据为依据,验证了算法的各种性能指标,并对实验结果进行分析,证明了算法的有效性。在第三章中,重点介绍了现有的关联规则挖掘算法 Apriori 算法指出了该算法的不足,提出了算法改进的理论基础,使得改进算法的速度得到提高;重点介绍了决策树分类算法ID3,指出了该算法的弊端在于算法往往偏向于选择属性取值较多的属性,而属性值较多的属性却不总是最有的属性。本文在研究了其他算法的基础上,提出了改进建华算法,该算法不仅克服了 ID3 的缺点,可以应用在大量的显示数据中,而且经实际证明该算法具有较高的效率、较强的实用性。
8、五、完成期限和预期进度:起始时间 结束时间 进度安排2010 年 10 月 10日2010 年 10 月 15 日 完成论文选题2010 年 10 月 16日2010 年 10 月 31 日 下达任务书2010 年 11 月 01日2010 年 11 月 07 日 收集数据挖掘相关资料2010 年 11 月 08日2010 年 11 月 15 日 了解数据挖掘的基本概念前期2010 年 11 月 16 2010 年 11 月 23 日 了解数据挖掘的常用技术日2010 年 11 月 24日2010 年 11 月 30 日 完成开题报告2010 年 12 月 01日2010 年 12 月 07
9、日 修改开题报告,熟悉外文资料2010 年 12 月 08日2010 年 12 月 28 日 熟悉数据挖掘基本概念2010 年 12 月 29日2011 年 01 月 15 日 熟悉 OLAP 相关知识2011 年 01 月 16日2010 年 01 月 31 日 熟悉 OLTP 相关知识2011 年 02 月 01日2011 年 02 月 15 日 熟悉并理解决策树技术2011 年 02 月 16日2011 年 02 月 21 日 熟悉并理解关联规则技术中期2011 年 02 月 22日2011 年 02 月 28 日 湖南文理学院招生就业系统数据收集2011 年 03 月 01日2011
10、年 03 月 07 日 论文写作提纲;论文写作指导2011 年 03 月 08日2011 年 05 月 14 日 论文修改、定稿、评阅后期2011 年 05 月 15日2011 年 05 月 23 日 论文答辩与成绩评定序号 输入 风险事件 可能性 影响 风险值 应对措施1 开题报告1、 不符合要求2、 不能按时完成60% 20% 12% 1、 在指导老师审核下反复修改2、 多花时间2 需求分析1、 不够全面2、 未能指出客户的核心需求60% 50% 30% 1、 多到网上去查找资料2、 多寻找相关客户交流3 系统设计1、 设计功能不够完善2、 模块区分不明确50% 50% 25% 1、 多寻
11、求老师的帮助2、 反复修改给老师审核4 数据设计1、 数据库设计不够合理,存在冗余2、 数据库设计不够全面50% 80% 40% 1、 找老师技术指导2、 在巩固数据库相关知识3、 重新分析需求分析5 模块功能实现1、 有些模块无法实现2、 编写代码工作量太大,无法按时完成40% 60% 24% 1、 寻求技术帮助2、 硬是不行,酌情删除功能3、 加班加点6 界面优化1、 不能完成理想的效果50% 20% 10% 1、 寻求技术指导2、 降低自己的要求7 测试 1、 电脑虚拟机测试通不过2、 手机测试失败50% 60% 30% 1、 重新检测程序的内存2、 修改部分算法,将重新偏向空间复杂度8
12、 论文 1、 论文无法正确描述系统功能2、 论文无法按时完成50% 50% 25% 1、 多修改,分步骤多次审核2、 花更多的时间9 答辩 1、 技术问题无法描述2、 研发问题无头绪20% 20% 40% 1、 多看一些专业文献2、 回顾本系统的需求主要参考文献资料:1 纪希禹.数据挖掘技术应用实例M. 北京:机械工业出版社 ,2009.4 2 刘玉文.数据挖掘在高校招生中的研究与应用D.上海师范大学,2008.33 陈显祥.基于学生综合测评系统数据挖掘应用研究D贵州大学,.2007.44 王志浩.数据挖掘在招生信息处理系统中的应用研究D山东师范大学,2006.45 马冰冰.学生信息管理与数据挖掘的应用D山东大学,2008.46 李庆香.数据挖掘技术在高校学生成绩分析中的应用研究D西南大学,2009.127 刘静. 数据挖掘技术在招生信息系统中的应用D北京工业大学,2006.28 彭松坡. 数据挖掘技术在高校就业管理系统中的应用研究D浙江工业大学,2006.49 赵辉. 数据挖掘技术在学生成绩分析中的研究及应用D大连海事大学,2007.3会议记录摘要:会议主持人:记 录 人:2010 年 11 月 20 日