1、1摘 要目前社会中普遍存在三种社会现象:第一种是大学生厌学现象;第二种是考研跨专业现象;第三种是毕业就转行现象。针对这三种现象的存在,北京市教育科学研究院对全国的在校大学生进行了一次抽样调查,调查的结果很让人震惊。调查结果显示,有42.1%的大学生对自己的专业不满意,更有 65.5%的大学生希望能够重新选择自己的专业。面对过半的大学生对自己的专业选择产生疑惑,我们的教育工作者需要重新审视高考志愿填报,每年全国高考考生已达到 1000 万,而 1000 万考生和考生家长面对的是全国具有高等教育招生资格的院校 2000 多所,400 多个标准专业。大量的院校信息、专业信息、就业信息、历史录取分数等
2、让考生和家长无从下手本系统采用知网实现更为科学的中文匹配,让考生轻松的找到想要的学校与专业。通过对 09-13 年高考数据的分析,让考生能够更有把握的报上自己想要的学校与专业。减少了部分考生因为对之前状况不了解而造成的悲剧。关键词 知网;高考;志愿填报2AbstractTwenty-first Century is the new era of rapid development of the Internet,Electronic commerce has broken through the traditional business model,Electronic business se
3、rvice will be the core of the business serveice,business infrastructure and the modern services.With the technology of the Internet,this system is based on the background of Zhenmingli E-commerce group,combining the real need of transformation and upgrading of Jiangmen city. basing on the B/S struct
4、ure,it use the J2EE framework to develop a E-commerce platform for LED lighting products all over the world,which is of great significance to the development of LED industry. The system uses the MVC mode.It has three layer,the Dao layer,the Server layer and the Action layer. In the page control,it u
5、se the struts2,Jquery,Ajax and so on. In the aspect of function it is separated into two pieces, the consumers piece and the managers piece.The consumers piece realizes the functions from registion to buying.The manager piece realizes six function including logistic management,order management,enter
6、prise management,production management, storage management and transaction management.This platfrom is developed for the enterprise marketing alliance and customer online shopping. Key words: Sales of union; electronic commerce; online shopping system; online shopping3目录摘 要 .1Abstract2第 1 章 绪论 .51.1
7、 课题研究目的和意义 .51.2 国内高考发展现状与趋势 .61.2.1 我国高考发展现状 61.2.2 我国高考未来多元化发展趋势 61.2.3 关于知网(hownet )发展现状 .71.2 研究的主要内容 .71.4 项目的产业化前景分析 71.5 本章小结 7第 2 章 可行性研究和需求分析 .82.1 可行性研究 82.1.1 技术可行性 .82.1.2 经济可行性 .82.1.3 操作可行性 .82.1.4 法律可行性分析 82.2 需求分析 .92.2.1 必要性说明 92.2.2 引言 92.2.3 综合描述 102.2.4 外部接口需求 102.2.5 系统功能需求 112.
8、3 本章小结 .18第 3 章 开发环境与相关技术 .193.1 开发环境 .193.2 主要开发工具及原理 .193.2.1 开发准备 .193.2.2 MyEclipse8.5 开发工具简介 213.3 开发相关技术 .223.4 本章小结 .22第 4 章 系统总体架构设计 .2344.1 软件系统总体架构 .234.1.1 组件部署模型 234.1.2 网络拓扑结构 244.1.3 服务质量考虑 254.2 系统设计规范 254.2.1 数据储存层设计 254.2.2 数据访问层设计 254.2.3 业务逻辑层设计 274.3 本章小结 .27第 5 章 系统详细设计 .275.1 软
9、件设计概述 .275.2 数据库结构设计 .285.3 知网的数据 325.4 本章小结 .33第 6 章 数据获取与知网实现 .346.1 系统实现概述 346.1.1 概述 346.1.2 数据获取思路 346.1.3 数据获取分析 346.2 系统的具体实现 .346.2.1 数据获取的实现 .346.2.2 数据整理分析 376.2.3 知网数据搭建 .386.2.4 重要数据的展示 .456.2.5 项目展望 .476.3 本章小结 47结 论 .48参考文献 .49第 1 章 绪论1.1 课题研究目的和意义5在高考结束以后,考生同学和家长面临着高等院校和专业的选择,在这个时间段,如
10、果能够做出一个相对正确适合的志愿填报,将大大增加考生被理想大学录取的机会,开始自己的大学生涯,通过四年的专业知识学习,将来能够和谐的融入社会;相反,在这个时间段,如果做出的是一个相对不太合适的志愿填报,那么面临着高分落榜、复读,或者进入一所不理想的学校,开始尴尬的四年大学生活,必然会影响学生对大学专业知识的学习,毕业后的就业问题会更加让学生和家长头疼。考生和家长需要在很短的志愿填报时间段内,全面的了解全国 2000 多所高等学校的真实情况:师资、教学水平,和学校的专业设置,专业主修课程,专业毕业后的就业率,专业市场需求,专业就业方向、从事工作岗位、薪资水平等信息,并根据自己的分数做出院校和专业
11、的选择。以往这些工作需要考生和家长通过学校发放的志愿填报指南书籍、互联网等其他方式收集资料,经常出现院校专业信息了解不全面,历史录取分数不准确等情况,影响考生做出相对正确适合的志愿填报。院校专业浏览、专业与就业分析,志愿填报筛选三大模块就是为了解决考生和家长面临的上述问题,院校专业浏览模块,向考生和家长提供全国具有高等教育招生资格的院校和专业信息,包括院校介绍、院校最新的招生章程、专业介绍,专业主修课程、专业就业方向、专业市场需求、专业就业岗位,专业就业岗位学历要求、经验要求、薪资待遇等丰富内容。并且向考生和家长提供院校和专业从 06 年开始至近,历年的录取分数,供考生和家长志愿填报做参考。专
12、业与就业分析模块,帮助考生对比几个相似或意向专业的专业就业率、市场需求和薪资待遇等情况。通过志愿填报筛选模块,综合考生的预估高考分数,高考批次线分数,以及之前选择的意向专业和意向学校,软件系统利用曲线法和线差法等科学的方法自动筛选,帮助考生和家长,筛选出符合输入条件和分数的院校和专业。考生和家长可以对筛选出的学校和专业再仔细进行研究,从而缩短从大量院校中选择的时间,利用院校专业历年的录取分数客观判断出考生被理想大学录取的机率。经过多次、反复的筛选和比较,帮助考生和家长做出相对正确适合的志愿填报,增加考生被大学录取的机会。系统更为将来进入大学殿堂的考生准备了告诉未来模块,帮助大学生进行职业生涯规
13、划、生活管理规划、学习管理规划、身心健康规划等内容。1.2 国内高考发展现状与趋势1.2.1 我国高考发展现状2010 年中国高考制度大都进行了些许调整,2010 年在入学体检方面的最大变化,是6除军校等特殊类型学校外可以不用进行乙肝项目检测了,即取消乙肝病毒感染标志物检测(俗称 “乙肝五项”) 和 HBVDNA 检测。下面,我们拿几个省市为例,详细了解一下今年高考招生现状 广东省:3文/理综合 2010 年,实施 3文/理综合模式,并进行高中学业水平考试,考试成绩与录取挂钩。高考成绩、学业水平考试等级和综合素质测评共同作为考生学业测评的依据。 而就在 2007 年,开始采用“3+文科基础/理
14、科基础+X ”的考试模式,恢复了文理科的区别,文理科分开划线录取。计分方式从标准分恢复为原始分,开始采用综合素质测评。今年则去掉了 x 科,此举深化了高考改革,促进了高中生基础知识的全面发展,防止了学生过早的发生“偏科”现象,减轻了学生的考试压 力,也更好的实现了高考分数的真正公平,避免造成的考试成绩不均等现象,但我们可以看一看考生的反应:高中新生大喊倒霉,老生高呼幸运。这一奇怪的抵触新政策的反应足以说明,所谓防止“偏科”实际上是抹杀考生特长的一种方式。“防止过早偏科”在根本上成为了将学生特长“扼杀在摇篮里”的黑手。所以如此改革是福还是祸,还有待商议1.2.2 我国高考未来多元化发展趋势“3X
15、”高考模式中, “X”是学校、考生可以在多门考试科目中自主选择的,不同专业有不同的考试方向,不同的学生可以选择参加不同科目的考试。 “3X”改革于以往的高考改革本质不同点,在于初步探索了高考多元化的发展方向。高考多元化的优势在于:有利于高校选拔人才。根据专业方向的要求设置考试科目,突出了专业特点,更接近因才录取,改变了所有专业一律的依总分录取。让学生依据自己的意愿和特长选择大学教育。 “X”的设置是以承认学生个体间的差异,承认个体身上各方面潜能的不平衡所显示出的个性为基础,允许学生在高考中充分展示自己的个性特长,也允许学生依此选择学校,鼓励学生根据自己的特长、优势和兴趣发展。制约单纯应试的教学
16、倾向。一门课程可以针对一个考试大纲、一张试卷形成专门应试教学模式,但对于多元化高考就难以用“考什么,教什么” 的方法应试。面对多元化考试,很难针对一、二个高校选择的考试形式组织专门教学。要适应这样的高考,只能回到课程和教学目标上,把教学重点放在学生的基础知识、基本技能和基本能力上,提高学生的实际能力和综合素质。1.2.3 关于知网(hownet)发展现状词义相似度计算在很多领域中都有广泛的应用,例如信息检索、信息抽取、文本分类、词义排歧、基于实例的机器翻译等等。词义相似度计算的两种基本方法是基于世界知识(Ontology)或某种分类体系(Taxonomy)的方法和基于统计的上下文向量空间模型方
17、法。这两种方法各有优缺点。 7知网是一部比较详尽的语义知识词典,受到了人们普遍的重视。不过,由于知网中对于一个词的语义采用的是一种多维的知识表示形式,这给词语相似度的计算带来了麻烦。这一点与 WordNet 和同义词词林 不同。在 WordNet 和同义词词林中,所有同类的语义项(WordNet 的 synset 或同义词词林的词群)构成一个树状结构,要计算语义项之间的距离,只要计算树状结构中相应结点的距离即可。而在知网中词汇语义相似度的计算存在以下问题: 1. 每一个词的语义描述由多个义原组成; 2. 词语的语义描述中各个义原并不是平等的,它们之间有着复杂的关系,通过一种专门的知识描述语言来
18、表示。 1.2 研究的主要内容1. 了解知网的基本原理,了解“高考填报志愿辅助参考系统“ 产品的主要功能。2. 利用知网的中文信息处理能力,改进计算机系统靠关键词匹配的信息检索能力,在语义理解的前提下,提供有关学校信息协助考生报高考志愿。3根据考生的输入自己的分数和想报一个自己想读的学校和专业,用 MYSQL 数据库实现系统,可以根据考生的分数推荐一些相关的学校或专业给考生参考。1.4 项目的产业化前景分析后续服务预知模块:提供职业生涯,学习发展,身心健康,生活管理,素质拓展等多方面服务,为考生人生一路护航。1.5 本章小结本章概括总结了本课题研究的目的和意义,分析了考高志愿协助系统的现状和其
19、在未来发展的趋势,从而导出了本平台研究的主要内容和要点,并对项目的产业化前景作出分析。第 2 章 可行性研究和需求分析2.1 可行性研究软件可行性分析最根本的任务是对以后的行动方针提出建议。如果问题没有可行的8解,分析员应该建议停止这项开发工程,以避免时间、资源、人力和金钱的浪费;如果问题值得解决,分析员应该推荐一个较好的解决方案,并且为工程制定一个初步的计划。系统可行性研究一般包括以下三个方面:技术可行性、经济可行性、操作可行性、法律可行性分析 3。2.1.1 技术可行性本系统是基于 J2EE 框架开发的,利用 servlet 的开发模式,并采用时下主流的 Web Service 网络编程技
20、术、ajax 无刷新技术、关键字索引技术和分页加载技术等,使开发的系统的稳定性好可维护性高,因此技术可行性较高。2.1.2 经济可行性JAVA 是由 Sun Microsystems 公司推出开源的语言,可自由调用其 API 而不用考虑版权问题,同时 J2EE 平台开发所需的 jar 包大多都是开源可以直接从网上下载直接使用,另一方面本系统应用到的 php 第三方框架,所使用的服务器是 apache 和数据库 MySql 都是免费提供给开发者使用,而开发本系统我们只需要一台装有 Windows XP Professional或者 win7 的普通电脑即可,因此开发的经济额外支出可以忽略。2.1
21、.3 操作可行性本系统按使用权限分可以分为普通客户和管理员,普通客户可以根据页面上的提示信息对自己的账户进行操作和购买,页面清晰简洁操作简单让用户的体验得到大大的提高。管理员模块利用分块管理,让管理界面层次清晰可见,方便维护方便管理,因此操作可行性从两个模块来看都是相对够高的。2.1.4 法律可行性分析开发产品应维护开发者的版权,在不侵犯版权的前提下进行软件开发这是软件开发过程中的一个重点内容,本系统综合了一些主流的相关功能,在不侵犯其他开发者的开发版权不抄袭其他开发者的源代码的情况下,对项目功能进行模仿改造,因此从法律角度分析,本系统符合法律可行性。2.2 需求分析2.2.1 必要性说明在软
22、件工程中需求分析是指理解用户需求,就软件功能与客户达成一致,估计软件风险和评估项目代价,最终形成开发计划的一个复杂过程。在这个过程中,用户处在主导地位,需求分析工程师和项目负责人要负责整理用户需求,为之后的软件设计打下基础。需求分析之所以重要,就因为它具有决策性、方向性、策略性的作用、它在软件开发的过程中具有举足轻重的地位.因此一定要对需求分析具有足够的重视.在一个大型软9件系统的开发中,它的作用要远远大于程序设计。2.2.2 引言本文档为了进行定义需求规格、项目策划、要设计之基础,使开发人员能够高效率地开发项目,提高项目质量,也是用户用来验收的依据。2.2.2.1 编写的目的 在每年放榜录取
23、的时候,我们经常会看到这样一些非常可惜的情况:平时成绩很好的同学,志愿填报都选择了很好的学校,因为没有拉开志愿间的差距而从本一掉到了本二;有的同学最终录取学校的专业投档分比自己的投档分低了 20 分;还有的同学发现没有自己考分高的同学最终录取的学校比自己的好.对于考生来说,6 月一考凝聚了十多年寒窗苦读的所有心血,最终若是因为高考志愿填报不合理而没有能够进入理想学校或专业,那不仅是遗憾也是浪费!学生、家长、老师都知道,想在高考中提高几十分成绩需要付出多少,而因为志愿填报不合理浪费几十分将是多大的损失!而本系统讲结合广东高考多年的数据,利用合理的数据分析,结合知网的架构,让考生让准确的找到自己理
24、想的专业和学校。2.2.2.2 项目风险任务提出者:李卫华教授,张梅副教授(规定时间的合理性)。软件开发者:陈日燊然后选“系统变量”,同理点击新建然后输入变量名为:CLASSPATH 变量值为:.;%JAVA_HOME%lib; %JAVA_HOME%lib dt.jar;%JAVA_HOM E%libtools.jar;具体见图 3-3。21图 3-3 环境变量设置方法最后测试下环境变量是否设置成功,在左下角的搜索框中键入 cmd 回车输入 javac如果出现如下信息用法:javac 其中你的 Java 环境变量配置成功,若出现 javac 代表不是内部或外部命令,也不是可运行的程序或批处理
25、文件,不可能的原因有可能在于“;”号,具体见图 3-4。图 3-4 测试环境变量信息3.2.1.2 安装 MyEclipse8.5MyEclipse8.5 安装时会提示找到 JDK 的安装目录,由于已经设置好环境变量,这一步按默认设置便能完成安装过程。3.2.2 MyEclipse8.5 开发工具简介MyEclipse 企业级工作平台(MyEclipse Enterprise Workbench ,简称MyEclipse)是对 EclipseIDE 的扩展,利用它我们可以在数据库和 JavaEE 的开发、发布以及应用程序服务器的整合方面极大的提高工作效率。它是功能丰富的 JavaEE 集成开发
26、环境,包括了完备的编码、调试、测试和发布功能,完整支持HTM、Struts、Spring、Hibernate、JSP 等 5。MyEclipse 是一个十分优秀的用于开发 Java、 J2EE 的 Eclipse 插件集合,MyEclipse 的功能非常强大,支持也十分广泛,尤其是对各种开源产品的支持十分不错。MyEclipse 目前支持 Java 22Servlet、AJAX、JSP、JSF、Struts、Spring、Hibernate、EJB3、JDBC 数据库链接工具等多项功能。可以说 MyEclipse 几乎囊括了目前所有主流开源产品的专属 eclipse 开发工具。根据官方最新消息
27、显示:MyEclipse 2013 已经正式发布。MyEclipse 2013 支持HTML5、JQuery 和主流的 Javascript 库。3.3 开发相关技术本系统采用 php,xsimilarity 第三方框架和 JDBC 技术进行开发,其中前台静态页面的排版和样式采用了 HTML+CSS,页面显示采用 JSP,动态效果采用了JavaScript、JQuery 技术,动态加载应用了标准的 Ajax 技术。后台的功能架构应用业务代理技术,拦截器技术等,整个系统的架构思想基于 MVC 模式。3.4 本章小结本章主要讲述了开发前所需的准备工作包括开发工具的安装、环境变量的配置、所需的开发环
28、境,并简述了开发所用的工具,最后介绍了本系统具体所采用的技术,为系统的详细开发做好了充足的工作准备。23第 4 章 系统总体架构设计4.1 软件系统总体架构4.1.1 组件部署模型本系统部署在 Apache server 中,其实就相当于把整个系统放在 tomcat 服务器上面,这样让服务器来处理用户发来的请求,这样的好处就类似使用了缓存技术把系统缓存到服务器从而减轻服务器的负荷,加快服务器的响应速度,因此用户只需通过客户端的浏览器就可以访问到本平台,组件部署模型如下图 4-1 所示 8。图 4-1 系统组件部署模型图244.1.2 网络拓扑结构网络拓扑(Topology)结构是指用传输介质互
29、连各种设备的物理布局 9。本系统的网络拓扑结构,由三层构成:第一层是网络的路由器和交换机,终端层是应用服务器,客户层的请求经过的服务器处理,然后再传送给应用服务器,最后用户得到服务器的回应。这种网络拓扑结构优点是通信线路连接简单,维护方便,可扩充性也较好,本系统的网络拓扑结构图如图 4-2 所示。4-2 系统树形网络拓扑结构图4.1.3 服务质量考虑服务的质量考虑主要是为了考虑到用户的使用感受,本系统从响应速度、用户体验度和管理使用三个方面来进行服务质量的考虑。1响应速度考虑:为了提高系统的响应速度,防止网络缓慢时影响页面加载速度,在页面显示中采用分块式加载技术(实际开发同时应用 CDN 技术
30、和代理服务器) ,提高页面读取速度 10。 2用户体验考虑:为了提高用户的体验度,页面模块采用了分块加载式显示,各商品分类清晰明了为了让平台样式推向主题化特意封装页面直接引用,让界面和谐舒服,同时简化用户操作流程,所有繁杂业务全都作封装处理,大大提高用户体验度。 3管理员管理考虑:后台管理推向模块化,使管理员更方便高效地对系统进行管理。254.2 系统设计规范4.2.1 数据储存层设计为了让数据持久化做的更好本系统从数据库的储存层设计上主要考虑了三方面的优化,分别是主外键的设置、设计范式和关系表的设计。1.主键和外键:为每张表建立一个主键(实际主键都有一个索引) ,对于一些数据需求关联到多张表
31、的业务,需要在表跟表之间建立外键关系,为了方便业务对数据库的新增操作,主键(一般为 ID)设置为自动生成策略。2.设计范式标准:本系统创建普通的表满足第三范式标准,创建的表易于维护且满足需求,保证数据库的一致性和完整行。3.关系表:针对一对多的问题,设置关系表,保存两张表的主键,通过关系表直接映射表之间的关系,方便业务层对数据的访问。4.2.2 数据访问层设计系统采用 Dao 模式负责数据访问层,比较在 JSP 页面中使用 JDBC 来连接数据库,这样导致了 JSP 页面中包含了大量的 HTML 代码和 JSP 代码,将显示和功能代码混在一起,难以维护。并且在 JSP 页面中使用 JDBC 代
32、码,必须导入相应的“java.sql.*“包。基于使得 JSP 页面专注于数据的表现的思想,我们只是希望 JSP 主要负责数据的显示,而不需要关注数据的来源和途径。同时在 JSP 进行 JDBC 操作,重复编码太多。如不同的页面连接同一个数据库时需要在每个页面中都进行 JDBC 编码。DAO 设计模式提供了一种通用的模式,来简化大量的代码,增强程序的可移植性,DAO 层由 5 个重要部分组成如图 4-311。图 4-3 dao 模式工作流程26DAO 接口:定义了所有的用户的操作,如添加记录、删除记录和查询记录等。这不是一个具体的实现类,而是一个接口,仅仅定义了相应的操作(方法),这是给后来的
33、具体实现提供一种灵活性和易维护性。具体的实现需要具体实现类实现这个接口的方法来实现。这样表示层调用通过 DAO 工厂类获取 DAO 实现类实例的方法完成相应的操作。4.2.3 业务逻辑层设计系统的业务逻辑层使用 biz(或者叫 server)模式,通常本层会被 Action 层调用,然后该层负责对业务逻辑进行处理(例如调用 Dao 层) 。从而使业务逻辑集中在该层中,方便对该系统进行业务设计。 4.3 本章小结本章主要介绍了系统总体设计的框架,系统总体设计工作应该自顶向下地进行,总体设计主要是指在系统分析的基础上,对整个系统的划分(子系统) 、机器设备(包括软、硬设备)的配置、数据的存贮规律以
34、及整个系统实现规划等方面进行合理的安排。总体设计是开发过程中的关键步骤,对软件系统的模块质量起着举足轻重的作用。27第 5 章 系统详细设计5.1 软件设计概述本系统分为两大模块,分别为客户模块和管理模块。这两大模块和各对应的子模块如下:1.客户模块:搜索模块(这模块包括了 1 大学搜索,2 高校分数线,3 专业分数线) ;评估模块(这模块包括了输入成绩选大学,2 专业搜索) ;2.管理模块:基础数据模块(这模块包括了 1 地区数据编辑,2 学院数据编辑,3 专业数据编辑) ;历史数据分析理模块(这模块包括了 1 历届高考学院录取收集整理 2 历届专业学院录取收集整理,4 历届分数段排名收集整
35、理,5 知网建立) ;5.2 数据库结构设计在数据库应用系统的开发过程中,数据库结构的设计是其首要的和基本的内容。数据库是信息系统的核心和基础。它把信息系统中的大量数据按照一定的模型组织起来,提供存储、维护、检索数据的功能,这样使信息系统可以方便、及时、准确从数据库中获取所需的信息。一个信息系统的各个部分能否紧密的结合在一起以及如何结合关键在数据库。因此必须对数据库进行合理设计。为用户设计应用程序的前提是明确用户的需求,也就是说用户要求所开发的程序应该具备哪些功能,然后确定需要存储哪些数据由哪些表存储这些数据,进而确定数据之间的相互关系,这些数据之间的关系都是借助于关系表这种形式来实现定义的。
36、针对本毕业设计在数据库(MySql)中创建了 9 个表,即院校信息表 m_college,省份信息表 m_prov,专业信息表 m_major,专业历史录取记录表 major_score_his 表,分数段排名记录表 score_ranking_his,学校录取记录表 college_score_his,专业成绩分析表 major_score_analysis,分数排名分析表 score_ranking_analysis,院校成绩分析college_score_analysis。一下图形设计来自 powerdesign 工具1.院校信息表 m_college28保存院校信息,结构如表 5-1
37、所示。表 5-1 学院信息表2.省份信息表 m_prov保存省份信息,结构如表 5-2 所示。表 5-2 省份信息表3.专业历史记录表 major_score_his保存院校专业历史记录信息,结构如表 5-4 所示。表 5-3 专业历史记录表项表4 专业信息表 m_major保存院校专业信息,结构如表 5-3 所示。29表 5-4 专业信息表5.院校历史记录表 college_score_his保存院校历史记录信息,结构如表 5-5 所示。表 5-5 院校历史记录表6.历史分数段排名表 score_ranking_his保存历史分数段信息,结构如表 5-6 所示。表 5-6 历史分数段排名表7.分数段排名分析表 score_ranking_analysis保存分析后的分数段排名信息,结构如表 5-7 所示。30表 5-7 分数段排名分析表8.专业记录分析表 major_score_analysis保存专业记录分析信息,结构如表 5-8 所示。表 5-8 专业记录分析表9.院校记录分析表 college_score_analysis。保存院校录取分数分析信息,结构如表 5-9 所示。表 5-9 院校记录分析表各表间的关系机构如下图