1、长春工业大学人文信息学院 08411XX XXX 毕业论文共 5 页 第 I 页摘 要本论文主要阐述“百度搜索引擎”下的“百度知道”系统的设计思想和实现的关键技术。论文针对互联网使用人员共享知识解决提问的需求,采用面向对象设计的方法和 JSP,Struts 等技术,分析、设计并实现了百度知道系统。该系统具有用户登录、注册,发布、回答、查询以及处理问题等功能,测试表明该系统达到了预期的要求。论文包括以下几个部分:第一部分系统分析,通过对用户需求的分析,说明了* * * *。第二部分概要设计, 设计了*,* * * *。第三部分详细设计,设计了* * * *。第四部分系统实现,通过*完成了*系统的
2、*模块。达到*。关键字:JSP Struts 搜索引擎(注:本文仅供参考,本文中出现的内容,不允许复制)长春工业大学人文信息学院 08411XX XXX 毕业论文共 5 页 第 II 页AbstractThe thesis is design of System that about Baidu Know System of Baidu Search-engine. On the other hand, it expounds the part of design of model and key technology of implementation. With the requireme
3、nt of the person who uses Internet to share knowledge and to resolve problems,it adopts OOP(Object Oriented Programming) and JSP, Struts technology to analyze, design and implements this system. The system includes the functions that register and question, answer, select and handle the question of u
4、ser. The test of whole system shows that it has come up the expectation.The thesis mainly includes the following parts: 1. Source of the Problem. 2. Requirement and Analysis. 3. System Design. 4. Detailed Design. 5. System Implementation.The system is WEB development application and is based on B/S
5、model. So that I chose the popular WEB development technology which is based on MVC development model, that is JavaBean、JSP、Servlet and I also used Struts Framework for this application. The development tools are mainly included Dreamweaver 8,Eclipse3.2、MyEclipse5.1. JUDE is my UML tool. The databas
6、e for server is SQL server 2000.The development of application includes three part: the 长春工业大学人文信息学院 08411XX XXX 毕业论文共 5 页 第 III 页databases of design、the design of web pages and the coding work. All coding of pages mainly used the JSP and Struts tags. For coding part is completely base on struts fra
7、mework.Key words: JSP Struts Search engine长春工业大学人文信息学院 08411XX XXX 毕业论文共 5 页 第 IV 页目录(注意:行间距 25)第一章 系统分析 .11.1 问题来源 .11.2 选题背景 .21.2.1 问题定义 .21.2.2 选题意义 .21.3 系统功能分析 .31.4 数据流图 .4第二章 基础理论知识 .62.1 MVC 模式概述 .62.2 MVC 如何工作 .72.3 Struts 概述 .8第三章 概要设计 .93.1 系统概述 .93.2 功能分析 .93.3 数据库分析 .113.3.1 实体的分析 .113
8、.3.2 实体的属性 .113.3.3 实体之间的联系 .123.4 数据库的概念设计 .133.5 数据库的逻辑结构设计 .14长春工业大学人文信息学院 08411XX XXX 毕业论文共 5 页 第 V 页3.6 数据库的物理设计 .16第四章 详细设计 .184.1 数据库连接模块的创建 .194.2 用户模块的详细设计 .204.3 问题模块的详细设计 .214.3.1 百度知道的主要功能设计 .214.3.2 百度知道的页面及主要核心算法设计 .224.4 开发工具及环境 .24第五章 系统实现 .265.1 用户模块的实现 .265.2 问题模块的实现 .27结束语 .30参考文献
9、 .31长春工业大学人文信息学院 0441208 谭天宇 毕业论文共 31 页 第 1 页第一章 系统分析1.1 问题来源百度,2000 年 1 月创立于北京中关村,是全球最大的中文网站 、最大的中文搜索引擎。百度每天响应来自 138 个国家超过数亿次的搜索请求。用户可以通过百度主页,在瞬间找到相关的搜索结果,这些结果来自于百度超过十数亿的中文网页数据库。同时,用户不必访问百度主页,也可以搜索信息。超过 20 万个搜索联盟会员,通过各种方式将百度搜索结合到自己的网站,使用户在上网的任何时候都能进行百度搜索。百度还提供 WAP 与 PDA 搜索服务,即使身边没有 PC 机,用户也可以通过手机或掌
10、上电脑等无线平台进行百度搜索。百度知道(http:/)是一个基于搜索的互动式知识问答分享平台,于 2005 年 6 月 21 日发布,并于 2005 年 11 月 8日转为正式版。和大家习惯使用的搜索服务有所不同,“百度知道”并非是直接查询那些已经存在于互联网上的内容,而是用户自己根据具体需求有针对性地提出问题,通过积分奖励机制发动其他用户,来创造该问题的答案。 同时,这些问题的答案又会进一步作为搜索结果,提供给其他有类似疑问的用户,达到分享知识的效果。百度知道的最大特点,就在于和搜索引擎的完美结合,让用户所拥有的隐性知识转化成显性知识,用户既是百度知道内容的使用者,同时又是百度知道的创造者,
11、在这里累积的知识数据可以反映到搜索结果中。通过用户和搜索引擎长春工业大学人文信息学院 0441208 谭天宇 毕业论文共 31 页 第 2 页的相互作用,实现搜索引擎的社区化。百度知道可以说是对过分依靠技术的搜索引擎的一种人性化完善。1.2 选题背景1.2.1 问题定义之所以搜索引擎这么火,大家这么依赖,是因为技术的进步,搜索引擎技术的进步非常的快。技术进步快,实际上是需求在推动。搜索最近两年来变得这么火,实际上是需求在推动搜索技术和产业推动。宽带越来越普及,上网越来越容易,上网的人越来越多,信息量越来越大。现在已经是非常繁荣的大路,这里面的内容很多很多,搜索一下初中的初恋情人,可能也会查找他
12、的名字。“用户提出任何一个问题,很快就会有人帮助回答,通过投票选出的最佳答案,往往又作为搜索结果被分享到更多用户”,这一简单、便捷的模式受到了网民的热烈欢迎,同时也改变着网民的日常生活习惯。网友表示,“生活上一遇到解决不了的问题,我第一个想到的就是上百度知道”,目前,百度知道每天解决超过 5 万个问题,也就意味着,通过用户的互动参与,两天时间即可编辑完成一本十万个为什么。1.2.2 选题意义众所周知,百度知道已经是一套开发过并且比较成熟完善的正在互联网上广泛使用的系统了,而之所以我选择这个系统作为我的毕业设计主要是因为现实中的该系统是由 PHP 语言开发的,而在大学期间的所学使我对于 Java
13、,JSP 语言有了浓厚兴趣,一方面可以利用自己所学的知识实现一套正规的系统,更加锻炼自己和提高自己的技术水长春工业大学人文信息学院 0441208 谭天宇 毕业论文共 31 页 第 3 页平,另外实用 JSP 语言版本开发与真实的系统实现方式不同也大大的增加我开发的兴趣。所以我选择百度知道这个系统作为我的毕业设计。1.3 系统功能分析要开发一个应用系统,首先要了解用户对整个系统的具体要求,确定系统应该实现的功能和系统应该具有的性能;设计应用软件时所使用的设计平台,所开发的应用软件的运行环境;通过调查分析去了解系统的业务流程,确定数据库设计中需要的数据结构;还要分析系统中的数据流和长期使用的数据
14、存储等等,这些都是需求分析中应该完成的任务。本章采用软件工程的方法对“百度知道”模块进行了需求分析。“百度知道”是一个基于搜索的互动式知识问答分享平台。它实现登录用户在线提问回答并解决问题共享知识的过程。该平台的维护为自动维护,由定义规则进行数据的维护,默认不设网站管理员角色。1.用户角色:普通用户(只有查询权限,无需登录) 、信息发布用户(提问和回答问题的用户)2.功能模块划分:(1)问题信息查询(普通用户)1)按照问题的栏目进行问题信息查询2)按照问题的标题内容进行问题信息的查询3)按照问题的状态(解决,待解决)来进行问题信息的查询长春工业大学人文信息学院 0441208 谭天宇 毕业论文
15、共 31 页 第 4 页4)查询全部信息(2)问题信息的管理(注册用户)1)提出问题2)对自己提出的提问进行信息处理3)回答待解决的问题4)问题信息查询每一个模块的功能详见总体设计。1.4 数据流图根据该系统问题的需求进行分析,使用数据流图示描述数据处理过程。数据流图从数据传递和加工的角度,以图形的方式刻画数据流从输入到输出的传输变换过程。数据流图是结构化系统分析的主要工具,它表示了系统内部信息的流向,并表现系统的逻辑处理功能。(数据流图描述数据处理过程,起点和终点必须是人,用矩形表示;处理过程是动作,用圆角矩形表示;数据存储就是数据表,用开口矩形表示;请大家注意,参考软件工程书画图)图 1-
16、1 用户模块的数据流图结果信息用户信息注册请求游客用户1接收请求用户表D1 游客用户查询信息问题 信息登录请求回答显示主页修改信息注册用户问题表D2提问显示问题问题列表回答问题注册用户问题表D2 回答表D3注册用户结果结果修改信息问题编号提问请求图 1-2 问题模块的数据流图回答表D3显示问题列表指定问题回答列表结果结果长春工业大学人文信息学院 0441208 谭天宇 毕业论文共 31 页 第 5 页数据流图中的一些专业词汇在数据字典中解释如下:(请注意:数据字典是解释前面的数据流图中出现的容易产生歧义的词,没有数据流图只出现数据字典是毫无意义的。在数据流图中没有的词出现在数据字典中也是毫无意义的。 )名字:问题列表别名:描述:问题列表所有问题的分类统计列表,待解决 10 个,已解决和最佳问题各 5个定义:待解决问题以解决问题最佳问题位置:百度知道首页名字:回答列表别名:描述:针对某一问题的所有回答定义:回答列表回答编号回答内容回答者编号问题编号回答状态位置:问题页面名字:问题编号别名:问题 ID描述:唯一标识问题的字段定义:问题编号数字位置:问题表