ImageVerifierCode 换一换
格式:PPT , 页数:36 ,大小:2.95MB ,
资源ID:4219001      下载积分:10 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.docduoduo.com/d-4219001.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录   微博登录 

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(信息检索综合课程设计 课程介绍.ppt)为本站会员(杨桃文库)主动上传,道客多多仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知道客多多(发送邮件至docduoduo@163.com或直接QQ联系客服),我们立即给予删除!

信息检索综合课程设计 课程介绍.ppt

1、信息检索综合课程设计 课程介绍,主讲人:李正华 苏州大学计算机学院 2016年2月29日,主要参考陈文亮老师课件,自我介绍,姓名:李正华 电子邮件: 个人主页:http:/ 课程主页:http:/ 研究方向:自然语言处理、人工智能,学生情况调查,修过哪些编程课?这学期修什么课程? C+中的string; vector; map等会很方便;Java中也有类似的东西 有的编程作业直接用C实现稍微复杂一些 写过多大规模的程序?,学习目的,学习信息检索基础知识动手构建一些小系统(编程实践)拿到本门课学分,计分方式,5,实验作业:70分(可能会酌情调整) 小作业3个*10分=30分 大作业2个*20分=

2、40分 平时出勤、回答问题等:10分 不能迟到、早退,特殊情况必须请假,并带辅导员签字的假条; 点名时,如果发现名单上没有你的名字,及时提出;(选修课的名单有时候会变) 作业完成非常好的同学可以告诉我,特殊对待。 期末小测验:20分 考察课程相关的基础知识,提纲,6,什么是信息检索? 为什么要学习信息检索?,提纲,7,什么是信息检索? 为什么要学习信息检索?,什么是信息检索,现场问答来几个互联网应用例子,8,你们来之前,什么是信息检索? 我得先调查一下,免得被蒙了。,接着,信息检索挺有趣的哈! 先整件衣服吧,有点冷!,接着,其实我还缺个女朋友!,中科院研究生院2011年度秋季课程,16,什么是

3、信息检索?,提问(随机点名系统),17,三个应用例子的共同特征,给定需求(或者是对象),从信息库中找出与之最匹配的信息(或对象) Google/百度的例子:需求 “信息检索” 淘宝的例子:对象 “男士西服” 世纪佳缘网的例子: 对象 “女朋友”!,18,信息检索的一些官方定义,给定用户需求,返回满足该需求的信息的一门学科。通常涉及信息的获取、存储、组织和访问。 从大规模非结构化数据的集合中找出满足用户信息需求的资料的过程。 非结构化数据通常指文本 什么是结构化数据?(提问),19,本课程的内容,主要关注面向文本数据 几部分内容: 爬虫(Crawler),得到网页(wget可以递归爬取静态网页h

4、tml) 网页正文提取(html文件的处理),得到文档 中文分词 文档存储(倒排;快速查询) 用户query分词 检索:找到相关文档 相关文档简单排序,20,本课程不涉及内容,非文本数据 Query深度分析和扩展 网页链接分析(PageRank)等复杂排序方法 .,21,22,完整的搜索系统示意图,22,信息检索技术的应用,23,搜索,推荐,挖掘,IR技术,情报处理,内容安全,舆情分析,信息检索应用系统,搜索系统 Web搜索引擎 IBM Waston问答系统 推荐系统 淘宝网 豆瓣网 当当网,24,从信息规模上分类,个人信息检索:个人相关信息的组织、整理、搜索等。桌面搜索(Desktop Se

5、arch)、个人信息管理(PIM = Personal Information Management)、个人数字记忆(Personal Digital Memory) 企业级信息检索:在企业内容文档的组织、管理、搜索等。内容管理(Content Management) Web信息检索:在超大规模数据集上的检索。,25,提纲,中科院研究生院2011年度秋季课程,26,什么是信息检索? 为什么要学习信息检索? 课程情况,直接经济效益-能赚钱啊!,世界级牛公司 很多互联网的公司:Google, baidu, 高市值公司 软件工程师 年薪高,市场发展的需求,用户需要信息检索技术:互联网的信息量太大、噪

6、音太多,寻找所需要的信息非常不容易 公司需要信息检索技术:搜索引擎改变了很多传统的生活方式,Yahoo、Google、Baidu,还有一些公司如Microsoft、Sina、Sohu、Tecent、Netease都加入到这个搜索技术的竞争。不只是搜索引擎才需要信息检索技术,电子商务(如亚马逊网站、阿里巴巴)、社交网(微博、Facebook、twitter、校内网)、数字图书馆、大规模数据分析等都需要信息检索技术 人才的竞争:搜索相关人才人数出现缺口,他们非常抢手,待遇如日中天 是不是泡沫:2000年左右出现的网络泡沫和现在的互联网有什么不同,搜索引擎在其中占什么位置?,28,几个应用需求,移动

7、搜索 产品搜索 专利搜索 广告推荐 消费行为分析 网络评论分析 SEO营销 ,29,对相关专业学生的基本要求,信息检索技术是内容应用特别是互联网内容应用的核心技术,可以说在这些应用中无处不在 信息检索将会成为一门计算机专业的基础学科 搜索(狭义的信息检索)的三个层次,30,中科院研究生院2011年度秋季课程,31,应用层次:搜索是一项非常重要的应用!,中科院研究生院2011年度秋季课程,32,中间层次:搜索是极其重要的API,中科院研究生院2011年度秋季课程,33,www.G,中科院研究生院2011年度秋季课程,34,介绍一本有趣的书!,中科院研究生院2011年度秋季课程,35,核心层次:搜索是未来操作系统的重要组成部分!,Q&A,有什么问题?,

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报