1、中国计算机学会学科前沿讲习班The CCF Advanced Disciplines Lectures第 21 期主题 面向互联网的自然语言处理技术理论、方法与应用问题研究2011 年 8 月 27 日-8 月 31 日 北京随着互联网的快速发展,面向互联网的数据挖掘和跨语言信息处理成为学术界和产业界关注的热点互联网以海量、半结构化、互动、动态更新为基本特征的信息表现形式及其人机交互模式与关系网络为数据挖掘和自然语言处理提供了新的研究平台与数据支持;另一方面,以技术创新为主要驱动力之一的互联网产业已经成为中文信息技术的相关理论与技术的重要应用领域之一。例如,百度有 60%的应用需要 NLP 技
2、术的支持。本期 CCF 学科前沿讲习班将围绕面向互联网的自然语言处理相关理论、技术与应用,邀请学术界和工业界的著名专家、学者系统讲授最新学术理论与应用创新课程,面向有志于从事数据挖掘、自然语言处理基础研究和相关互联网技术研发的青年学者和学生提供一周(5 天)学习、交流,让参加者全面了解并掌握该领域的主要研究内容,把握研究热点和前沿,提高学术水平和研究实践能力。讲习班采用小班授课方式(50 人),中文讲解,利于答疑解惑。同时提供申报中文信息技术开放课题的机会。学术主任 赵东岩 北京大学研究员;李涓子 清华大学教授协办单位 清华大学、微软亚洲研究院(MSRA)、中文信息技术专委会特邀讲者及报告主题
3、互联网自然语言处理的基础理论(一)报告主题:机器学习与信息检索特邀讲者: 李 航 微软亚洲研究院主任研究员互联网自然语言处理的基础理论(二)报告主题:自然语言处理与信息抽取特邀讲者: 赵 军 中科院自动化所研究员互联网自然语言处理技术与平台报告主题:互联网自然语言处理技术特邀讲者:周 明 微软亚洲研究院主任研究员互联网自然语言处理技术与应用(一)报告主题:互联网语义挖掘与智能计算特邀讲者:林钦佑 微软亚洲研究院主任研究员互联网自然语言处理技术与应用(二)报告主题:复述研究及其应用特邀讲者:王海峰 百度高级科学家注册费: (含资料和 5 天的午餐)1、 7 月 31 日前报名并缴费:会员(或研究
4、生)900 元,非会员 1200 元2、 8 月 10 日前缴费:会员(或研究生)1000 元,非会员 1380 元3、 8 月 26 日缴费(含当天缴费):会员 1200 元,非会员 1560 元优惠办法:1、 同一单位一次有 5 人报名者,可免交 1 人的注册费(当天不办理此项业务,缴费额度见上标准)2、 2010 年参加过讲习班学员可在原缴费标准基础上降低 100 元。3、 2011 年参加 3 次讲习班的学员,第四次免费。4、 老 ADL 学员每推荐一名新学员,推荐者当期注册费优惠 100 元(以被推荐者参加讲习班为有效) 。食宿自理缴费方式:邮寄:北京 2704 信箱,邮编:1001
5、90 收款人:中国计算机学会,银行转账:开户行:北京银行北京大学支行;户名:中国计算机学会帐号:01090519 5001 201 097 020 28请务必注明:姓名 ADL-21 NLP现场:报到时缴纳(需事先在报名表中承诺栏中填写名字)报名方式:即日起至 2011 年 7 月 31 日,报名者请填写附表并发送至:,按报名先后录取。将与邮寄联系确认。联系人:赵东岩 E-Mail: 余遐 E-mail:ccf-日程安排2011 年 8 月 27 日 互联网自然语言处理的基础理论(一)8:30-9:00 开班仪式、合影第一讲 机器学习与信息检索 MSRA 主任研究员 李 航第一课 09:00
6、-10:00 排序学习 Learn to Rank (1)第二课 10:20-11:30 排序学习 Learn to Rank (2)12:00-14:00 午餐、休息第三课 14:00-15:00 匹配学习 Learning to Match(1)第四课 15:20-16:20 匹配学习 Learning to Match(2)第五课 16:30-17:00 Free QA(互动课)2011 年 8 月 28 日 互联网自然语言处理的基础理论(二)第二讲 自然语言处理和信息抽取 中科院自动化所研究员 赵 军第一课 09:00-10:00 句法分析第二课 10:20-11:30 信息抽取12:
7、00-14:00 午餐、休息第三课 14:00-15:00 观点信息抽取和倾向性分析第四课 15:20-16:20 问答系统第五课 16:30-17:00 互动课2011 年 8 月 29 日 互联网自然语言处理技术与平台第三讲 互联网自然语言处理技术 MSRA 主任研究员 周 明第一课 09:00-10:00 计算的未来第二课 10:10-12:00 机器翻译基础12:00-14:00 午餐、休息第三课 14:00-14:50 微博语义分析和搜索(1) 第四课 15:00-15:50 微博语义分析和搜索(2) 第五课 16:00-17:00 深入英库和微软对联2011 年 8 月 30 日
8、互联网自然语言处理技术与应用(一)第四讲 互联网语义挖掘与智能计算 MSRA 主任研究员 林钦佑第一课 09:00-10:00 大规模开放域语义挖掘技术概览第二课 10:20-11:30 从物理世界建构智能 移动计算及普适计算的前沿12:00-14:00 午餐、休息第三课 14:00-15:00 在线广告第四课 15:10-16:10 微软学术搜索第五课 16:20-17:00 总结暨问答互动2011 年 8 月 31 日 互联网自然语言处理技术与应用(二)第五讲 复述研究及其应用 百度高级科学家 王海峰第一课 09:00-10:00 复述问题研究(1)第二课 10:20-11:30 复述问题
9、研究(2) 12:00-14:00 午餐、休息14:00-17:00第三课 14:00-15:00 复述问题的应用第四课 15:20-16:00 互动课第五课 16:10-17:00 专题讨论17:00 结业式讲者介绍李 航,微软亚洲研究院主任研究员报告主题 机器学习与信息检索主要内容:报告将对排序学习(Learning to rank)和匹配学习(learning to match)方法进行综述性介绍。排序学习是指面向对象排序的机器学习方法,匹配学习是指实现两个不同空间的对象匹配的机器学习方法。排序学习和匹配学习适合在信息检索、自然语言处理和数据挖掘的很多应用中使用。针对上述问题的研究工作已
10、经非常深入并取得了显著进展。本报告将向自然语言处理领域的青年学者和学生介绍排序学习和匹配学习的多种机器学习新方法,推动相关方法的创新研究。李航,日本京都大学电气工程系毕业,日本东京大学计算机科学博士。曾任职于日本 NEC 公司中央研究所,2001 年至今任职于微软亚洲研究院,现任高级研究员及主任研究员。北京大学,南开大学,西安交通大学客座教授。李航的研究方向包括信息检索,自然语言处理,统计机器学习,及数据挖掘。赵 军,中科院自动化所研究员报告主题 自然语言处理和信息抽取技术主要内容:互联网的快速发展为自然语言处理技术提供了应用平台,同时也为自然语言处理技术的发展提供了资源和技术创新的源泉。本课
11、程将面向互联网应用,选取句法分析、信息抽取、观点信息抽取和倾向性分析、问答系统等四个研究方向,系统介绍其中的基本概念、主要方法、最新研究进展、需要解决的问题和发展趋势,使学生能够对自然语言处理和信息抽取领域的重点问题和主要方法有较为系统的了解。赵军,研究员,博士生导师。1998 年在清华大学计算机科学与技术系获得博士学位。1998年2002 年在香港科技大学计算机科学系做访问学者。2002 年 5 月至今在中国科学院自动化研究所模式识别国家重点实验室工作。研究方向为自然语言处理和网络信息抽取等。主持多项国家自然科学基金、863 计划、中国出版集团科技项目等的研究工作。在ACL、SIGIR、CI
12、KM、IJCAI、EMNLP、CoNLL 等顶级国际会议上发表一系列学术论文。主页:http:/ 明,微软亚洲研究院主任研究员报告主题 互联网自然语言处理技术主要内容:针对互联网搜索和社会关系网络对自然语言处理提出的大规模、实时处理的需求,介绍新型的自然语言处理的方法(NLP2.0)以及若干重要研究和应用领域。报告将主要介绍NLP2.0 策略主要体现在海量网络数据获取,基于数据驱动和机器学习技术自动建立大规模的语言处理系统,引入用户到系统的开发过程中来。我们将通过著名的英库和对联系统来深入浅出地介绍 NLP2.0 的主要思想;针对跨语言检索和信息获取的应用需求,介绍主流的统计机器翻译模型以及模
13、型训练和解码的过程;并系统介绍针对微博所开发的新型自然语言的分析技术,讨论其在社会关系网络搜索中的应用。周明,微软亚洲研究院自然语言组主任,高级研究员。1991 年哈工大博士毕业,1991-1993年在清华任博士后,随后任副教授至 1999 年,其间 1996-1999 年在日本高电社领导中-日机器翻译的研发。1999 年加入微软研究院。2001 年起任自然语言组主任并曾于 2004 年短期兼任语音组主任。他的研究兴趣包括自然语言处理、机器翻译、社会关系网络的搜索。自从1985 年以来,他独立完成或领导了众多成功的项目。包括中国第一个中-英机器翻译系统(1989 年) ,该开创性的工作对哈工大
14、的机器翻译研究方向的建立起到了历史性的奠基作用;日本首屈一指的中日机器翻译产品 J-北京(1998 年) ,使用该系统的翻译服务获日本机器翻译协会最高荣誉长尾奖(2008 年) ;微软必应(英库)英语学习、词典和翻译系统,该系统获得华尔街日报评选的亚洲创新奖-读者之选奖(2010 年) ; 以及微软中日文输入法(2000-2001 年)和著名的人工智能系统微软对联(2005 年), 这两项研究均荣获微软亚洲研究院建院 10 周年 10 大创新项目。林钦佑,微软亚洲研究院主任研究员报告主题 互联网语义挖掘与智能计算主要内容:区别与传统的互联网搜索,本讲座主要围绕互联网语义挖掘与智能计算介绍互联网
15、计算的最新的主题,包括大规模开放域语义挖掘、移动计算及普适计算以及在线广告和学术搜索等最新应用技术。讲座将介绍从海量开放域网页数据中挖掘和提取实体与概念及其属性信息;以及实体和实体之间、概念和概念之间、实体和概念之间的语义关系挖掘的系列方法。从情景感知出发,介绍微软亚洲研究院进行的海量情境数据的知识获取相关研究项目,帮助更为构建智能互联网服务。进而,以付费搜索结果为例探讨在线广告排序与拍卖等相关的前沿研究问题,并介绍微软学术搜索技术,探讨如何利用微软学术搜索帮助学术研究。林钦佑,微软亚洲研究院互联网搜索与挖掘组主任研究员, 其主要研究方向为自然语言处理、信息检索、Web 搜索、数据挖掘和社会关
16、系计算 (social computing) 。他还开发了文档摘要、问答系统和机器翻译系统的自动评估技术,并已成为摘要评估的事实标准。林博士是 ACL2012 程序委员会共同主席,以及 AAAI2011 会议 AI 与 Web 系列的程序委员会共同主席。他还曾担任 AIRS2009 的程序委员会共同主席,也担任过 ACL 的领域主席。他是 ACM Transaction on Asian Language Information Processing 的副主编。2006 年加入微软之前,林博士是南加州大学信息科学研究所自然语言处理和机器翻译组的 research scientist。王海峰 百
17、度高级科学家报告主题 复述研究及其应用主要内容:复述,即对相同语义的不同表达方式,是人类语言使用中的普遍现象,同时也是自然语言处理所要解决的关键问题。本报告将对学术界及工业界在复述领域的研究成果进行综述,其中包括复述句子识别,复述资源获取,复述自动生成,以及复述评测方法等内容。此外,本报告还将重点介绍复述识别、获取、生成等技术在实际应用中,尤其是互联网应用中的作用和价值,涉及的应用包括搜索引擎、机器翻译、自动问答等。王海峰,1999 年 3 月毕业于哈尔滨工业大学,获博士学位,现任百度高级科学家,兼任哈尔滨工业大学兼职教授、博士生导师、中国中文信息学会理事、中国计算机学会高级会员及多个学会的专
18、委会委员、全国信息技术标准化技术委员会委员等。在国际学术界,王海峰是自然语言处理领域世界上影响力最大、也最具活力的国际学术组织 ACL(Association for Computational Linguistics)50 年历史上唯一当选副主席的华人,他还曾担任或正在担任国际期刊副编辑、客座编辑、国内期刊编委、顶级国际会议的程序委员会主席、Workshop 主席、Tutorial 主席及 Industry track 主席等。CCF ADL 报名表面向互联网的自然语言处理技术姓名 性别 男任职单位职称 是否 CCF 会员 是 会员号 正在办理手机 email入住时间:离开时间需要安排住宿单住: 合住:注册费缴纳方式 邮寄 银行转账 现场现场缴费承诺 我承诺现场缴纳注册费,并按时参加讲习班。签字: 发票抬头发票项目内容 注册费会议费会务费培训费我申请参加本期 ADL 并承诺按主办单位的规定参加。报名时间:2011-07-13说明:1、会员号:已办理入会手续但没有会员号者,请填写“正在办理”2、发票抬头:请写单位全称,发票项目内容,请任选一种3、请附个人学习与研究经历简介材料,用于报名和优秀学员评选