1、,新媒体舆情监控系统方案,1. 现状分析,3. 成功案例,2. 系统功能与架构,4. 应用场景,如何应对舆情监控难点,如何第一时间掌握到“与我相关”的重大事件? 如何能准确地收集到“我最需要”的舆情信息? 如何能不留死角的全网监控到舆情信息? 如何防止网上“神不知鬼不觉”的舆情发生? 如何防止网上有害信息泛滥和舆情失控? 如何追溯网上重点内容的传播途径? 如何化解网络危机? 如何应对网络突发公共事件? 如何全面掌握社情民意? 如何为上级部门推送网络舆情简报?,如何应对舆情事件,应对方法之未雨绸缪 参考新闻五要素(人、事、时、地、因) 准备危机防控预案应用方法之快速反应 根据危机防控预案,快速分
2、类处置 常见、特殊事件的基调和处理流程 媒体快发,迅速将自己的声音大过媒体进行传播 抢发正面、删除负面、终结谣言 有问题自己说,少让别人传应对方法之媒体关系 纸媒、广播、电视、网络、手机等 全方位整合营销,舆情监控的意义,1、当今社会,互联网已经成为中国主流舆论场,占据第一影响 力位置。,3、网络是社会信息的集散地,也是社会舆论的放大器。很多言 论,是通过网络放大、推进、炒作并形成舆论的。,2、越来越多的企业危机来自于互联网。,1. 现状分析,3. 成功案例,2. 系统功能与架构,4. 应用场景,系统整体架构,系统网络架构,目标网站,协同化信息采集 信息采集网络,舆情监控系统,数据清洗整合,数
3、据集运算,文本分类,全文搜索,访问控制,统计报表,舆情监测 应用逻辑,数据清洗整合转换,文本分类和搜索,信息管理和平台管理,层叠式 分类器集群,舆情监控系统特点,微博舆情监控特征,社会化媒体新浪微博腾讯微博搜狐微博人人网其它社交网站,社会化媒体特征快速传播碎片化海量数据去中心化 ,内置浏览器引擎以采集动态网页内容,弥补普通网络爬虫的不足基于语义标注的精确采集,将碎片化信息结构化转换,便于挖掘深层情报基于云计算框架的跨地域协同化网络爬虫,应对海量的社会化媒体,技术实现,动态网页数据采集,人在浏览器上看到的,网络爬虫看到的,HTML不见了大片的JS代码,无法搜索,内嵌浏览器渲染 自动模拟用户点击
4、所见即所得采集方式,碎片化信息的结构化转换,碎片化的内容,转发传播关系,影响力,人口地理特性,性别,城市,社交媒体传播角色,新鲜度,实效影响,碎片化内容,丰富的语义数据,结构化,数据挖掘,情报 商业竞争 社会舆情 品牌口碑,路径分析,社交图谱,语义标注和结构化转换,内容,内容的作者,发布时间,转发数,评论数,原文发布时间,原文转发数,原文评论数,语义标注,FreeFormat,信息采集,语义知识库,第一步:语义标注,第二步:自动算出采集规则,第三步:采集规则发布给协同化爬虫,第四步:采集和结构化转换,后续:入库和文本挖掘,网络爬虫采集云,服务器数据中心,XML/HTTP Web Service
5、 API,北京,上海,深圳,广州,网络爬虫,网络爬虫,网络爬虫,网络爬虫,五大功能特色,数据采集全,搜索引擎汇集了绝大部分的网络舆论。借助搜索引擎,我们实现了更全面的网络舆论监测。,覆盖主流搜索引擎,覆盖15万站点的舆论来源,新闻,平面媒体,论坛/社区,博客/微博,系统爬虫,自主研发专为舆情系统设计的智能网络爬虫系统,可以实现高质量的抓取,还支持对新浪微博、腾讯微博、搜狐微博等主要微博平台信息的实时抓取。,数据筛选准,数据分析强,网络舆论的环境分析,载体分布量:新闻、论坛、平媒、博客、微博等载体分布 媒体排行:媒体、网民发布声量、转载等排行,监测纬度广,通过网络爬虫技术、站内搜索、搜索引擎多纬
6、度数据采集,建立数据库。,危机预警快,舆情监控适用范围,企业,公关人员,市场人员,客服人员, 监测企业话题 预警负面信息 搜藏精华信息 追踪敏感话题 监测竞争对手, 分析品牌、媒介 寻找领袖意见 监测营销效果 行业热门话题 对比竞品, 监测解答用户问题 监测用户反馈意见 分析产品活跃领袖意见 监测竞品动态,市场人员,1. 现状分析,3. 成功案例,2. 系统功能与架构,4. 应用场景,成功案例,1. 现状分析,3. 成功案例,2. 系统功能与架构,4. 应用场景,场景1:微博客服,被动服务 了解客户服务需求,快速响应客户需求主动服务 监测信息覆盖整个微博平台,哪里需要客户服务,客服帐号的发言就第一时间出现在哪里,场景2:负面信息研判,经过研判模型,对采集数据进行分析,筛选,清洗,整合,剔重,分类获得与“我”相关,正负面及热点舆情信息。,场景3:危机公关,微博上全面舆情监控、危机公关 行业内意见领袖和关键节点人物的渠道资源管理 快速分析客户关系,Thank you!,舆情监控,