1、项目介绍,智能电视云数据中心,项目投资要点总结,项目亮点 通过分层次采集电视节目和视频内容的基础数据、深度数据,深度挖掘影视节目关联信息的商业价值(节目营销支持、定向广告关联、用户行为统计数据关联),形成全面的电视节目及视频的数据平台,以API形式对外开放接口,以云服务的方式向数据需求方提供付费的服务; 通过音频自动化内容识别技术,智能终端(智能电视及机顶盒)可以识别用户当前收看节目,同时触发相关联的的信息和交互应用,增加内容互动性、收视数据监测,通过运营关联的数据增值业务获得收益;目前已经具备覆盖全部央视和卫视节目能力; 通过视频分析平台提升电视内容元数据的描述维度,为影视节目内容中实体元素
2、建立关联(Linked Data)奠定基础,使数据中心真正成为媒体内容元数据的关键节点和底层数据的汇聚中心,为推荐引擎、视频检索提供数据支持,为数据衍生业务提供坚实的基础; 项目团队介绍殷志刚 创始人,原墨子科技CTO,多年EPG数据库系统开发经验,在中国,以EPG为主导应用的媒体内容元数据面临市场规模化的多重障碍:数据版权、时效性,最大的障碍是数据的精准性,数据版权: 目前,国内的数据脱胎于原有的电视报和电视台内部的信源渠道,有部分公司通过与各个电视台 渠道获得原始数据,经过简单加工后对外销售;有部分产品供应商通过网络抓取的方式获得数据, 并没有向数据采集公司付费; 数据时效性由于数据源头主
3、要是根据电视报的渠道,电视台调整节目播出并没有及时修订,造成与电视台播出系统的节目信息有差异 数据精准性 体育类直播节目由于直播的时间无法完全控制,造成时间差异较大,影响用户体验,电视台,项目公司,数据粗加工公司,电视报台内预告,电视台播出系统实际播出信息,云数据平台,全面精准多维数据,汇聚多台节目数据,补充修订节目数据,在海外,媒体内容元数据市场相对集中,同时新技术应用正在对传统元数据市场产生革命性影响,从数据的深度和商业模式等方面重构市场,Watchwith公司的元数据加工流程,Watchwith公司的客户群体,Watchwith公司产品完善的、高质量的元数据加工处理、管理发布流程 跨平台
4、的业务交付支持 极大扩展了用户群体(包含所有联网设备) 为内容商、终端商和运营商提供了新的收益来源(关联电商、关联广告等),Watchwith公司元数据产品的三个层次,媒体内容元数据将发挥重要的作用,从技术和商业模式上对电视产业发挥重大的影响,深化元数据类型扩展和深度应用的技术基础,媒体内容元数据的应用方向,深度元数据的相关应用场景,媒体内容的元数据已经不仅仅是演职员表等粗浅的数据类型,在视频分析等视频结构化技术的推动下,元数据类型范围大大扩展(基于时间码的场景级元数据、基于视频内容物件的元数据等),而且在数据交付方式上多以SaaS服务交付;而在商业模式上,传输卖数据的模式已经逐步转化为数据服
5、务,甚至数据运营(围绕内容元数据相关业务的拓展:场景感知的广告决策系统、视频检索等),多媒体信号处理 多媒体机器学习(IBM 沃森) 多媒体自然语言处理(讯飞) 多媒体语义检索(图数据库:Google knowledge Graph,搜狗知立方) 多媒体模式识别,元数据增强(EPG)关联Web信息(Zeebox) 内容生产系统应用(高级媒资管理)(电视台媒资库检索) 上下文感知的推荐系统(Hulu) 基于用户个性化的自适应服务(Intel) 实时分面过滤检索(Zeebox),在媒体内容数据业务链条上,以视频分析技术为核心技术引擎,从内容数据和用户数据层面,优化EPG数据质量,推动元数据数据服务
6、向数据运营转化,项目数据优化的两个方向,内容数据,用户数据,先期优化现有EPG数据的精准度 通过技术积累扩展元数据类型(数据生产制作、管理发布工具及流程) 深度挖掘技术能力(语义检索等),结合用户行为数据(切换台、移动端的点击等) 通过对社交网络数据挖掘,发现用户评论的态度倾向、主题建模 基于用户评论挖掘的电视节目评价体系,真正精准的元数据甚至可以标注蜘蛛侠街道场景中的汽车品牌,真正懂得用户数据的电视个性化服务应该知道用户所属社群和动态的兴趣变化,视频分析引擎,描述内容元数据的数据类型,在视频结构化技术的推动下,已经完全超越了现有EPG数据描述的范围,是典型的大数据应用,典型的视频分析引擎工作
7、流(AT&T实验室的视频分析引擎)采集视频流 视频数据结构化分析 音频(说话人识别) 视频(人脸识别聚类、场景元数据标注、镜头分类) 文本(OCR文本识别) 生成xml文件,开放API 第三方应用开发,典型应用场景,财经节目中嘉宾谈及微软,实时匹配微软的股价和关联新闻、广告等,体育比赛中出现某位球员,实时匹配这位球员的介绍、历史数据等,对用户数据的理解,在社交网络数据挖掘和自然语言处理技术支持下,超越了传统用户静态属性数据的局限,呈现更多动态特征,成为个性化服务基础,NHK引入社交网络数据挖掘呈现收视趋势、推荐节目,呈现给用户的界面,呈现给内容商的界面,Hybridcast:推荐结果在智能电视
8、上呈现,在媒体内容数据业务链条上,云数据中心将成为数据枢纽,并通过Web服务(API)快速向第三方终端交付,在媒体内容数据业务链条上,云数据中心将成为数据枢纽,并通过Web服务(API)快速向第三方终端交付,在媒体内容数据业务链条上,自动内容识别技术(ACR)将是桥接电视内容与网络关联服务的桥梁,并支持触发互动、数据监测,与网络关联成为平台,2. 实时电视监测,持续不断更新的参考库(电视、广告、电影等),3. 通知给APP提供商的CMS管理系统,4. APP实时更新,1. 大规模实时电视监测网络,精准广告产品链接社交媒体 电商折扣,电视播出节目、广告,频道识别服务平台,终端,终端,终端,识别请求,识别结果,统计及数据挖掘,收视习惯数据,增值业务,数据,精准推送,项目公司提供,智能电视厂商及第三方提供,在媒体内容数据业务链条上,自动内容识别技术(ACR)将是桥接电视内容与网络关联服务的桥梁,并支持触发互动、数据监测,与网络关联成为平台,