1、大数据与我们的生活 关于大数据的阅读交流,开篇引言:毕达哥拉斯“万物皆数”,2500年前,古希腊哲学家毕达哥拉斯曾提出过“万物皆数”的哲学观,认为:数字是世界的本质,并支配着人类社会乃至整个自然界。-毕达哥拉斯定理-数字与美,黄金分割数:0.618,等。,今天,随着互联网、物联网等技术的广泛应用,我们的世界真正进入了 “万物皆数 数即万物” 大数据时代,内容提要,内容一:大数据知识ABC为使大家更好地理解今天的讲课内容,先介绍一些有关大数据的基本知识,如:什么是大数据,大数据究竟有多大,大数据来自哪里,大数据又有什么作用?还有经常听到的一些用语的含义,如:传感器,RFID(射频识别标签),物联
2、网,云计算,互联网+,智慧城市,三网融合,等。,内容二:大数据与小数据的比较既有大数据这个概念,是不是还有“小数据”呢?大数据与小数据有什么不同呢?大家知道,统计是专门与数字打交道的一个行当与一门科学,顺便讲一讲统计的那些事吧;阿拉伯数字是我们经常使用的,阿拉伯数字是阿拉伯人发明的吗?,内容三:大数据与我们的生活悄然来临的大数据时代,你觉察到了吗?大数据正在改变着我们的生活:从购物到交通,从食品到环境,从医疗到教育;从变革社会管理方式到聆听我们的身心,大数据将会怎样影响我们的未来社会?,大数据知识ABC,1、什么是大数据?,大数据,是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理
3、的数据集合。,维基百科大数据是难以用现有的数据库管理工具处理的,兼具海量特征和复杂性特征的数据集成。大数据带来的挑战包括获取、存储、搜索、共享、分析和可视化。,大数据(作者:美国KIT Solutions软件公司中国事务主任涂子沛)那些大小已经超出了传统意义上的尺度,一般的软件工具难以捕捉、存储、管理和分析的数据。并没有普遍适用的定义来确定具体多大的数据才能称为大数据。一般认为,大数据的数量级应该是“太字节”的。,大数据时代(作者:维克托迈尔-舍恩伯格)大数据把数学算法运用到海量的数据上来,做出分析,并对事情发生的可能性做出洞见。与传统数据比较,大数据的数据量更多,有时甚至是纷繁混乱无序,将注
4、意力更多地放在相关关系的发现和使用上。,IBM3V:大量化(Volume)、多样化(Variety)和快速化(Velocity)。大数据的4V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。大数据在政府统计中的应用研究(国家统计局)是指汇集不同数据源,通过采用现代信息技术和架构能够高速分析处理的、具有高度应用价值和决策支持功能的多种类型的数据及其技术集成。,2.大数据有多大?,衡量大数据的大小通常以“太字节(TB)”或者“拍字节(PB)”为单位量级。 1个太字节数据量有多大呢?为1024G个字节或10.7亿个字节。数据的存储单位从小到大的次序为
5、: KBMBGBTBPBZBYB(千字节兆字节吉字节太字节拍字节泽字节尧字节),每提高一个量级的存储量扩大1024倍。,2.大数据有多大?,千字节(KB):1个KB是1024字节,一页A4纸上小4号的汉字大概是2千字节,1千个汉字;兆头节(MB):一首普通MP3格式的流行歌曲大概是4兆字节;吉字节(GB):一部电影大概是1吉字节;太字节(TB):美国国会图书馆所有登记的印刷版书本的信息量为15太字节;,拍字节(PB):谷歌每小时处理的数据为1拍;艾字节(PB):1个EB是1024PB,相当于13亿中国人人手一本500页的书加起来的信息量;泽字节(ZB):1个ZB是1024EB,截至2010年,
6、人类拥有的信息总量大概是1.2泽字节;尧字节(YB):1个YB是1024ZB,超出想象,无法描述与比喻。,3.大数据来自于哪里呢?,第一个来源,是传感器。,重要名词:传感器,传感器,是“能感受规定的被测量件并按照一定的规律转换成可用信号的器件或装置,通常由敏感元件和转换元件组成”。,任何可以监测、数据化、传输的工具,都是传感器。如手机、手环、大街上的探头等,都是传感器。,射频识别标签(Radio Frequency Identification,RFID),生活中常见传感器:手机、探头、天眼、门卡、饭卡、IC卡、银行卡,等等。,2005年,全世界使用的传感器只有1.3亿个,到2010年就发展到
7、了30亿个,目前大概有45亿个。预计到2030年将有100万亿个传感器连接在物联网上。,重要名词:物联网,物联网,是在互联网的基础上,将其用户端延伸和扩展到任何物品与物品之间,进行信息交换和通信的一种网络概念。通过射频识别标签(RFID)、红外感应器、全球定位系统、激光扫描器等信息传感设备,按约定的协议把任何物品与互联网相连接,进行信息交换和通讯,以实现智能化识别、定位、跟踪、监控和管理的一种网络概念。物联网的核心和基础仍然是互联网,是在互联网基础上的用户端延伸和扩展到物品层面。,环境监测物联网,第二个来源,是互联网。 第三个来源,是社交网络。 第四个来源,是政府统计部门以及各专业部门、金融部
8、门、科研等的数据。,4.大数据又有什么作用呢?,数据的价值人类对于数据价值的认识大致可分为三个阶段:一是以经验科学为基础判断数据价值的“小数据”时代;二是以计算机为基础追求数据精细化时代,也就是从小数据向大数据过渡时期;三是以系统性数据资源为基础深入挖掘数据关系的大数据时代。,没有调查,就没有发言权毛泽东我们信靠上帝。除了上帝,任何人都必须用数据来说话。爱德华戴明(19001993)美国著名的管理学家、统计学家,大数据的价值从大数据产业链看:第一层是数据层,主要是数据的采集、存储、传输、扩散;第二层是信息层,把数据背景融入数据,形成价值密度更高的信息;第三层是知识层,在信息基础上进行提炼,形成
9、有价值的知识。,通过分析大数据,寻找相关性,发现规律性,增强预见性,带来 “大知识” “大科技” “大利润” “大发展”大数据被誉为未来社会的新“石油”和新“金矿”。,大数据挖掘与应用的 经典案例,案例1:尿布与啤酒放在一起卖,案例1:尿布与啤酒放在一起卖,在美国,沃尔玛公司曾在对商品进行市场类组分析的过程中意外发现:跟尿布一起购买最多的商品竟是啤酒!后经研究发现其中原委:美国的太太们常叮嘱她们的丈夫下班后为小孩买尿布,而丈夫们在买尿布后又随手带回了两瓶啤酒。既然尿布与啤酒一起购买的机会最多,沃尔玛就将啤酒和尿布并排摆放在一起,结果是尿布与啤酒的销售量双双增长。,案例2:美国每日网上价格指数
10、预测国际金融危机爆发,案例3:向高中女生邮寄婴儿服装和孕妇服装的优惠券,2012年2月16日,纽约时报刊登了一篇题为这些公司是如何知道您的秘密的的报道。文中介绍了这样一个故事:一天,一位男性顾客怒气冲冲地来到一家折扣连锁店向经理投诉:该店竟然给他还在读高中的女儿邮寄婴儿服装和孕妇服装的优惠券。在随后父亲与女儿进一步沟通发现,自己女儿真的已经怀孕了!父亲又回到商店向经理道歉。,案例3:,这一故事,经常被作为大数据挖掘能力的典型例证。但有观点认为,这一案例体现出的并不是大数据的“聪慧”,而是大数据的“傲慢”,个人隐私并没有得到足够尊重。产生了数据安全问题:要防止数据被滥用。,案例4:太阳能发电与智
11、能电表,在德国,为了鼓励利用太阳能,在家庭安装太阳能板,当家庭的太阳能有多余电的时候还可以买回来。通过电网每隔五分钟或十分钟收集一次数据,收集来的这些数据可以用来预测客户的用电习惯等,从而推断出在未来2到3个月时间里,整个电网大概需要多少电。有了这个预测后,就可以向发电或者供电企业购买一定数量的电。像期货一样,如果提前买就会比较便宜,买现货就比较贵。,重要名词:数据废气(Data Exhaust),数据废气,是用来描述人们在网上留下的数字轨迹的,是用户在线交互的副产品,包括浏览网页、停留时间、鼠标光标停留的位置、输入信息等。数据废气可以被循环利用,用来改善服务和开发新的服务。电商利用数据废气进
12、行商品的:网络推荐,大数据的重要作用,第一,对大数据的处理分析已成为新一代信息技术融合应用的结点。第二,大数据是信息产业持续高速增长的新引擎。第三,大数据利用是提高核心竞争力的关键因素。第四,大数据将成为降成本、增效益、促转型、稳增长的新途径与新动力。第五,大数据将促进统计方法、科学研究与实验的方法手段发生重大改变,成为政府统计收集数据的第二轨。,麦肯锡全球经济研究院报告:2013年中国互联网经济(iGDP)已占到国内生产总值的4.4%以上,预计从2013年至2025年,互联网将帮助中国提升国内生产总值0.3至1个百分点。贵阳大数据交易所2015年中国大数据产业白皮书:预计到2020年中国大数
13、据产业市场规模将由2014年的767亿元扩大至8228亿元。,进度时间: 9:55(9:30+25),大数据VS小数据,1.小数据定义,小数据,是指在传统技术和方法的条件下收集、处理和分析的数据。包括政府部门组织的统计调查,企业开展的市场调查,等。百度搜索:吕兰涛定义:“小数据(Small Data),或称个体资料,是指需要新的应用方式才能体现出具有高价值的个体的、高效率的、个性化的信息资产”。,2.大数据与小数据有什么不同呢?,首先,从数据的体量来看,大数据体量巨大,规模已经超出了在常规方法和时间内搜集、利用、管理和处理数据的能力。小数据体量则小得多。,2.大数据与小数据有什么不同呢?,其次
14、,从数据形态来看,传统的数据通常是结构化数据,结构化数据(行数据)是指存储在数据库里可以用二维表结构来逻辑表达实现的数据,大数据则是混合形态的数据。在大数据中,结构化数据占15%,更多的则是非结构化的数据,如图片、日志、音频、视频、地理位置等数据,这些数据大都是非结构化的。,2.大数据与小数据有什么不同呢?,第三,小数据是目标导向数据,价值密度较高。自古以来,一些重要数据都是由政府组织收集的,通常是目标导向数据,有非常明确的目的,有非常明确的价值。比如说我国的GDP核算,城乡住户收支抽样调查,CPI、PPI等价格抽样调查,都是围绕着具体的目标开展数据收集的。而大数据则是记录导向的,价值密度低。
15、仅仅是为记录数据,而不是为了得到或解释某个特定事件的数据。如交通摄像头里的记录。,2.大数据与小数据有什么不同呢?,第四,大数据即时产生,随时可用。数据本身在线上,不在你的计算机或移动硬盘中。小数据生产的时间长,从测量到可用,需要相当长的时间。小数据在计算机、年鉴、文本上。大数据的获取省略了抽样设计环节,基本不介入调查对象的行为,不直接与调查对象发生博弈,始终以观察者的角色出现,可以直接对整体进行分析。,2.大数据与小数据有什么不同呢?,第五,从数据占有主体来看,在传统社会里,政府部门拥有大多数公民数据。小数据拥有的主体是政府(包括政府统计部门和各专业部门)、企业、民间调查机构、科研机构等。大
16、数据则主要掌握在互联网公司手中,目前我国国内互联网三巨头BAT:百度、阿里、腾讯掌握了大数据的大部分。,3、大数据是怎样收集利用的?,对大数据的开发利用,只有具有技术能力的网络公司才能做到,通过网络爬虫在网络上抓取数据,然后经过数据清洗,进行数据挖掘分析,实现数据的价值。不具备大数据挖掘利用能力的一般个人或者企业、机构,通过向这些公司付费后购买数据和服务,这就是我们日益熟悉的云计算、云平台、云服务;未来的地方政府或许将不得不向私营部门购买数据。,重要名词:云计算(云平台、云服务),云计算(Cloud Computing),是基于互联网的相关服务的增加、使用和交付模式。云是网络、互联网的一种比喻
17、说法。美国国家标准与技术研究院定义:云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(网络,服务器,存储,应用软件,服务),只需投入很少的管理与成本,这些资源能够被快速提供。大数据时代:“自来水公司与用户的关系”,展开话题一: 统计的那些事 -数字起源与统计发展,人类早期的计数工具:,结绳记事,小石子计数,伏羲氏“制作八卦”计数工具,远古时代的结绳记事、刻木为号、小石头,都是计数的工具与计数的活动。人类神话时期:三皇五氏之伏羲氏:“制作八卦”,八卦是我国最早的计数文字,后来被星象家用来占卜”。 (柏杨,中国人史纲),黄帝时期:隶首作数,传说
18、,算盘和算数是黄帝大臣隶首发明创造的。据说,至今在农村还流传着隶首当初算账时发明的中国式的“阿拉伯”字母。这十个字母的写法:、十。比如:三斤八两的写法“”。,统计的那些事,自古以来,数据在管理国家方面作用重大。齐国管仲:不明于计数而欲举大事,犹无舟楫j而欲经于水,险也。,统计的那些事,秦国商鞅:“欲国强知十三数”仓口之数,壮男、壮女之数,老弱之数,官士之数,以言说取食者之数,利民之数,马、牛、刍、稿之数。,古代统计制度,鱼鳞册,黄 册,统计的那些事,明清时期统计机构中央行政机构中直接对皇帝负责的六部中的户部,其重要的职能之一就是掌管统计事务。,清末光绪年间统计清廷设宪政调查局,负责国家统计事务
19、,开展了部分统计活动,以外贸统计较为完备。,统计的那些事,民国时期统计上世纪30年代初,国民政府正式设立和开展初具现代意义的统计机构和统计活动,开始传播和引入西方统计思想与方法。,新中国统计建国后,特别是改革开放后的30多年,我国统计事业在多个方面都实现了前所未有的大转型、大发展,计划经济条件下形成的统计体系已被打破,适应社会主义市场经济体制的统计体系初步形成。,统计的那些事,统计主体体系化:政府综合统计、部门统计、企业统计和民间统计;统计调查方法多元化:抽样调查、普查、全面报表、典型与重点调查、科学测算;统计核算方法国际化:MPS核算体系向SNA核算体系转换,与国际标准基本衔接的国民经济核算
20、体系;统计生产:信息化、网络化、利用大数据;统计法制化。,统计的那些事,统计部门不仅为各级党政领导进行宏观管理和科学决策提供了大量的统计数据和分析资料,同时还为社会各界提供了较为广泛的统计信息与咨询服务。今天的统计,真正成为了国家管理的重要工具,并日益走进了大众的生活。,统计的那些事(统计科学),统计科学300年历史随着人类统计实践的积累,特别是资本主义经济的发展,为满足经济社会发展对统计的需求,统计科学与技术应时而生。17世纪以来,先后经过了威廉配第的政治算术与赫尔曼康令的国势学古典统计学时期,雅克凯特莱把古典概率论引入统计的近代统计学时期,数理统计学与抽样调查广泛运用的现代统计学时期。统计
21、这个由多个专业和学科交叉融合中发展起来的科学,成为当今人类运用十分广泛的一门科学。,统计误差与平均数的困惑,任何一个统计指标的数据都有一个客观存在的真值,可称之为X,真值在理论上是无法企及但又是客观存在的。如果把统计调查所得到的数据称之为x,x-X,称为统计数据的误差,x就是对X的估计。统计所做的是在既定的条件下尽量缩小误差而已,使x尽量接近X,或在可容忍的误差范围内取得统计数据。统计误差就像人行走在阳光下的影子,人走到那里,影子就跟随到那里。,展开话题二: 是谁发明的阿拉伯数字? -阿拉伯数字的演化与传播,常用数字形式:,阿拉伯数字: 1、2、3、4、5、6、7、8、9、0 中文数字: 一、
22、二、三、四、五、六、七、八、九、十、百、千、万、亿 中文大写数字:(会计用) 壹、贰、叁、肆、伍、陆、柒、捌、玖、拾、佰、仟,罗马数字(1-10): I、II、III、IV、V、VI、VII、VIII、IX、X,是谁发明的阿拉伯数字?,大约公元1世纪时,古印度发明了一种数字系统,后传播到波斯,得到改进;后又传到阿拉伯国家,得到极大改进,是今天我们使用的阿拉伯数字的前身。十字军东征,把阿拉伯数字带到了地中海东部;公元1000年的时候,罗马教皇倡导使用阿拉伯数字;12世纪,介绍阿拉伯数字的书籍被翻译成拉丁文,传播到整个欧洲,欧洲人只知道这些数字是从阿拉伯地区传入的,所以便把这些数字叫做阿拉伯数字。
23、,是谁发明的阿拉伯数字?,后来,阿拉伯数字又从欧洲传到世界各国,阿拉伯数字的广泛使用,开启了算术的腾飞。阿拉伯数字传入我国大约是在13到14世纪。由于当时我国有一种数字叫“筹码”(多用竹子制成),写起来比较方便,所以那时阿拉伯数字在我国没有得到广泛推广运用。直到20世纪初,随着我国对西方数学成就的引进与应用,阿拉伯数字在我国逐渐推广开来。,数字“0”的故事,“0”这个数字是到了印度笈j 多王朝(公元320550年)时期才出现的。公元4世纪印度人完成的数学著作太阳手册中,开始使用“0”这一符号,只不过当时是实心的小圆点“”。其意是“空”或“空白”,这与印度的文化与宗教思想有关。,在罗马数字中没有
24、“0”这个符号,当它传入罗马时,罗马教皇凶残守旧,他不允许使用这个符号。有一位罗马学者在笔记中记载了关于使用“0”的一些好处,就被教皇剁了手。,进度时间: 10:10(9:55+15) 结束时间:11:00,大数据与我们的生活,(一)大数据改变传统生活方式,1、网络购物。网上购物,是指通过互联网检索商品信息,并通过电子订购单发出购物请求,购买人填上信用卡号码预付金额,厂商通过邮购或是通过快递公司送货上门,购买人检查商品合格确认成交后,通过第三方支付(支付宝)付款的购物方式。特点:选择多、少费力、节省钱、节省时间一般省钱10%到20%,多的省50%。,“不出自家门,淘尽天下货”,重要名词:“互联
25、网+ ”传统产业的信息化,“互联网+”=“互联网+各个传统行业”,是利用信息通信技术以及互联网平台,让互联网与传统行业进行深度融合,充分发挥互联网在社会资源配置中的优化和集成作用,将互联网的创新成果深度融合于经济、社会各领域之中,提升全社会的创新力和生产力,形成更广泛的以互联网为基础设施和实现工具的经济发展新形态。当前大众最熟悉的电子商务、互联网金融、在线旅游、在线影视、在线房产等行业都是“互联网+”的杰作。信息化;从“新四化”同步到“新五化”同步。,CCTV-4报道:,“互联网+”的事例:事例一:互联网+猪;(养猪企业通过互联网卖猪,市民买猪肉)商家:猪肉涨价,先卖小猪,筹集资金;消费者:猪
26、肉涨价,先购买期货。事例二:互联网+甜柚;(浙江淘宝村),截至2014年底,中国网购人数已达3.6亿人,占全国人口比例近1/4,已连续第二年成为全球最大的网络零售市场,2014年全国网上零售额高达27898亿元,同比增长49.7%,占全国社会消费品零售总额的10.6%。其中限额以上单位网上零售额4400亿元,增长56.2%。大大高于当年全国全年社会消费品零售总12.0%的增速;消费对当前我国经济的贡献率提高到了60%。,(一)大数据改变传统生活方式,2、餐桌上的安全。从田间到餐桌的安全监控。促进大数据发展行动纲要十项工程:政府数据资源共享开放工程、国家大数据资源统筹发展工程、政府治理大数据工程
27、、公共服务大数据工程、工业和新兴产业大数据工程、现代农业大数据工程、万众创新大数据工程、大数据关键技术及产品研发与产业化工程、大数据产业支撑能力提升工程、网络和大数据安全保障工程。,(一)大数据改变传统生活方式,3、大数据与环境监测。2015年7月26日,国务院办公厅下发关于印发生态环境监测网络建设方案的通知国办发201556号“(八)构建生态环境监测大数据平台。加快生态环境监测信息传输网络与大数据平台建设,加强生态环境监测数据资源开发与应用,开展大数据关联分析,为生态环境保护决策、管理和执法提供数据支持。”,(一)大数据改变传统生活方式,4、大数据与智慧交通。,4、大数据与智慧交通。,滴滴打
28、车颠覆了路边拦车方式。利用移动互联网将线上与线下相融合,从打车初始阶段到下车使用线上支付车费,最大限度优化乘客打车体验,让司机根据乘客目的地情况“接单”,节约司机与乘客沟通成本,降低空驶率,节省司乘双方资源与时间。,4、大数据与智慧交通。,目前,滴滴打车已覆盖全国400多个城市。未来的滴滴打车还能够为用户设计智能出行方案,当你输入出发地和目的地,系统便会给你方案:是打车、拼车、公交还是地铁,哪种搭配组合更经济方便。,通过大数据技术系统缓解拥堵难题。公交站点的电子指示牌,告诉大家下一趟公交什么时候能到,可以非常精准。据报道:四川绵阳市通过大数据系统,交通拥堵缓解20%以上。,4、大数据与智慧交通
29、。,解决停车难问题。停车难是目前城市普遍存在的问题,怎么找到有效停车位?深圳等15个城市利用传感技术解决停车难的问题,通过采集停车大数据,可以通过手机找车位,方便了市民出行。,汽车保养维修更便捷。车主可在家里通过手机APP或电话,找人上门来做保养;还可以通过手机APP查看爱车行驶轨迹,车内使用环境以及汽车行驶耗时、油耗、功率、行驶时间、里程等相关数据。,大数据监控交通违章,最近(2015.08),由“ 乐行南昌”发布的“大数据版南昌最易违章地点排行榜”,公布了南昌市机动车违法行为查获量与重点地段:TOP1:外地车闯禁行4.9万起,最易发生该违法行为的路段:阳明路、八一大桥;TOP2:违法变道3
30、.5万起,最易发生该违法行为的路段:八一大道南京西路口、八一大道孺子路口、八一大道的民德路口、洪城大市场门口、站前西路路口;,TOP3:黄标车闯禁行3万起,最易发生该违法行为的路段:南昌大桥;TOP4:违法停车1.3万起,最易发生该违法行为的路段:南昌西站大街北广场、凤凰中大道;TOP5:逆行6300起,最易发生该违法行为的路段:农夫路(进贤县的一条单行道)。,(一)大数据改变传统生活方式,5、大数据与医疗健康。目前,全国有2亿人次住院,已经诊断出的慢病发病人数有2.6亿,其中高血压1.6亿,糖尿病1.14亿,还有未被发现和诊断的。如果把这些患者的医药数据、患者的用药数据,包括电子监管码的销售
31、、医保数据,汇集到一个综合平台,当输入某一个患者的身份证号,可以知道他得了什么疾病、最近用药情况、健康状况等,就可以把社会医疗资源合理分配,而不是任何一个病都要到大医院去排队。,就医160平台,国内知名互联网医疗服务平台就医160平台,起源于深圳,并迅速发展到其他城市,现已接入全国278个城市、2210家大型医院,医生资源超过30万,实名注册用户超过1400万。该平台通过开发使用手机APP就医预约挂号,深圳平均每日有3万以上的患者预约挂号。南昌:南昌大学一、二附院,江西中医学院附属医院等加入就医160平台。,(一)大数据改变传统生活方式,6、大数据与教育学习。互联网在线教育就是在网络上学习,即
32、通过课件、视频等学习,实时互动讨论问题。互联网在线教育是传统教育模式的大变革,这种教育模式突破了时空界限,不需要住校、上教室,学生可以随时随地上课。最近几年,慕课(MOOC大型开放式网络课程)兴起,2012年美国的顶尖大学陆续设立网络学习平台,Coursera、Udacity、edX三大课程提供商在网上提供免费课程。,6、大数据与教育学习。,美国斯坦福大学的Coursera平台汇集了全世界有7000多门优秀课程,全世界最好的老师在互联网上PK,只要讲的不对,立马就有人指出;受此影响,国内北大、清华等知名大学纷纷加入慕课平台,推出多门免费课程,受到世界各地学生的欢迎。,互联网教育通过大数据监测学
33、生的学习行为,了解每一封教师发出的邮件带来的学生们的反馈。对知识性的内容,人们不再需要传统意义上的老师,老师的职责从传道授业变成解惑,知识的获取变得以学生为中心。,可汗学院(Khan Academy)与 萨尔曼可汗,可汗学院,是由孟加拉裔美国人萨尔曼可汗,创立的一家教育性非营利组织,利用网络影片进行免费授课,现有关于数学、历史、金融、物理、化学、生物、天文学等科目的内容,教学影片超过2000段,机构的使命是加快学生的学习速度。,7、大数据与游乐生活。,K歌手机唱吧手机唱吧,是一款免费的社交K歌手机应用。这款应用内置混响和回声效果,可以将你的声音进行修饰美化。应用中除提供伴奏外,还提供了伴奏对应
34、的歌词,K歌时可以同步显示,并且能够像KTV一样可以精确到每个字。唱吧提供有趣的智能打分系统,所得评分可以分享给好友PK。,7、大数据与游乐生活。,唱吧特点: 1、打开就唱,部分歌曲免费唱; 2、已经点过的歌以后无需联网即可演唱,省流量; 3、自动混响和回声效果,可媲美KTV的K歌效果; 4、保存录音时,完美同步你的声音和伴奏; 5、带上耳机,即时听到自己唱的声音; 6、可上传到唱吧并同步分享至你的微博、QQ空间或者人人网。,7、大数据与游乐生活。,在线旅游依托互联网,以满足旅游者的信息查询、产品预定及服务评价。包括航空公司、酒店、景区、租车公司、海内外旅游局等旅游服务供应商及搜索引擎、OTA
35、、电信运营商、旅游资讯及社区网站等在线旅游平台。与传统旅游产业以门店销售的方式形成巨大差异,被旅游从业人士称之为“在线旅游”。核心:提供旅游相关信息、提供行程安排预订服务的功能。,7、大数据时代的游乐生活。,三网融合是指电信网、广播电视网、互联网三大网络通过技术改造,其技术功能趋于一致,业务范围趋于相同,网络互联互通、资源共享,能为用户提供语音、数据和广播电视等多种服务。三合并不意味着三大网络的物理合一,而主要是指高层业务应用的融合。,三网融合的应用十分广泛,遍及智能交通、环境保护、政府工作、公共安全、平安家居等多个领域。手机,可以看电视、上网。电视,可以打电话、上网。电脑,可以打电话、看电视
36、。三者之间相互交叉,形成你中有我、我中有你的格局。看电视、打电话、上网一根线搞定,(二)大数据变革社会管理方式,1、监控舆情,打击犯罪,强化社会综合治理。收集数据途径:网上聊天、发帖;身份证登记:宾馆住宿、乘火车飞机;手机;交通探头;天眼;网络;,南昌市“天网工程”,据报道:南昌市自2009年启用“天网工程”以来,共协助公安机关查处刑事案件2129起,协助查处治安、交通事故等案件4893起,抓获各类违法嫌疑人5094名,为群众查找失物1340件,寻找迷路老人425人、儿童219人,为群众服务3496次,挽回经济损失4012余万元。,(二)大数据变革社会管理方式,2.避免国家福利滥用,促进社会福
37、利公平。保障性住房应该给谁住?“低保”应该给谁“吃”?医保卡上的钱是否被套取或虚报医疗费用?,(二)大数据变革社会管理方式,4.大数据与官员个人财产和重大事项报告。房产:不动产物联网;收入:银行联网、银行卡交易信息;出国:外事办、海关联网信息(护照);重大疾病:医院联网信息;婚姻:民政厅联网信息。,(二)大数据变革社会管理方式,5.征信体系建立与诚信社会建设。社交数据、资产变动、性格爱好、婚姻状况等一系列信息,都可成为全面描述个人生存、生活、工作的信用大数据,为每个人描绘出信用“全画像”。个人信用卡还款、手机、家庭有线电视、水电气欠费、交通违章等情况,都会成为个人征信的数据。,阿里小微信贷面对
38、大量一无规模、二无报表、三无信用的小微企业,通过大数据分析客户信贷行为,从2010年开始,累计为超过70万家小微企业投放贷款超过1700亿元,不良率却只有0.87%,低于银行平均水平。通过大数据掌握了企业的信誉度。,(二)大数据变革社会管理方式,6.大数据与干部考核人才评价发现。通过收集社交、博客、微博、微信、发帖、聊天记录数据,挖掘个人政治观、价值观、是非观、遵纪守法、道德取向等信息;通过收集冲红灯、醉驾、支付欠费的个人信用数据,可作为公务员招录考察、考核、提拔任用、评先的重要依据。,技术职称评定通过查询学术成果收藏网站,就能知道申报者在那一年、在什么学术刊物上发表过哪些学术文章,文章影响力
39、如何(下载数、引用数);通过百度搜索,可知申报者在专业领域获得过何种奖励,出版过哪些学术著作。大数据能全面客观地评价技术人员的专业水平与能力。,(三)大数据探测人的身心世界,1.监控健康情绪,量化身心。美国有一个叫克里斯丹西的人:身上连接大约700个传感器,随时随地了解自己的一举一动和情绪起伏,从而让身心达到更佳状态。Pebble智能手表、谷歌眼镜、Body Media臂带和Blue心率监控器等可穿戴设备,记录自己的饮食内容、睡眠、运动、电子邮件使用、健康数据、旅行计划和照片等数据。以通过这些动态数据“知道什么该喝,什么该吃,什么时候该睡觉,什么时候该起床”。,(三)大数据探测人的身心世界,2
40、.复制一个虚拟的“你”。构造虚拟的大数据人生命的虚拟延伸3D+智能,我们即数据,英国金融时报杂志( 2015年7月)我们即数据,文章写道:你今天买了什么?你喝的、消化的、排泄的、吸入的,关注的、阅读的,对着微笑的、交谈的、怀念的、愤怒的、喜欢的,把这些日常数据跟应用程序绑在一起,很容易就可以预测、取悦、复制你。把这种机器智能跟智能3D绘图绑在一起,就可以复制一个“你”。,这看上去很恐怖,但你的复制品不会杀了你,只会让你去买一件衬衫。“以铜为镜,可以正衣冠;以史为镜,可以知兴替;以人为镜,可以知得失”,通过大数据复制的虚拟“你(我)”,可以实现对自我的反观与自省。,(四)大数据与我们的未来社会,
41、1.人类将迈向智能化时代。互联网、物联网、能源互联网技术、云计算、大数据技术的广泛应用,将催生智慧城市的建设与发展,如:电子政务、智能家居、智慧交通、无人驾驶汽车、智能机器人、3D打印等,人类将进入“智能一切”的社会。,智能时代生活情景预现:,有一个作者是这样描述智能时代生活的:“智能卫浴会为你自动调整洗浴水温,智能厨房会为你自动烹饪早餐;当你吃饭的时候,智能音箱会自动开启优美的音乐或者你打开电视,帮你自动拉上窗帘。无人驾驶汽车送你去上班;当你走进办公室的那一刻,智能桌子会立刻为你打开邮箱和一天的工作日程表。未来生活如果没有智能机器人,你将难以适应,就像现在如果没有互联网和手机的日子一样。”,
42、重要名词:智慧城市,智慧城市(智能城市),是运用信息和通信技术手段感测、分析、整合城市运行核心系统的各项关键信息,对包括民生、环保、公共安全、城市服务、工商业活动在内的各种需求做出智能响应。其实质是利用先进的信息技术,实现城市智慧式管理和运行,进而为城市居民创造更美好的生活,促进城市的和谐、宜居、可持续发展。,(四)大数据与我们的未来社会,2.人类将步入知识主义社会。社会制度演进大纲(李建德教授):“最稀缺的生产要素决定生产力的性质、从而决定经济制度”。劳动稀缺氏族社会;劳动保护能力稀缺纳贡社会;土地稀缺土地主义社会;资本稀缺资本主义社会;知识稀缺知识主义社会,并最终取代资本主义。,(四)大数
43、据与我们的未来社会,3.人类将迈向协作共享社会。当前,免费、协作、共享社会已经初现端倪,譬如:免费下载软件音乐电影、免费WiFi使用,互联网共享教育、共享知识、共享音乐、优步(Uber)拼车服务、P2P金融服务、共享住房等, 2014年,全球分享经济产生的收益达千亿美元级。,美国当代最著名的思想家杰里米里夫金在零边际成本社会一书中预言:随着通讯互联网、能源互联网、物流互联网、分布式太阳能、机器人、3D打印技术与智能制造的广泛运用,将推动零边际成本社会的形成,协作与共享将是这个社会的主要特征,越来越多的人从消费者转变成“产消者”,资源的所有权逐步让渡给使用权,资本主义的经济形态将从人类社会逐步淡
44、出。这是否与马克思提出的人类社会发展的最高形态共产主义社会有许多相似之处,甚至殊途同归?,(五)大数据与我们的困惑,1.大数据的广泛运用瓶颈多多。譬如:数据的标准化、存储技术,(五)大数据与我们的困惑,2.大数据全社会开放与共享难。数据孤岛:部门之间数据不共享、标准与口径不一致,不能衔接。2015年6月19日,国务院出台关于促进大数据发展的行动纲要 目标实现数据:共享、开放、安全,(五)大数据与我们的困惑,3.如何平衡数据开放与隐私保护。 如:美国的监听事件(棱镜门),斯诺登高中女生怀孕事件,(五)大数据与我们的困惑,4.数即万物、万物皆数,但数非万能。数据是重要的,但不是万能的。随着数据的增
45、长,“数据垃圾”也不断增长,成为扰乱人类数据认知能力、分析能力和应用能力的“数据困惑”。,数据有缺陷:1)数据具有欺骗性,如果有意对大数据造假的话,其危害性更大;2)数据具有片面性;3)数据具有依赖性。我们说过“数据会说话!”但是,数据的话语只有懂得数据的人才能听得到。同样一个数据,可能会发出多个声音,不同的人可能会听到不同的声音,其是非对错,需要加以辨别。数据之间的联系、矛盾与问题,需要研究人员加以揭示。离开了人,许多数据只不过是一个没有意义的符号。,小结:,大数据是一种资源,也是一种工具;它告诉你是什么,但不解释为什么;它指导人们去理解我们的世界,但有时也会引起误解。大数据的力量是那么耀眼,我们必须避免被它的光芒诱惑,并善于发现它固有的瑕疵。,两点简单的启示:,第一,未来的社会一定是一个需要不断学习的社会;第二,未来社会一定是一个需要诚信、友善和廉洁的社会。俗话说:“头顶三尺有神明,不畏人知畏己知”,唯物主义者认为这个世界上并不存在“神明”,但大数据将成为我们头顶上的“神明”。,大数据将成为权力监督的新工具。2015年2月14日,李克强考察北京、贵阳大数据应用展示中心时说:把执法权力关进数据铁笼,让是新市场行为无处遁形,权利运行处处留痕,为政府决策提供第一手科学依据,实现 “人在干,云在算”。,谢谢大家!,