1、,2018年12月6日,第3章 计算机数据,当次贷危机改变世界-中国怎么办,该书用利益分析法剖析次贷危机的, 对未来的经济走势进行了分析和展望,并对如何捍卫民族财富、使财富增值和解决经济难题、实现民族复兴提出了一些针对性的解决方案和建议,问题三:大学生如何学习?(学会自学) 转变学习态度(学习热情和兴趣是可以培养的) 转变学习方法(更多时候你是一个人的奋斗) 转变学习内容(要全方位的学习),思考,面试最看重什么?,做人、做事 专业、动手 学习、适应 团队、交际 英语、创新,1.子曰:学而时习之,不亦说(yu)乎?有朋自远方来,不亦乐乎?人不知而不愠(yn),不亦君子乎? 2.曾子曰:吾日三省(
2、xng)吾身:为人谋而不忠乎?与朋友交而不信乎?传不习乎? 3.子曰:温故而知新,可以为师矣。 4.子曰:学而不思则罔,思而不学则殆。 5.子曰:由,诲女知之乎!知之为知之,不知为不知,是知也。,论语十则论学习态度和学习方法,6.子曰:见贤思齐焉,见不贤而内自省也。 7.子曰:三人行,必有我师焉;择其善者而从之,其不善者而改之。 8.曾子曰:士不可以不弘毅,任重而道远。仁以为己任,不亦重乎?死而后已,不亦远乎? 9.子曰:岁寒,然后知松柏之后凋也。 10.子贡问曰:有一言而可以终身行之者乎?子曰:其恕乎!己所不欲,勿施于人。,提高交际能力: 个人形象(穿着得体、精神状态、学会微笑) 学会倾听(
3、不好意思,我插一句) 学会说话(真诚、得体、幽默、积极乐观、深度) 学会做事(认真、用心、不要拖、尽量完美) 打电话、写邮件、QQ、MSN交流、演讲、写作、嘴里不要含口香糖 做一个牛人,你就有更多的话语权,送给学生的话,3.1 数据表示 3.2 数据存储 3.3 数据运算 3.4 数据压缩* 3.5 数据纠正* 3.6 数据备份* 3.7 数据恢复* 3.8 数据仓库* 3.9 数据挖掘*,计算机数据,计算机之父是谁?计算机鼻祖是谁?,冯诺依曼,约翰阿坦那索夫,莫奇利和埃科特,帕斯卡,莱布尼茨,契克卡德,阿兰图灵,伏羲八卦,3.1 数据表示,1.数据表示的由来 手指、石子、绳结、算筹、珠盘、算
4、盘这种表示数据的方法缺点是什么? 计算机的发明(0、1)这种表示数据的方法缺点是什么? 云存储通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统,2.数字系统(数码系统) 非位置化数字系统:每个符号有一个值,与位置无关sk-1s2s1s0.s-1s-2s-l 非进位计数制它的值:n=sk-1 s1 s0 s-1 s-2 s-l例如:罗马数字系统的符号取值,重复相加、(小值)右加左减 MDC=1600 XIX=19 XVIII=18 2009=MMIX 20091209=?,位置化数字系统:符
5、号所占据的位置决定其表示的值(sk-1s2s1s0.s-1s-2s-l)b 进位计数制 b基数s位权它的值是:n= (sk-1bk-1+s2b2+s1b1+s0b0+s-1b-1+s-2b-2+s-lb-l)例如:12Decimal表示12Binary表示(1100)2或者1100BOctal表示(14)8或者14OHex表示(C)16或者CH A,B,C,D,E,F-数码,3.各种进制转换,10,2,8,16,整数除2余数逆序排列,小数乘2整数顺序排列,从低到高分组不足加零,8进制与16进制用2进制过渡,负数先补码再转换,ASCII及进制转换,10-2相互转换:(10-8/10-16) 整数
6、除以2余数逆序排列:用2去除十进制整数,可以得到一个商和余数,再用2去除商,又会得到一个商和余数,如此进行,直到商为零时为止,然后把先得到的余数作为二进制数的低位有效位,后得到的余数作为二进制数的高位有效位,依次排列起来 小数乘以2取整顺序排列:用2乘十进制小数,可以得到积,将积的整数部分取出,再用2乘余下的小数部分,又得到一个积,再将积的整数部分取出,如此进行,直到积中的整数部分为零,或者整数部分为1,此时0或1为二进制的最后一位。或者达到所要求的精度为止,2-8相互转换:(2-16) 把要转换的二进制从低位到高位每3位或4位一组,高位不足时在有效位前面添“0”,然后把每组二进制数转换成八进
7、制或十六进制即可 8-16相互转换:先转换成二进制,再转换成其它进制,【思考】有没有比上面的方法更快的?可以试试用凑数法。比如十进制数220转换成二进制,先按照27、26、25、24、23、22、21、20数字排序,即128、64、32、16、8、4、2、1,要凑220,把要用到的数字位置表示1,否则表示0,如128、64、16、8、4要用到,其它数字不用,所以220(11011100)2 例如:2012、0.625、0.8转换成16进制,4.数据的表示单位 位(bit):最小的数据单位,是二进制的一个数位 字节(Byte):用来表示存储空间大小的最基本单位 1Byte=8bits 1KB=1
8、024B 1MB=1024KB 1GB=1024MB 1TB=1024GB 1PBPetabyte1024TB 1EBExabyte1024PB 1ZBZettabyte1024EB 1YBYottabyte1024ZB,为什么硬盘没有500G,下载没有10M,字(Word):字长是指计算机在进行处理时一次 作为一个整体进行处理的二进制数的位数,具有这一长度的二进制数则被称为该计算机中的一个字 计算机按照字长进行分类,可以分为8 位机、16位机、32位机和64位机等 字长越长,那么计算机所表示数的范围就越大,处理能力也越强,运算精度也就越高,3.2 数据存储,为什么二进制能够表示出各种信息,1
9、775年4月18日,美军派出的侦察员在教堂的塔上点一个灯笼意味着英军从陆地进攻,两个灯笼从海上进攻。如果英军从陆地和海上同时进攻,怎么办?,为什么要用二进制存储数据 电路简单,易于表示 可靠性高 运算简单 逻辑性强,数据类型(多媒体) 数字 文本 音频 图像 视频,1.数值型数据的存储 定点数的表示: 所有数的小数点位置固定不变 数据本身所代表的值叫做真值 0/00正数、1/11负数 定点小数:将小数点固定在最高数据位的左边 定点整数:将小数点固定在最低数据位的右边,原码:正数的最高位为0,其它位保持不变;负数最高位为1,其它位保持不变 例如:13原码00001101,-13的原码100011
10、01 优点:转换非常简单,正负号将最高位置0或1 缺点:加减运算不方便,符号位不能参与运算,并且0的原码表示方法:+0的是00000000,-0的是10000000,反码:正数的最高位为0,其它位保持不变;负数则最高位为1,其它位按位求反 例如:13的反码是00001101,-13的反码是11110010 符号位虽然可以作为数值参与运算,但计算完后,仍需要根据符号位进行调整 0的反码表示方法:+0的是00000000,-0的是11111111,补码:正数的最高位为0,其它位保持不变;负数则最高位为1,其它位按位求反后再加1 计算机表示整数最普遍的系统就是二进制补码记数法 例如:13是00001
11、101,-13是11110011 补码的符号可以作为数值参与运算,且计算完后,不需要根据符号位进行调整 0的补码表示方法是唯一的00000000,浮点数的表示:小数点在数据中的位置可以左右 移动的数据 N=2E D 其中,2是基数,E是阶码(指数),D是尾数,例如:写出十进制数5.75的浮点数表示法S=0 5.75=(101.11)2=(1.0111)222,例如:写出十进制数-161.875的浮点数表示法S=1 161.875=(10100001.111)2=(1.0100001111)227,2.文本存储 计算机中,对非数值的文字和其他符号进行处理时,要对文字和符号进行数字化,即用二进制编
12、码来表示文字和符号,ASCII(美国信息交换标准码): ANSI编码是一种扩展的ASCII码,使用8个比特来表示每个符号。ANSI码开始的128个字符的编码和ASCII码定义的一样,只是在最左边加了一个0。例如,在 ASCII编码中,字符“a”用1100001表示,而在ANSI编码中,用01100001表示 ANSI码还可以表示另外的128个符号,如版权符号、英镑符号、希腊字符等 世界上还存在着另外一些对ASCII码进行扩展的编码方案,ASCII码通过扩展甚至可以编码中文、日文和韩文字符。不过令人遗憾的是,正是由于这些编码方案的存在导致了编码的混淆和不兼容性,Unicode(统一码、万国码、单
13、一码): Unicode采用16位编码,每一个字符需要2个字节。编码范围从0000hFFFFh,Unicode最多可表示65536个不同字符 开始的128个字符编码0000h007Fh与ASCII编码字符一致。从原理上来说,Unicode可以表示现在正在使用的任何语言中的字符。对于国际商业和通讯来说,这种编码方式是非常有用的,因为在一个文件中可能需要包含有汉语、英语和日语等不同的文字。并且Unicode还适合于软件的本地化,也就是针对特定的国家修改软件。使用Unicode,软件开发人员可以修改屏幕的提示、菜单和错误信息来适合于不同的语言和地区,GB2312-80: GB2312-80标准含有6
14、763个汉字,682个西文字符、图符。GB2312-80标准将汉字分成94个区,每个区又包含94个位,每位存放一个汉字,每个汉字就有一个区号和一个位号,所以也经常将国标码称为区位码。例如:汉字“青”在39区64位,其区位码是3964 在计算机系统中,由于机内码的存在,输入汉字时就允许用户根据自己的习惯使用不同的输入码,进入计算机系统后再统一转换成机内码存储 【思考】还有哪些编码?文本有哪些格式?文本处理工具有哪些?,3.音频存储 声音的表示方法是以一定的时间间隔对音频信号进行采样,并将采样结果进行量化,转化成数字信息 通常使用采样频率、采样位数和采样声道数来表示声音,如常用44100Hz、16
15、位、立体声来录制声音,音质类似CD质量 常见的声音格式有CDA、WAV、APE、WMA和MP3(MPEG Layer 3) 【思考】音频有哪些格式?有哪些播放器?各种格式如何进行转换?,4.图像存储 位图图像(bitmap)也称为点阵图像或者绘制图像,由无数像素点组成,这些点可进行不同的排列和染色以构成图像。但位图图像尺寸太大,不方便在互联网上传播,而且放大时,给人的感觉较粗糙 矢量图是根据几何特性来绘制图形,矢量可以是一个点或一条线,矢量图只能靠软件生成,文件占用空间较小。这种类型的图像文件包含独立的分离图像,可以无限制地重新组合。矢量图形最大的优点是无论放大、缩小或旋转等都不会失真,缺点是
16、难以表现色彩层次丰富的逼真图像效果,表3.3 常见的图像格式,真彩色使用24位来编码一个像素,用三原色RGB(红red、绿green、蓝blue)来表示各种颜色,真彩色可以编码16777216(224)种颜色,表3.4 部分真彩色,索引色(调色板色)思想:为节约存储,把图像中使用的颜色与一个颜色表对应起来,索引色常使用16色、32色、64色、128色或256色等,但最多不得超过256色。图像互换格式GIF使用索引色模式 【思考】有哪些制图工具?抓图工具?格式如何转换,5.视频存储 视频是图像在时间上的表示(帧),是随空间(单个图像)和时间(一系列图像)变化的信息表示。每一幅图像或帧被转化成一系
17、列位模式并存储 数字视频领域中,最常用的存储方式有:硬盘、直连式存储、网络连接存储、存储区域网络、SAN+NAS、云存储 【思考】视频有哪些格式?有哪些播放器?如何进行转换?,1.逻辑运算,3.3 数据运算,0假、1真 非(NOT):是输入的反转 与(AND):输入都为1才是1,否则是0 或(OR):输入都为0才是0,否则是1 异或(XOR):输入相同是0,否则是1 如果a=10011000,b=00101010,则not a=?,a and b=?, a or b=?,a xor b=?,2.移位运算,逻辑移位运算:(对无符号数操作) 逻辑右移:右边丢弃左边补0 11001011 1 =01
18、100101 逻辑左移:左边丢弃右边补0 11001011 2 =00101100 循环右移:把每一位向右移动一个位置,最右位成为最左位 10110111循环右移三位:11110110 循环左移:把每一位向左移动一个位置,最左位成为最右位 10110111循环左移三位:10111101,算术移位运算:(对有符号数操作) 算术左移:算数移位和逻辑移位是相同的 00110101 1 =00011010,符号位为零,用零填充 算术右移:算数右移时,缺位用符号位填充,而不是用零填充 10110101 1 =11011010,符号位为一,用一填充,3.算术运算 (1)整数的加减运算 可以对整数用二进制补
19、码形式进行加减运算。对于减法,可以转换为加法,如, ,这里的表示B的补码 二进制加法运算规则和十进制加法运算规则类似,把两个数从右到左对齐各列,然后先加右边的列,如果有进位,放到下一列相加,不过最后一列的进位会被丢弃。加减运算看似简单,往往容易出错,要考虑加减结果是否上溢和下溢,【方法一】 a=a+b b=a-b a=a-b,【面试题】把a和b两个值进行交换,不用中间变量,压缩类型:无损压缩、有损压缩 压缩类似:文字、文本、图像、音频、视频,3.4 数据压缩*,引言 块编码 线性块编码 循环码 校验和,3.5 数据纠正*,GHOST Windows系统还原,3.6 数据备份*,回收站、格式化
20、EASYRECOVERY、FINALDATA,3.7 数据恢复*,数据仓库是决策支持系统(dss)和联机分析应用数据源的结构化数据环境 研究和解决从数据库中获取信息的问题 它的特征在于面向主题、集成性、稳定性和时变性,3.8 数据仓库*,Data Mining一种透过数理模式来分析企业内储存的大量资料,以找出不同的客户或市场划分,分析出消费者喜好和行为的方法 数据挖掘能做以下7种事情: 分类、估值、预言、聚集 相关性分组或关联规则 描述和可视化 复杂数据类型挖掘(Text, Web ,图形图像,视频,音频等),3.9 数据挖掘*,课外作业题,1.数字、文字、图像、音频和视频是怎么压缩的? 2.数据错误是怎么检查出来的,然后是怎么纠正的? 3.实验:GHOST使用方法,