收藏 分享(赏)

第一章 XML基础.ppt

上传人:tkhy51908 文档编号:8762119 上传时间:2019-07-11 格式:PPT 页数:49 大小:737KB
下载 相关 举报
第一章  XML基础.ppt_第1页
第1页 / 共49页
第一章  XML基础.ppt_第2页
第2页 / 共49页
第一章  XML基础.ppt_第3页
第3页 / 共49页
第一章  XML基础.ppt_第4页
第4页 / 共49页
第一章  XML基础.ppt_第5页
第5页 / 共49页
点击查看更多>>
资源描述

1、第一章 XML基础,计算机科学与通信工程学院,XML笑话,问: 我该在什么时候使用XML? 答: 你可以在你的个人简历中写上你会 XML。,1.1 WEB语言,置标语言文档结构描述语言在书面自然语言中为了标识某些信息,而加入一些标记,这种书面自 然语言就可被称为置标语言;我们在这里解释的置标语言,实际上是一 种为了计算机处理而设计的置标语言,其中所用到的标记,往往使用代 表一定含义的文字或数字表示。 置标分为两种:程序性置标:用于文件在排版时指示文字如何编排,呈现的形式,如字体,字号等等;通用置标:描述文件的内容或结构,以置标来指定结构中 的元素,通用置标示例,置标语言是一种文档结构描述语言,

2、区别于程序设计语言,HTML的局限性,HTML专为WWW网页显示及浏览而设计的简易标记语言; 局限性:擅长布局、外观,缺乏对内容的描述DTD固定,词汇集有限,无法定义自己的扩展标签,1.2 eXtensible Markup Language,XML 是一套定义语义标记的规则,这些标记将文档分成许多部件并对这些部件加以标识。 元标记语言,即定义了用于定义其他与特定领域有关的、语义的、结构化的标记语言的句法语言。 Jon Bosak 曾经将Shakespeare(莎世比亚)的全部话剧翻译成了XML。这些剧本的全文都包括其中了,用XML 标记来区分剧名、每幕标题、舞台指导、对白、台词、旁白等。这样

3、做的好处?,1.2.1 XML的特征,结构化XML 描述的是结构和语义,而不是格式化文档内容与格式分开描述 可扩展性允许创建用户自己的DTD创建可扩展标签集;可使用附加标准,如XLINK,XSL等; 灵活性文档纯文本,可以在WWW浏览器中显示;允许自定义标签 自描述性,1.2.2 XML文档的“生命”,XML 在有用之前也需要程序和内容。因而对于数据看起来应该是什么样子的,光了解XML 本身还是不够的,这不光是一个规范所能解决的问题。 需要了解XML 文档是如何编辑的,处理程序是如何读取XML 文档并将其读取的信息传送给应用程序的,以及这些应用程序是如何处理数据的。,编辑器,编辑器可以是基本的

4、文本编辑器如Notepad这些编辑器并不真正理解XML可以是一个结构化的编辑器,它可将XML 文档显示为树状结构,语法分析程序和处理程序,XML 的语法分析程序(即所谓的XML 处理程序)读取文档并检查其中包括的XML 是否是结构完整的。 它还要确定文档是否合法,如果文档通过了测试,则处理程序就将文档转换为元素的树状结构,浏览器和其他工具,最后语法分析程序将树状结构或是树的节点传送给用户端应用程序。 如果这个应用程序是浏览器的话,数据就显示给用户。 其他程序也可以接受数据。例如,可将数据翻译成数据库的输入、或是要运行的Java 程序。,实验环境,XML Spy 提供了一个图形化的文档编辑手段,

5、可以将文本及其结构直观地显现给用户; 利用嵌入式的编译器很好的处理XSLT,并生成HTML代码,XML与HTML,XML是HTML的补充,而非替代品 XML将被用来描述、存储数据,而HTML则是用来格式化和 显示数据的。 XML是一种跨平台的,与软、硬件无关的,处理信息的工具 XML是被设计用来存储数据、携带数据和交换数据HTML:注重外观,用来形容展示页面的方法 ;XML: 注重内容, 通过DTD自定义标签,用来形容页面的内容,充分表达文件的具体内容例:,1.3 XML的应用领域,Chemical Markup Language (化学标记语言,简写为CML)中的MOL.DTD 文件中描述了

6、词汇表和分子科学的句法:其中包括chemistry(化学)、crystallography(结晶学)、solid state physics(固体物理)等词汇。它包括用于atoms(原子)、molecules(分子)、bonds(化学键)、spectra(光谱)等的标记。 MathML是一种用于数学方程的XML 应用,CML描述H2O的文档,H O H1 22 31 1,RSS,在许多网站,会看到这样的按钮 ,有的网站使用一个图标 ,有的同时使用两个,这就是典型的提供RSS订阅的标志,这个图标一般链接到订阅RSS信息源的URL,RSS,RSS,RSS 订阅,RSS订阅,RSS,RSS,RSS(

7、Really Simple Syndication)是一种描述和同步网站内容的格式,是目前使用最广泛的XML应用。RSS搭建了信息迅速传播的一个技术平台,使得每个人都成为潜在的信息提供者。发布一个RSS文件后,这个RSS Feed中包含的信息就能直接被其他站点调用,而且由于这些数据都是标准的XML格式,所以也能在其他的终端和服务中使用。,1.3 XML的应用领域,异构数据源之间的信息互通,XML数据是以纯文本格式存储的,提供了一种与软件和硬件无关的共享数据方法。,数据和现实的分离,例:计算机中存储的文档资料 doc.xml展示给客户看: customer.xsl,过滤机密信息展示给总经理看:m

8、anager.xsl,美化输出数据和现实的分离,均没有影响原有的文档,1.3 XML基本语法,XML是一个能够在各个领域进行设计的元标记语言.每个特殊的基于XML的标记语言成为一个XML应用程序 每个应用程序都有自身的词汇和语法,而这些语法和词汇都必须服从XML的基本规则 一个格式规范的XML文档应遵守W3C标准的语法要求,由三部分组成:可选的序言文档的主体可选的尾部,element,comment,PI,declaration,1.3 XML基本语法,杀死你的网页设计绝招胭脂虎590 如何在711白吃白喝无名氏120,1.3.1文档序言(PROLOG) 文件的开头,声明(DELARTION)

9、最简单的prolog仅包含一个声明,该声明指定了本文档为XML文档, XML的版本信息、内部编码方式等通用信息;例:其中: version 表明在数据中用到的XML标记语言的版本。该属性是必需的。 encoding 表明用于数据编码的字符集。(缺省为压缩的Unicode:UTF-8) standalone 表明文档是否引用了外部实体或者外部数据类型规范,如果没有,那么该属 性的值就设为“yes”。,UTF-8和GB2312,UTF-8:采用此种编码,标记以及标记的内容就可以使用中文,日文,英文,XML解析器就会识别这些标记,并正确解析标记的内容,因此,存储XML文件时,选择UTF-8编码保存

10、GB2312:标记以及标记得内容只可以使用ASCII字符合中文,保存时使用ANSI编码保存,1.3.1文档序言(PROLOG),规范除声明之外,PROLOG还可以包含一些对实体的定义及一些规范,这些规范规定了文档中哪些标签是合法的。,这些规范在DTD中声明,而DTD可以在PROLOG中定义,也可以在外部文件中定义,1.3.2 元素与属性,文档元素根元素,每个XML文档都必须有且仅有一个包括其他所有元素的元素元素tag,由描述元素的CDATA(character data,不被解析的字符数据)组成,它们用开始标注和结束标注界定;special,元素,所有元素都必须正确的关闭任何元素都有一个开始标

11、注和结束标注。 注意区别HTML空元素 元素之间不能交叉 元素名称(区分大小写)遵循一定的规则 以字母或下划线或冒号开头 不能为空,属性,有些情况下,可能要将某些额外的说明信息附加于元素 上,而这些信息与元素本身包含的数据内容又有所不同杀死你的网页设计绝招胭脂虎590 ,属性,同一个标记不能有两个相同的属性名区分大小写属性值是字符串XML 属性值必须加引号。大多数情况下是使用双引号,但是如果属性值本身含有一个引号,就需要使用单引号。,属性,如何确定信息存储在属性中还是作为元素内容呢?一般规则:如果信息描述元素,则将信息存储在属性中,另一方面,提供实际数据的应为元素内容。如 120,1.3.4

12、处理指令 PI,提供信息给XML解析器,使其能够正确解释文档内容 以结束例表示想用样式表来对文档显示进行美化,让浏览器去找一个名叫style.css的文档xml-stylesheet :PI目标,指PI准备的应用程序,1.3.3 注释,放在之间的区块,如注意: 输入时的全半角,1.3.4 特殊字符,在实际运用中,需要在XML文档内引用左尖括号,, if(a ,1.3.5 CDATA字段,在中的是置标,不在尖括号里的是字符数据 特例:在CDATA字段中出现的所有文本都是纯字符,不被解析 以结束唯一不被允许出现在CDATA字段中的是, 因此CDATA段不可嵌套 通常用于建立代码的脚本,如Javas

13、cript,杀死你的网页设计绝招胭脂虎590 如何在711白吃白喝无名氏120,RSS.XML,1.4 格式良好和有效,格式良好(well-formed) 每个元素必须有开始和结束标注 有且仅有一个根元素 正确的格式化空元素 开始和结束标注可以大写或小写,但必须匹配 元素必须正确的嵌套 属性值必须用引号括起来,如何在711白吃白喝无名氏12034 ,1.4 格式良好和有效,有效性,这段代码是良构的,但是否存在问题?,有效性,价格到底能否出现两次? 我 们需要用一套法则来规范,这就是DTD,如 每个元素是出现多次还是只能出现一次? 一个元素有哪些属性、子元素? 元素出现的顺序? 可以用DTD来确

14、认正确性的文件称为有效的XML文档所以,一个有效的XML文档应当满足: PROLOG必须包括一个正确的DTD(或schema) 其余部分必须符合DTD定义的结构,小结,XML产生的背景 XML的应用 一个简单的XML文档 下节课的内容:DTD和XMLSPY,推荐丛书煞死你的网页设计绝招胭脂虎590如何在711白吃白喝无名氏120 ,HTML局限性,假设需要利用编写 程序到网络上各电子书店去自动把最新的商品及相应的价格找到,供用户比较很困难原因:HTML 的问题在于它是为人设计的。除少数标签如,等,缺乏对信息涵义的表达能力解决方法:用一个能将商品价格明确标示出来的机 制,如用一个标签;HTML能否解决?,XML简单示例,杀死你的网页设计绝招胭脂虎590如何在711白吃白喝无名氏120,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 企业管理 > 管理学资料

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报