搜档网
当前位置:搜档网 › XML学习资料

XML学习资料

XML学习资料
XML学习资料

XML

什么是XML

可扩展标记语言(extensible markup language,XML)

·标记语言:用某种“记号”来表示某种特殊信息的语言,它是一套标记符号和相关语法的集合

·两类标记语言:

①专用标记语言:基于特殊用途的需要,被某一种或者几种应用软件所支持来表示某种特殊信息;

HTML:应用在WWW上面的网页,其重点在于信息的显示

②通用标记语言:不针对某一特殊应用,只是用来描述数据的内容和结构,即(元标记语言),为不同应用提供数据交流的平台。

SGML:标准通用标记语言,由于其复杂,很难编写解释器,在其规范上,出于易用性考虑,发展了XML

XML( eXtensible Markup Language,可扩展标记语言)可以定

义自己的一组标签

使人们或程序能够理解这些标签

XML、SGML、HTML的关系

XML与SGML、HTML的关系:

⑴SGML是所有标记语言的母语言,HTML

和XML都派生自SGML;

⑵XML从根本上讲就是SGML的一个子集,

而HTML是SGML定义的一种应用;

⑶HTML只是一个有限标记集合,不能自

定义扩展,仅作为一种数据表示技术,不能

揭示数据的含义;

XML的特性

XML的核心是数据:在XML中数据与样式分离,提高XML文档

的利用率以及数据容量与质量

XML数据自我描述性

用户可以自己定义标记的名称

XML支持Unicode字符集

它允许使用双字节的字符来定义标记和编写程序,可以很方

便使用中文来命名XML文档中的元素和属性,具有可读性。

XML不仅仅作一个记录数据的数据格式,常与以下技术结合使

用。

①DTD(文档类型定义):为XML文档提供元素、属性、顺序

等规则,根据DTD来验证文档是否合法;

②DOM(文档对象模型):为应用程序提供相应处理文档的

接口

③CSS(层叠样式表):为元素指定显示格式

④XSL(可扩展样式语言)

元素和标记

XML文档由元素构成,每个元素由开始标记和结束标记组成,

或者表示为空元素标记。

Hello

元素的命名原则:

①元素名称的第一个字符必须是字母或下划线

②后续字符可以是字母、数字、下划线、连字符或点

③区分大小写,元素名称不能含空格

④可以使用中文名称

元素可以具有属性,属性是由等号分隔的一对名称和值。属

性必须放在元素的开始标记中,其值用双引号括起。格式:<元素名称属性名1=“值1” 属性名2=“值2” …>

属性命名:

①与元素命名相同;

②同一个元素不可以拥有两个相同的属性名称,但不同的元素可以拥有相同的属性名称

1. 对于使用属性还是元素没有一成不变的规则,一般来说使用元素扩展性更好,

而属性更适合简单的、没有子结构的数据。

2. 对于XML文档,CSS只能指定元素的样式,无法指定属性,必须使用XSL。

3.属性的值都是字符串,其不能包含字符< & “ ‘ >等

引用

XML为显示非ASCII码字符集中的字符提供了两种方法:实体

引用和字符引用。

①在XML中,所有的实体引用都是以&开头,以;结尾。

②XML中5个预定义的实体引用,分别用来代替文本中出现的& < > 双引号单引号

CDATA节

有时在XML中描述的内容很长,其中包含许多特殊符号,若要

把这些字符逐一替换成实体引用,工作量大,考虑使用CDATA

节,其内容不会解析。

格式:

注释

格式:

使用注释时要遵循的规则:

1. 注释的文本中不应包含“--”

2. 注释不应放在标记里面

3. 注释不能放在实体声明中,也不能放在 XML 声明之前

4. 不能用注释隠藏基本的标记

5. 注释不能嵌套

创建 XML 文档

构建 XML 文档的步骤

1. 陈述 XML 声明

2. 创建根元素

3. 创建 XML 代码

管理元素的规则

至少需要一个元素

XML 标签区分大小写

应正确使用结束标签

正确嵌套标签

应使用合法标签

标记名称的长度

应定义有效的属性

应验证文档

格式良好和有效的 XML 文档

被视为格式良好的 XML 文档的条件:

该文档满足最低要求集

如果文档不满足任何一个良好格式的要求,则将发生致命错

有效的XML 文档是符合Document Type Definition(文档类型

定义,DTD)的规则的格式良好的 XML 文档

总结

XML 是可扩展的,即可以定义自己的一组标签,并使其他的

人或程序能够理解这些标签

XML由SGML发展而来,是SGML的子集

XML的核心是数据,这些数据有自我描述性,支持Unicode字

符集

XML可以实现异构数据之间的数据交换。有较好的保值性,并

且有严格的语法要求。

一个XML文档可以分为序言区、主体区和尾声区

元素由开始标记、结束标记以及元素内容组成。

XML预定义了5种实体引用,用来代替在文档中出现的特殊字

CDATA中的内容不解析,原样显示

编写XML文档时从声明开始

所有非空元素都必须有闭合标记

空元素使用/>来闭合

标记区分大小写

什么是DTD

DTD包含在文档类型声明中,定义某种文档类型的所有规则。

要利用DTD来校验XML文档的合法性,就必须把XML文档同

DTD文件相关联(DTD的声明)

DTD声明格式:

按照DTD声明位置分为:

1. 内部DTD声明:将DTD定义的内容书写在XML的文档类型

声明中;

2. 外部DTD声明:在XML文档中引用已经编写好的独立的

DTD文件(*.dtd)。

内部DTD的声明

格式 :

]>

外部DTD的声明

格式:

其中:

◆SYSTEM | PUBLIC 这两个参数只用其一。

SYSTEM是指文档使用的私有DTD文件的网址,

而PUBLIC则指文档调用一个公网的DTD文件的网址。

◆DTD的位置是:DTD文件的网址和名称(URI)。

所有DTD文件的后缀名为".dtd"。

内部DTD和外部DTD联合使用

实际应用过程中,通常是由XML文档的设计团队提供一份公共

的DTD文件作为外部DTD;每个成员根据实际使用的需要通过

内部DTD的声明扩展DTD的定义。

内部DTD定义的标记和外部DTD所定义标记避免雷同,否则出

错。

使用 DTD生成 XML 文档

DTD 以简单文本文件的形式出现,可以存储在独立的文件

中,也可以嵌入 XML 文件

引用 DTD 的 XML 文档将包含 声明

为什么使用 DTD?

1. 用于验证自己的数据

2. 定义 XML 文档的合法构建块

3. 使用一系列合法元素来定义文档结构

4. 验证接收到的数据是否有效

DTD的结构(一)

DTD一般由元素声明、属性声明和实体声明等构成,但并不是

每一个DTD文件都要用到这些内容。

1 元素声明,格式:

说明:#PCDATA表示元素的内容只能为可解析的文本数据

2 DTD中定义空元素表示元素内容为空,格式

3 DTD中定义子元素:规定了在元素中只能出现指定的子元素,而不能出现字符等其他内容。

相关主题