一、什么是XML
xml全称为Extensible Markup Language,意思是可扩展的标记语言。XML语法上和HTML比较相似,但是HTML中的元素是固定的,而XML的标签是可以用户定义的。
二、XML语法
1、XML文档声明
<?xml version="1.0" encoding="UTF-8"?>
1)文档声明必须为<?xml开头,以?>结束
2)文档声明必须从文档的0行0列位置开始
3)文档声明只有三个属性:
a)version:指定XML的文档版本,必须属性,因为我们不会选择1.1,只会选择1.0
b)encoding:指定当前文档的编码,可选属性,默认值是utf-8
2、元素element
<servlet>
1)元素是XML文档中最重要的组成部分
2)普通元素的结构开始标签、元素体、结束标签组成。例如:<hello>大家好</hello>
3)元素体:元素体可以是元素,也可以是文本,例如<b><a>你好</a></b>
4)空元素:空元素只有开始标签,而没有结束标签,但元素必须自己闭合,例如:<c/>
5)元素命名:
a)区分大小写
b)不能使用空格,不能使用冒号
c)不建议以XML、xml、Xml开头
6)格式化良好的XML文档,必须只有一个根元素
3、属性
<web-app version="2.5">
1)属性是元素的一部分,它必须出现在元素的开始标签中
2)属性的定义格式:属性名=属性值,其中属性值必须使用单引或双引
3)一个元素可以有1~N个属性,但一个属性中不能出现同名属性
4)属性名不能使用空格、冒号等特殊字符,且必须以字母开头
4、注释
XML的注释与HTML相同,即以“<--”开始,以"-->"结束,注释内容会被XML解析器忽略
5、转义字符
XML中的转义字符与HTML一样
因为很多符号已经被XML文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符,例如:“<”、">" 、"‘"、““”、”&“。
字符 |
字符引用 (十进制代码) |
字符引用 (十六进制代码) |
预定义实体引用 |
< | < | < | ⁢ |
> | > | > | > |
" | " | " | " |
‘ | ' | ' | ' |
& | & | & |
& |
CDATA区
<![CDATA[
任意内容
]]>
当大量的转义字符出现在XML文件中时,会使XML文档的可读性大幅度降低。这时如果使用CDATA段就会好一些。
在CDATA段中出现的“<”、">" 、"‘"、““”、”&“都无需使用转义字符,这可以XML的可读性。
在CDATA中不能包含“]]>”,即CDATA段的结束定界符。