清单 1 中的 XML 包括一个图书列表。父标志 <books> 包括一组 <book> 标志,每一个 <book> 标志又包括 <author>、<title> 和 <publisher> 标志。
当 XML 文档的标志布局和内容失掉内部形式文件的验证后,XML 文档就是准确的。形式文件可以用分歧的格局指定。关于本文来讲,所需求的只是格局优秀的 XML。
假如感觉 XML 看起来很像超文本标志言语(HTML),那末就对了。XML 和 HTML 都是基于标志的言语,它们有很多类似的地方。然而,要侧重指出的是:固然 XML 文档多是格局优秀的 HTML,但不是一切的 HTML 文档都是格局优秀的 XML。换行标志(br)是 XML 和 HTML 之间区分的一个好例子。这个换行标志是格局优秀的 HTML,但不是格局优秀的 XML:
<p>This is a paragraph<br>
With a line break</p>
这个换行标志是格局优秀的 XML 和 HTML:
<p>This is a paragraph<br />
With a line break</p>
假如要把 HTML 编写成一样是格局优秀的 XML,请遵守 W3C 委员会的可扩大超文本标志言语(XHTML)尺度。一切古代的阅读器都能出现 XHTML。并且,还可以用 XML 东西读取 XHTML 并找出文档中的数据,这比解析 HTML 轻易很多。 利用 DOM 库读取 XML
读取格局优秀的 XML 文件最轻易的体例是利用编译成某些 PHP 装置的文档对象模子 (DOM)库。DOM 库把全部 XML 文档读入内存,并用节点树暗示它,如图 1 所示。
图 1. 图书 XML 的 XML DOM 树