XML 简介,kafka 教程尚谷
<servlet>
元素是 XML 文档中最重要的组成部分,
普通元素的结构开始标签、元素体、结束标签组成。例如:大家好
元素体:元素体可以是元素,也可以是文本,例如:你好
空元素:空元素只有开始标签,而没有结束标签,但元素必须自己闭合,例如:
元素命名:
a) 区分大小写
b) 不能使用空格,不能使用冒号:
c) 不建议以 XML、xml、Xml 开头
良好的 XML 文档,必须有一个根元素。
属性
<web-app version="2.5">
属性是元素的一部分,它必须出现在元素的开始标签中
属性的定义格式:属性名=属性值,其中属性值必须使用单引或双引
一个元素可以有 0~N 个属性,但一个元素中不能出现同名属性
属性名不能使用空格、冒号等特殊字符,且必须以字母开头
注释
XML 文件中注释采用:" " 这样的格式
XML 声明之前不能有注释
注释不能嵌套,比如下面不合规范:
转义字符
XML 中的转义字符与 HTML 一样。
因为很多符号已经被 XML 文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符,例如:“<”、“>”、“’”、“””、“&”。
| 转义字符 | 特殊字符 | 含义 |
| --- | --- | --- |
| < | < | 小于 |
| > | > | 大于 |
| & | & | 和号 |
| ' | ’ | 单引号 |
| " | " | 引号 |
CDATA 区
<![CDATA[
任意内容
]]>
当大量的转义字符出现在 xml 文档中时,会使 xml 文档的可读性大幅度降低。这时如果使用 CDATA 段就会好一些。
在 CDATA 段中出现的“<”、“>”、“””、“’”、“&”,都无需使用转义字符。这可以提高 xml 文档的可读性。
在 CDATA 段中不能包含“]]>”,即 CDATA 段的结束定界符。
处理指令
用来解析引擎如何解析 XML 文档内容
比如:在 XML 文档中可以使用 xml-stylesheet 指令,通知 XML 解析引擎,应用 CSS 文件显示 XML 文档内容
<?xml-stylesheet type="text/css" href="a.css"?>
处理指令必须以<? 开头,以 > 结尾
开发中比较常见的解析方式有三种
DOM:要求解析器把整个 XML 文档装载到内存,并解析成一个 Document 对象。
a) 优点:元素与元素之间保留结构关系,故可以进行增删改查操作。
b) 缺点:XML 文档过大,可能出现内存溢出显现。
SAX:是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。并以事件驱动的方式进行具体解析,每执行一行,都将触发对应的事件。(了解)
a) 优点:处理速度快,可以处理大文件
b) 缺点:只能读,逐行后将释放资源。
PULL:Android 内置的 XML 解析方式,类似 SAX。(了解)
解析器
根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐,为了方便开发人员,有提供易于操作的解析开发包。
常见的解析开发包
JAXP:sun 公司提供支持 DOM 和 SAX 开发包
JDom:dom4j 兄弟
jsoup:一种处理 HTML 特定解析开发包
dom4j:比较常用的解析开发包,hibernate 底层采用。
DOM 解析原理及结构模型
XML DOM 和 HTML DOM 类似,XML DOM 将 整个 XML 文档加载到内存,生成一个 DOM 树,并获得一个 Document 对象,通过 Document 对象就可以对 DOM 进行操作
<?xml version="1.0" encoding="UTF-8"?>
<web-app version="2.5">
<servlet>
<servlet-name>HelloMyServlet</servlet-name>
<servlet-class>com.jourwon.HelloMyServlet</servlet-class>
</servlet>
<servlet-mapping>
<servlet-name>HelloMyServlet</servlet-name>
<url-pattern>/hello</url-pattern>
</servlet-mapping>
</web-app>
DOM 中的核心概念就是节点,在 XML 文档中的元素、属性、文本等,在 DOM 中都是节点!
dom4j 技术栗子
引入 dom4j 依赖
<dependency>
<groupId>org.dom4j</groupId>
<artifactId>dom4j</artifactId>
<version>2.1.1</version>
</dependency>
将 xml 文件放到指定位置,这里放的是 XML 用途配置文件栗子的内容,然后读取这个位置的 xml 文件,测试代码如下
public class Dome4jTest {
public static void main(String[] args) throws DocumentException {
// 1 创建核心对象(new 方式)
SAXReader saxReader = new SAXReader();
//2 加载 xml 文档 获得 dom 树(核心对象调用 read 读取 xml 文件)
Document doc = saxReader.read("E:\IdeaProjects\demo1\src\main\resources\demo.xml");
//3 获得根元素(文档对象下面就是根元素)
Element root = doc.getRootElement();
//4 获得子元素(根节点下所有子元素)
List<Element> list = root.elements();
for (Element e : list) {
// elementText("标签名") 获得指定名称元素的文本值 (指定标签的文本值)
// getName() 获得当前元素名
if ("servlet".equals(e.getName())) {
System.out.println(e.elementText("servlet-name"));
System.out.println(e.getName());
}
}
}
}
输出结果
HelloMyServlet
servlet
作用
规定 xml 中可以出现哪些元素及哪些属性,以及他们出现的顺序
约束的分类
DTD 约束:struts hiebernate 等等(会用到)
SCHEMA 约束:tomcat spring 等等(会用到)
约束详解
既然是约束就和 xml 有联系,所以约束要和 xml 关联,xml 的相关限制才能生效。
方式 1:内部关联
格式:
<!DOCTYPE 根元素名 [dtd 语法]>
方式 2:外部关联-系统关联
格式:
<!DOCTYPE 根元素名 SYSTEM "约束文件的位置">
例如:
<!DOCTYPE web-app SYSTEM "web-app_2_3.dtd">
举例 web-app_2_3.dtd 文件
<?xml version="1.0" encoding="UTF-8" ?>
<!ELEMENT web-app (servlet*, servlet-mapping* , welcome-file-list?) >
<!ELEMENT servlet (servlet-name, description?, (servlet-class|jsp-file))>
<!ELEMENT servlet-mapping (servlet-name, url-pattern) >
<!ELEMENT servlet-name (#PCDATA)>
<!ELEMENT servlet-class (#PCDATA)>
<!ELEMENT url-pattern (#PCDATA)>
<!ELEMENT welcome-file-list (we1come-fi1e+)>
<!ELEMENT welcome-file (#PCDATA)>
<!ATTLIST web-app version CDATA #IMPLIED>
接下来 xml 中只能出现 dtd 文件中规定的特有的标签了(不能自定义自己随便写了)
ps:idea 中你输入< 便会提示能够输入的标签
方式 3:外部关联-公共关联
格式:
<!DOCTYPE 根元素名 PUBLIC "约束文件的名称" "约束文件的位置">
如 mybatis 中 mapper 的约束
<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE mapper PUBLIC "-//mybatis.org//DTD Mapper 3.0//EN" "http://mybatis.org/dtd/mybatis-3-mapper.dtd" >
dtd 约束
无论是单独的 dtd 文件还是写在 xml 中(参考上面方式一)都需要按照语法要求写
再次强调下语 dtd 文件约束的作用:
规定 xml 中可以出现哪些元素及哪些属性,以及他们出现的顺序
标签(元素)语法:
<!Element 元素名称 数据类型|包含内容>
数据类型:#PCDATA:普通文本 使用的时候一般用()引起来
功能:能出现那些标签,以及出现顺序
包含内容:该元素下可以出现哪些元素 用()引起来
符号:
出现任意次
? 出现 1 次或者 0 次
出现至少 1 次
| 或者
() 分组
, 顺序(元素出现先后顺序,按照都好标记顺序出现)
栗子如下:(上图约束图中的代码)
<!ELEMENT web-app (servlet*,servlet-mapping* , welcome-file-list?) >
<!ELEMENT servlet-name (#PCDATA)>
ps:元素名就是 xml 中能够出现的元素标签名
属相的约束语法:
属性:
格式:
<!ATTLIST 元素名 属性名 属性类型 属性是否必须出现>
属性类型:
ID:唯一
CDATA:普通文本
属性是否必须出现
REQUIRED:必须出现
IMPLIED:可以不出现
例如:
<!ATTLIST web-app version CDATA #IMPLIED>
评论