写点什么

XML 简介,kafka 教程尚谷

用户头像
极客good
关注
发布于: 刚刚

<servlet>


  1. 元素是 XML 文档中最重要的组成部分,

  2. 普通元素的结构开始标签、元素体、结束标签组成。例如:大家好

  3. 元素体:元素体可以是元素,也可以是文本,例如:你好

  4. 空元素:空元素只有开始标签,而没有结束标签,但元素必须自己闭合,例如:

  5. 元素命名:


a) 区分大小写


b) 不能使用空格,不能使用冒号:


c) 不建议以 XML、xml、Xml 开头


  1. 良好的 XML 文档,必须有一个根元素。

属性

<web-app version="2.5">


  1. 属性是元素的一部分,它必须出现在元素的开始标签中

  2. 属性的定义格式:属性名=属性值,其中属性值必须使用单引或双引

  3. 一个元素可以有 0~N 个属性,但一个元素中不能出现同名属性

  4. 属性名不能使用空格、冒号等特殊字符,且必须以字母开头

注释

  1. XML 文件中注释采用:" " 这样的格式

  2. XML 声明之前不能有注释

  3. 注释不能嵌套,比如下面不合规范:

转义字符

XML 中的转义字符与 HTML 一样。


因为很多符号已经被 XML 文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符,例如:“<”、“>”、“’”、“””、“&”。


| 转义字符 | 特殊字符 | 含义 |


| --- | --- | --- |


| < | < | 小于 |


| > | > | 大于 |


| & | & | 和号 |


| ' | ’ | 单引号 |


| " | " | 引号 |

CDATA 区

<![CDATA[


任意内容


]]>


当大量的转义字符出现在 xml 文档中时,会使 xml 文档的可读性大幅度降低。这时如果使用 CDATA 段就会好一些。


在 CDATA 段中出现的“<”、“>”、“””、“’”、“&”,都无需使用转义字符。这可以提高 xml 文档的可读性。


在 CDATA 段中不能包含“]]>”,即 CDATA 段的结束定界符。

处理指令

用来解析引擎如何解析 XML 文档内容


比如:在 XML 文档中可以使用 xml-stylesheet 指令,通知 XML 解析引擎,应用 CSS 文件显示 XML 文档内容


<?xml-stylesheet type="text/css" href="a.css"?>


处理指令必须以<? 开头,以 > 结尾


XML 的解析



开发中比较常见的解析方式有三种

  • DOM:要求解析器把整个 XML 文档装载到内存,并解析成一个 Document 对象。


a) 优点:元素与元素之间保留结构关系,故可以进行增删改查操作。


b) 缺点:XML 文档过大,可能出现内存溢出显现。


  • SAX:是一种速度更快,更有效的方法。它逐行扫描文档,一边扫描一边解析。并以事件驱动的方式进行具体解析,每执行一行,都将触发对应的事件。(了解)


a) 优点:处理速度快,可以处理大文件


b) 缺点:只能读,逐行后将释放资源。


  • PULL:Android 内置的 XML 解析方式,类似 SAX。(了解)

解析器

根据不同的解析方式提供的具体实现。有的解析器操作过于繁琐,为了方便开发人员,有提供易于操作的解析开发包。

常见的解析开发包

  • JAXP:sun 公司提供支持 DOM 和 SAX 开发包

  • JDom:dom4j 兄弟

  • jsoup:一种处理 HTML 特定解析开发包

  • dom4j:比较常用的解析开发包,hibernate 底层采用。

DOM 解析原理及结构模型

XML DOM 和 HTML DOM 类似,XML DOM 将 整个 XML 文档加载到内存,生成一个 DOM 树,并获得一个 Document 对象,通过 Document 对象就可以对 DOM 进行操作


<?xml version="1.0" encoding="UTF-8"?>


<web-app version="2.5">


<servlet>


<servlet-name>HelloMyServlet</servlet-name>


<servlet-class>com.jourwon.HelloMyServlet</servlet-class>


</servlet>


<servlet-mapping>


<servlet-name>HelloMyServlet</servlet-name>


<url-pattern>/hello</url-pattern>


</servlet-mapping>


</web-app>



DOM 中的核心概念就是节点,在 XML 文档中的元素、属性、文本等,在 DOM 中都是节点!

dom4j 技术栗子

引入 dom4j 依赖


<dependency>


<groupId>org.dom4j</groupId>


<artifactId>dom4j</artifactId>


<version>2.1.1</version>


</dependency>


将 xml 文件放到指定位置,这里放的是 XML 用途配置文件栗子的内容,然后读取这个位置的 xml 文件,测试代码如下


public class Dome4jTest {


public static void main(String[] args) throws DocumentException {


// 1 创建核心对象(new 方式)


SAXReader saxReader = new SAXReader();


//2 加载 xml 文档 获得 dom 树(核心对象调用 read 读取 xml 文件)


Document doc = saxReader.read("E:\IdeaProjects\demo1\src\main\resources\demo.xml");


//3 获得根元素(文档对象下面就是根元素)


Element root = doc.getRootElement();


//4 获得子元素(根节点下所有子元素)


List<Element> list = root.elements();


for (Element e : list) {


// elementText("标签名") 获得指定名称元素的文本值 (指定标签的文本值)


// getName() 获得当前元素名


if ("servlet".equals(e.getName())) {


System.out.println(e.elementText("servlet-name"));


System.out.println(e.getName());


【一线大厂Java面试题解析+核心总结学习笔记+最新架构讲解视频+实战项目源码讲义】
浏览器打开:qq.cn.hn/FTf 免费领取
复制代码


}


}


}


}


输出结果


HelloMyServlet


servlet


XML 的约束



作用

规定 xml 中可以出现哪些元素及哪些属性,以及他们出现的顺序

约束的分类

  • DTD 约束:struts hiebernate 等等(会用到)

  • SCHEMA 约束:tomcat spring 等等(会用到)

约束详解

既然是约束就和 xml 有联系,所以约束要和 xml 关联,xml 的相关限制才能生效。

方式 1:内部关联

格式:


<!DOCTYPE 根元素名 [dtd 语法]>

方式 2:外部关联-系统关联

格式:


<!DOCTYPE 根元素名 SYSTEM "约束文件的位置">


例如:


<!DOCTYPE web-app SYSTEM "web-app_2_3.dtd">


举例 web-app_2_3.dtd 文件


<?xml version="1.0" encoding="UTF-8" ?>


<!ELEMENT web-app (servlet*, servlet-mapping* , welcome-file-list?) >


<!ELEMENT servlet (servlet-name, description?, (servlet-class|jsp-file))>


<!ELEMENT servlet-mapping (servlet-name, url-pattern) >


<!ELEMENT servlet-name (#PCDATA)>


<!ELEMENT servlet-class (#PCDATA)>


<!ELEMENT url-pattern (#PCDATA)>


<!ELEMENT welcome-file-list (we1come-fi1e+)>


<!ELEMENT welcome-file (#PCDATA)>


<!ATTLIST web-app version CDATA #IMPLIED>


接下来 xml 中只能出现 dtd 文件中规定的特有的标签了(不能自定义自己随便写了)


ps:idea 中你输入< 便会提示能够输入的标签

方式 3:外部关联-公共关联

格式:


<!DOCTYPE 根元素名 PUBLIC "约束文件的名称" "约束文件的位置">


如 mybatis 中 mapper 的约束


<?xml version="1.0" encoding="UTF-8" ?>


<!DOCTYPE mapper PUBLIC "-//mybatis.org//DTD Mapper 3.0//EN" "http://mybatis.org/dtd/mybatis-3-mapper.dtd" >

dtd 约束

无论是单独的 dtd 文件还是写在 xml 中(参考上面方式一)都需要按照语法要求写


再次强调下语 dtd 文件约束的作用:


规定 xml 中可以出现哪些元素及哪些属性,以及他们出现的顺序


标签(元素)语法:


<!Element 元素名称 数据类型|包含内容>


数据类型:#PCDATA:普通文本 使用的时候一般用()引起来


功能:能出现那些标签,以及出现顺序


包含内容:该元素下可以出现哪些元素 用()引起来


符号:


  • 出现任意次


? 出现 1 次或者 0 次


  • 出现至少 1 次


| 或者


() 分组


, 顺序(元素出现先后顺序,按照都好标记顺序出现)


栗子如下:(上图约束图中的代码)


<!ELEMENT web-app (servlet*,servlet-mapping* , welcome-file-list?) >


<!ELEMENT servlet-name (#PCDATA)>


ps:元素名就是 xml 中能够出现的元素标签名


属相的约束语法:


属性:


格式:


<!ATTLIST 元素名 属性名 属性类型 属性是否必须出现>


属性类型:


ID:唯一


CDATA:普通文本


属性是否必须出现


REQUIRED:必须出现


IMPLIED:可以不出现


例如:


<!ATTLIST web-app version CDATA #IMPLIED>

用户头像

极客good

关注

还未添加个人签名 2021.03.18 加入

还未添加个人简介

评论

发布
暂无评论
XML简介,kafka教程尚谷