Ngbatis源码中Jsoup如何简单使用?
摘要:在 Ngbatis 中解析 xml 的工具是 Jsoup,因为之前没有接触过,在这里简要的介绍和编写一下。 查了一些资料,Jsoup 似乎用作爬虫和解析 HTML 的场景比较多, 但是 XML 是一样的,同样是将页面解析为一个 DOM 树,
在 Ngbatis 中解析 xml 的工具是 Jsoup,因为之前没有接触过,在这里简要的介绍和编写一下。
查了一些资料,Jsoup 似乎用作爬虫和解析 HTML 的场景比较多, 但是 XML 是一样的,同样是将页面解析为一个 DOM 树,然后使用 Jsoup 提供的方法来查询。因为 Jsoup 的解析查询方法十分直观,且能快速上手,因为这个原因所以在 Ngbatis 中选择了 Jsoup 的方式。
源码地址
Jsoup 在 GitHub 上的源码地址:https://github.com/jhy/jsoup
使用方式
引入 Jsoup 的依赖
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.15.4</version>
</dependency>
之前已经将 XML 文件数据加载到了 Resource 中,从 Resource 中获取 InputStream 流,并使用 Jsoup 解析成 Document 对象操作。这里使用的是 Jsoup.parse 这个方法。
Document doc = Jsoup.parse(resource.getInputStream(), "UTF-8", "http://example.com/");
其实 Jsoup.parse 有很多重载方法,可以接受 File 类型数据,也可以接受 html 文本字符串,按照需要调用方法即可。
