Maven坐标
代码语言:javascript复制<dependency>
<!-- jsoup HTML parser library @ https://jsoup.org/ -->
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.14.3</version>
</dependency>
快速使用:
1.从一个网址开始进行解析
代码语言:javascript复制Document doc = Jsoup.connect("https://www.zh996.com/").get();
String title = doc.title();//此时取到<title></title>标签中的内容
代码语言:javascript复制Element content = doc.getElementById("content");//找到文档中标签带有id属性的元素,且id得值为content得标签
Elements links = content.getElementsByTag("a");//找到里面所有得a标签
for (Element link : links) {//遍历所有得a标签
String linkHref = link.attr("href");//链接得地址
String linkText = link.text();//链接得名称
}
更多使用方法请参阅: jsoup