java1234开源博客系统
博客信息

Jsoup简介

发布时间:『 2017-02-10 09:59』  博客类别:jsoup  阅读(5268) 评论(0)

Jsoup简介


jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。


我们在爬虫采集网页领域 主要作用是 用HttpClient获取到网页后 具体的网页提取需要的信息的时候 ,就用到Jsoup,Jsoup可以使用强大的类似Jquery,css选择器,来获取需要的数据;


Jsoup官方地址:https://jsoup.org/


Jsoup最新下载:https://jsoup.org/download


Jsoup文档:https://jsoup.org/cookbook/introduction/parsing-a-document


最新版Maven地址:

<dependency>
    <groupId>org.jsoup</groupId>
    <artifactId>jsoup</artifactId>
    <version>1.10.2</version>
</dependency>


关键字:   Jsoup  
关注Java1234微信公众号
博主信息
Java1234_小锋
(知识改变命运,技术改变世界)
Powered by Java1234 V3.0 Copyright © 2012-2016 Java知识分享网 版权所有