java1234开源博客系统
博客信息

Jsoup获取DOM元素属性值

发布时间:『 2017-02-21 14:50』  博客类别:jsoup  阅读(9241) 评论(0)

Jsoup获取DOM元素属性值


比如我们要获取博客的href属性值:

QQ鎴浘20170221144807.jpg


我们这时候就要用到Jsoup来获取属性的值 :


我们给下示例代码:

package com.open1111.jsoup;

import org.apache.http.HttpEntity;
import org.apache.http.client.methods.CloseableHttpResponse;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.impl.client.HttpClients;
import org.apache.http.util.EntityUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class Demo04 {

	public static void main(String[] args) throws Exception{
		CloseableHttpClient httpclient = HttpClients.createDefault(); // 创建httpclient实例
        HttpGet httpget = new HttpGet("http://www.cnblogs.com/"); // 创建httpget实例
         
        CloseableHttpResponse response = httpclient.execute(httpget); // 执行get请求
        HttpEntity entity=response.getEntity(); // 获取返回实体
        String content=EntityUtils.toString(entity, "utf-8");
        response.close(); // 关闭流和释放系统资源
        
        Document doc=Jsoup.parse(content); // 解析网页 得到文档对象
        
        Elements linkElements=doc.select("#post_list .post_item .post_item_body h3 a"); //通过选择器查找所有博客链接DOM
        for(Element e:linkElements){
        	System.out.println("博客标题:"+e.text());
        	System.out.println("博客地址:"+e.attr("href"));
        	System.out.println("target:"+e.attr("target"));
        }
         
        Element linkElement=doc.select("#friend_link").first();
        System.out.println("纯文本:"+linkElement.text());
        System.out.println("html:"+linkElement.html());
        
       
	}
}

关键字:   Jsoup  
关注Java1234微信公众号
博主信息
Java1234_小锋
(知识改变命运,技术改变世界)
Powered by Java1234 V3.0 Copyright © 2012-2016 Java知识分享网 版权所有