java1234开源博客系统
最新博客
  • 2017年02月17日 Jsoup使用选择器语法查找DOM元素 摘要: Jsoup使用选择器语法查找DOM元素我们前面通过标签名,Id,Class样式等来搜索DOM,这些是不能满足实际开发需求的,很多时候我们需要寻找有规律的DOM集合,很多个有规律的标签层次;这时候,选择器就用上了 css jquery都有,Jsoup支持css,jquery类似的选择器语法;这里给下实例:pac... 发表于 2017-02-17 16:16 阅读(5046) 评论(0)

  • 2017年02月16日 java 301重定向实现 摘要: 最近几万花块钱把一个二级域名网站权重卖了,这里要用到301重定向把权重给别人;这里把关键实现给下代码:HttpServletResponse response=(HttpServletResponse)servletResponse;response.setStatus(301);response.set... 发表于 2017-02-16 21:11 阅读(5311) 评论(0)

  • 2017年02月13日 Jsoup查找DOM元素 摘要: Jsoup查找DOM元素Jsoup提供了丰富的API来给我们查找我们需要的DOM元素;这里例举一些常用的:getElementById(String id) 根据id来查询DOMgetElementsByTag(String tagName) 根据tag名称来查询DOMgetElementsByClass(S... 发表于 2017-02-13 15:19 阅读(4375) 评论(0)

  • 2017年02月11日 Maven里添加json-lib支持 摘要: json-lib的maven支持是: net.sf.json-lib json-lib 2.4但是我们配置到pom.... QQ鎴浘20170211095715.jpg    QQ鎴浘20170211095725.jpg    发表于 2017-02-11 10:01 阅读(5893) 评论(0)

  • 2017年02月10日 Jsoup HelloWorld实现 摘要: Jsoup HelloWorld实现我们用Jsoup来提取下http://www.cnblogs.com/ 博客园的 网页title 标题 和 口号;这里我们要用到前面讲的HttpClient来获取网页内容:pom.xml: QQ鎴浘20170210100734.jpg    发表于 2017-02-10 10:15 阅读(5074) 评论(0)

  • 2017年02月10日 Jsoup简介 摘要: Jsoup简介jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。我们在爬虫采集网页领域 主要作用是 用HttpClient获取到网页后 具体的网页提取需要的信息的时候 ,... 发表于 2017-02-10 09:59 阅读(5024) 评论(0)

  • 2017年02月06日 HttpClient连接超时及读取超时 摘要: HttpClient连接超时及读取超时httpClient在执行具体http请求时候 有一个连接的时间和读取内容的时间;HttpClient连接时间所谓连接的时候 是HttpClient发送请求的地方开始到连接上目标url主机地址的时间,理论上是距离越短越快,线路越通畅越快,但是由于路由复杂交错,往往连接上的... 发表于 2017-02-06 20:12 阅读(8657) 评论(0)

  • 2017年02月06日 又一个vip会员成功入职 摘要: 一会员花了7个月时间 把我所有课程学习完,成功找到工作。呵呵...有图有真相:我搞的java学习路线图:http://www.java1234.com/javaxuexiluxiantu.html ... QQ鎴浘20170206195516.jpg    发表于 2017-02-06 19:57 阅读(6770) 评论(0)

  • 2017年02月02日 Maven阿里云镜像配置 摘要: 大家都知道国外Maven中央仓库下载东西 龟速;这里提供下国内牛逼的Maven镜像 阿里云Maven镜像;配置下setting.xml即可;提供一个下载 https://pan.baidu.com/s/1B57IwnNPkKEqbQJZOd2T4A ... QQ鎴浘20170415192703.jpg    发表于 2017-02-02 10:15 阅读(22964) 评论(0)

  • 2017年02月01日 HttpClient使用代理IP 摘要: 在爬取网页的时候,有的目标站点有反爬虫机制,对于频繁访问站点以及规则性访问站点的行为,会采集屏蔽IP措施。这时候,代理IP就派上用场了。关于代理IP的话 也分几种 透明代理、匿名代理、混淆代理、高匿代理1、透明代理(Transparent Proxy)REMOTE_ADDR = Proxy IPHTTP_VI... 发表于 2017-02-01 10:28 阅读(11509) 评论(0)

关注Java1234微信公众号
博主信息
Java1234_小锋
(知识改变命运,技术改变世界)
Powered by Java1234 V3.0 Copyright © 2012-2016 Java知识分享网 版权所有