Toggle navigation
首页
关于博主
本站源码下载
Java学习路线图
Java1234至尊VIP(特价活动)
搜索
最新博客
2025年07月14日
crawler4j停止爬虫线程
摘要: 该实例演示如何通过调用接口实现停止爬虫线程;首先建一个BasicCrawler类:package com.java1234.shutdownCrawler;import java.util.Set;import java.util.regex.Pattern;import org.slf4j.Logger;i...
发表于 2025-07-14 20:46 阅读(9267) 评论(3)
2025年07月14日
crawler4j详细配置
摘要: 控制器类必须传一个类型为CrawlConfig的参数,用于配置crawler4j。下面描述了一些关于配置的细节。抓取深度默认情况下没有抓取深度的限制。可以通过配置来限制深度,比如,你有个种子页面A连接到B,B又连接到C,C又连接到D。结构如下:A --> B --> C --> DA是种子页面深度为0,B为1...
发表于 2025-07-14 20:46 阅读(8070) 评论(3)
2025年07月14日
HttpClient简介
摘要: 超文本传输协议(HTTP)也许是当今互联网上使用的最重要的协议了。Web服务,有网络功能的设备和网络计算的发展,都持续扩展了HTTP协议的角色,超越了用户使用的Web浏览器范畴,同时,也增加了需要HTTP协议支持的应用程序的数量。 尽管java.net包提供了基本通过HTTP访问资源的功能,但它没有提供全...
发表于 2025-07-14 20:46 阅读(8374) 评论(0)
2025年07月14日
httpclient-执行请求
摘要: HttpClient最重要的功能是执行HTTP方法。一个HTTP方法的执行包含一个或多个HTTP请求/HTTP响应交换,通常由HttpClient的内部来处理。而期望用户提供一个要执行的请求对象,而HttpClient期望传输请求到目标服务器来返回对应的响应对象,或者当执行不成功时抛出异常。 很自然地,Ht...
发表于 2025-07-14 20:46 阅读(9432) 评论(0)
首页
上一页
1
2
下一页
尾页
关注Java1234微信公众号
博主信息
Java1234_小锋
(知识改变命运,技术改变世界)
按日志类别
Java核心基础(145)
QQ第三方登录(6)
mybatis-plus(20)
Mycat(30)
Layui(2)
Mysql(2)
Docker(35)
Dubbo(7)
007项目(0)
SVN(22)
支付宝接口(3)
NodeJs(1)
IDEA(24)
SpringBoot(11)
微信扫码登录(4)
Git(50)
SpringCloud(33)
Tomcat(6)
Vue.js(50)
jsoup(6)
shiro(1)
Nginx(24)
maven(6)
活动(20)
hibernate(1)
EhCache缓存框架(4)
webservice(10)
CAS单点登录(7)
elasticsearch(31)
Redis(17)
log4j日志(8)
IT之路(26)
activiti(26)
centos(25)
随心生活(19)
java爬虫技术(14)
网站SEO(2)
htmlunit(10)
httpclient(7)
按日志日期
2026年02月(1)
2026年01月(12)
2025年07月(702)
友情链接
Java知识分享网
Powered by
Java1234
V3.0
Copyright © 2012-2016 Java知识分享网 版权所有