Toggle navigation
首页
关于博主
本站源码下载
Java学习路线图
Java1234至尊VIP(特价活动)
搜索
最新博客
2016年06月09日
crawler4j详细配置
摘要: 控制器类必须传一个类型为CrawlConfig的参数,用于配置crawler4j。下面描述了一些关于配置的细节。抓取深度默认情况下没有抓取深度的限制。可以通过配置来限制深度,比如,你有个种子页面A连接到B,B又连接到C,C又连接到D。结构如下:A --> B --> C --> DA是种子页面深度为0,B为1...
发表于 2016-06-09 15:23 阅读(5730) 评论(3)
2016年06月09日
Java基本数据类型-布尔类型
摘要: 布尔类型只有true和false两个值; 用关键字boolean定义。package com.java1234.chap02;public class Demo04 { public static void main(String[] args) { // 定义一个布尔类型的变量b boolean b1=...
发表于 2016-06-09 11:45 阅读(5729) 评论(0)
2016年06月09日
第二章作业 使用Unicode编码输出自己的名字
摘要: 第二章作业 使用Unicode编码输出自己的名字 比如“王二小”;答案:这里的话 我不知道你的名字 所以我们用Unicode编码输出“王二小”;首先我们找到一个 Unicode汉字编码表:http://www.cnblogs.com/whiteyun/archive/2010/07/06/1772218.ht...
发表于 2016-06-09 11:34 阅读(8384) 评论(5)
2016年06月09日
Java基本数据类型-字符类型
摘要: 字符类型主要用来存储单个字符;字符型常量有3种表示形式;1,直接通过单个字符来指定字符型常量,如'A',‘B’,'5';2,通过转义字符表示特殊字符型常量,如'\n','\\';3,直接使用Unicode值来表示字符型常量,如'\u66f9','\u950b';关于转义,有些字符属于特殊字符,不能直接使用,所...
发表于 2016-06-09 11:23 阅读(6966) 评论(0)
2016年06月09日
Unicode汉字编码表
摘要: 转载:http://www.cnblogs.com/whiteyun/archive/2010/07/06/1772218.html 1 Unicode编码表 Unicode只有一个字符集,中、日、韩的三种文字占用了Unicode中0x3000到0x9FFF的部分 Unicode目前普遍采用的是UCS...
发表于 2016-06-09 10:55 阅读(8299) 评论(0)
2016年06月07日
crawler4j停止爬虫线程
摘要: 该实例演示如何通过调用接口实现停止爬虫线程;首先建一个BasicCrawler类:package com.java1234.shutdownCrawler;import java.util.Set;import java.util.regex.Pattern;import org.slf4j.Logger;i...
发表于 2016-06-07 11:57 阅读(6967) 评论(3)
2016年06月07日
crawler4j多线程爬虫实例
摘要: 这个例子演示了如何同时运行两个不同的爬虫。首先写一个BasicCrawler类:package com.java1234.multipleCrawlers;import java.util.Set;import java.util.regex.Pattern;import edu.uci.ics.crawle...
发表于 2016-06-07 09:51 阅读(10517) 评论(1)
2016年06月06日
crawler4j多线程爬虫统计分析数据
摘要: 该事例演示了如何在多线程中统计和分析数据;首先建一个状态实体类CrawlStat:package com.java1234.collectingData;/** * 爬虫状态实体类 统计爬虫信息 * @author * */public class CrawlStat { private int total...
发表于 2016-06-06 13:20 阅读(7202) 评论(5)
2016年06月06日
crawler4j处理单个页面
摘要: 这个类演示了crawler4j如何爬取一个网页的数据 以及抽取出标题和文本信息代码有详细注释:package com.java1234.collectingData;import org.apache.http.HttpStatus;import edu.uci.ics.crawler4j.crawler.C...
发表于 2016-06-06 11:30 阅读(7141) 评论(0)
2016年06月06日
crawler4j图片爬虫
摘要: 该实例主要演示下如何爬取指定网站的图片;代码中有详细注释:首先写一个ImageCrawler类:package com.java1234.imageCrawler4j;import java.io.File;import java.io.IOException;import java.util.UUID;im...
发表于 2016-06-06 11:04 阅读(9420) 评论(0)
首页
上一页
62
63
64
65
66
下一页
尾页
关注Java1234微信公众号
博主信息
Java1234_小锋
(知识改变命运,技术改变世界)
按日志类别
Java核心基础(145)
007项目(5)
SVN(22)
QQ第三方登录(6)
mybatis-plus(20)
Mycat(30)
Layui(2)
Mysql(2)
Docker(35)
Dubbo(7)
Git(50)
SpringCloud(33)
Tomcat(6)
支付宝接口(3)
NodeJs(1)
IDEA(24)
SpringBoot(11)
微信扫码登录(4)
Nginx(24)
Vue.js(50)
jsoup(6)
shiro(1)
webservice(10)
CAS单点登录(7)
elasticsearch(31)
Redis(17)
maven(6)
活动(20)
hibernate(1)
EhCache缓存框架(4)
log4j日志(8)
IT之路(26)
activiti(26)
centos(25)
随心生活(19)
java爬虫技术(14)
网站SEO(2)
httpclient(7)
htmlunit(10)
按日志日期
2022年12月(1)
2021年10月(1)
2021年02月(3)
2020年11月(3)
2020年10月(4)
2020年09月(7)
2020年08月(18)
2020年07月(21)
2020年06月(37)
2020年05月(17)
2020年04月(12)
2020年03月(10)
2020年02月(14)
2020年01月(12)
2019年12月(15)
2019年11月(27)
2019年10月(5)
2019年09月(1)
2019年08月(4)
2019年07月(28)
2019年06月(16)
2019年05月(4)
2019年04月(3)
2019年03月(2)
2019年02月(7)
2019年01月(20)
2018年12月(2)
2018年11月(5)
2018年10月(30)
2018年09月(16)
2018年08月(5)
2018年07月(9)
2018年06月(4)
2018年05月(4)
2018年04月(3)
2018年03月(7)
2018年02月(6)
2018年01月(13)
2017年12月(3)
2017年11月(10)
2017年10月(1)
2017年09月(9)
2017年08月(12)
2017年07月(19)
2017年06月(21)
2017年05月(1)
2017年04月(12)
2017年03月(13)
2017年02月(12)
2017年01月(14)
2016年12月(8)
2016年11月(25)
2016年10月(16)
2016年09月(13)
2016年08月(20)
2016年07月(12)
2016年06月(36)
2016年05月(10)
2016年04月(19)
2016年03月(14)
2016年02月(23)
2016年01月(1)
友情链接
Java知识分享网
免费logo在线制作
猿人学python
Powered by
Java1234
V3.0
Copyright © 2012-2016 Java知识分享网 版权所有