java1234开源博客系统
最新博客
  • 2016年06月09日 crawler4j详细配置 摘要: 控制器类必须传一个类型为CrawlConfig的参数,用于配置crawler4j。下面描述了一些关于配置的细节。抓取深度默认情况下没有抓取深度的限制。可以通过配置来限制深度,比如,你有个种子页面A连接到B,B又连接到C,C又连接到D。结构如下:A --> B --> C --> DA是种子页面深度为0,B为1... 发表于 2016-06-09 15:23 阅读(5730) 评论(3)

  • 2016年06月09日 Java基本数据类型-布尔类型 摘要: 布尔类型只有true和false两个值; 用关键字boolean定义。package com.java1234.chap02;public class Demo04 { public static void main(String[] args) { // 定义一个布尔类型的变量b boolean b1=... 发表于 2016-06-09 11:45 阅读(5729) 评论(0)

  • 2016年06月09日 第二章作业 使用Unicode编码输出自己的名字 摘要: 第二章作业 使用Unicode编码输出自己的名字 比如“王二小”;答案:这里的话 我不知道你的名字 所以我们用Unicode编码输出“王二小”;首先我们找到一个 Unicode汉字编码表:http://www.cnblogs.com/whiteyun/archive/2010/07/06/1772218.ht... QQ鎴浘20160609112934.jpg    QQ鎴浘20160609113120.jpg    发表于 2016-06-09 11:34 阅读(8384) 评论(5)

  • 2016年06月09日 Java基本数据类型-字符类型 摘要: 字符类型主要用来存储单个字符;字符型常量有3种表示形式;1,直接通过单个字符来指定字符型常量,如'A',‘B’,'5';2,通过转义字符表示特殊字符型常量,如'\n','\\';3,直接使用Unicode值来表示字符型常量,如'\u66f9','\u950b';关于转义,有些字符属于特殊字符,不能直接使用,所... QQ鎴浘20160609111946.jpg    发表于 2016-06-09 11:23 阅读(6966) 评论(0)

  • 2016年06月09日 Unicode汉字编码表 摘要: 转载:http://www.cnblogs.com/whiteyun/archive/2010/07/06/1772218.html 1 Unicode编码表  Unicode只有一个字符集,中、日、韩的三种文字占用了Unicode中0x3000到0x9FFF的部分 Unicode目前普遍采用的是UCS... 发表于 2016-06-09 10:55 阅读(8299) 评论(0)

  • 2016年06月07日 crawler4j停止爬虫线程 摘要: 该实例演示如何通过调用接口实现停止爬虫线程;首先建一个BasicCrawler类:package com.java1234.shutdownCrawler;import java.util.Set;import java.util.regex.Pattern;import org.slf4j.Logger;i... 发表于 2016-06-07 11:57 阅读(6967) 评论(3)

  • 2016年06月07日 crawler4j多线程爬虫实例 摘要: 这个例子演示了如何同时运行两个不同的爬虫。首先写一个BasicCrawler类:package com.java1234.multipleCrawlers;import java.util.Set;import java.util.regex.Pattern;import edu.uci.ics.crawle... 发表于 2016-06-07 09:51 阅读(10517) 评论(1)

  • 2016年06月06日 crawler4j多线程爬虫统计分析数据 摘要: 该事例演示了如何在多线程中统计和分析数据;首先建一个状态实体类CrawlStat:package com.java1234.collectingData;/** * 爬虫状态实体类 统计爬虫信息 * @author * */public class CrawlStat { private int total... 发表于 2016-06-06 13:20 阅读(7202) 评论(5)

  • 2016年06月06日 crawler4j处理单个页面 摘要: 这个类演示了crawler4j如何爬取一个网页的数据 以及抽取出标题和文本信息代码有详细注释:package com.java1234.collectingData;import org.apache.http.HttpStatus;import edu.uci.ics.crawler4j.crawler.C... 发表于 2016-06-06 11:30 阅读(7141) 评论(0)

  • 2016年06月06日 crawler4j图片爬虫 摘要: 该实例主要演示下如何爬取指定网站的图片;代码中有详细注释:首先写一个ImageCrawler类:package com.java1234.imageCrawler4j;import java.io.File;import java.io.IOException;import java.util.UUID;im... c.jpg    d.jpg    发表于 2016-06-06 11:04 阅读(9420) 评论(0)

关注Java1234微信公众号
博主信息
Java1234_小锋
(知识改变命运,技术改变世界)
Powered by Java1234 V3.0 Copyright © 2012-2016 Java知识分享网 版权所有