一个简单的java网络爬虫(spider)Java认证考试

文章作者 100test 发表时间 2010:01:01 15:50:42
来源 100Test.Com百考试题网


  一个简单的java网络爬虫,由于时间原因,没有进一步解释.

  需要的htmlparser.jar包到官方网上去下.

  ---------------Spider.java---------------------------

  import java.io.BufferedReader. import java.io.InputStreamReader. import java.net.URL. import java.net.URLConnection. import java.util.ArrayList. import java.util.HashMap. import java.util.Iterator. import java.util.List. import org.htmlparser.RemarkNode. import org.htmlparser.StringNode. import org.htmlparser.Node. import org.htmlparser.tags.*. import org.htmlparser.Parser. import org.htmlparser.filters.StringFilter. import org.htmlparser.util.NodeIterator. import org.htmlparser.util.NodeList. import org.htmlparser.util.ParserException. import java.util.Queue. import java.util.LinkedList.

  public class Spider implements Runnable {

  boolean search_key_words = false.

  int count = 0.

  int limitsite = 10.

  int countsite = 1.

  String keyword = "中国".//搜索关键字

  Parser parser = new Parser().

  // List linklist = new ArrayList().

  String startsite = "".//搜索的其实站点

  SearchResultBean srb.//保存搜索结果

  List resultlist = new ArrayList().//搜索到关键字链接列表

  List searchedsite = new ArrayList().//已经被搜索站点列表

  Queue linklist = new LinkedList().//需解析的链接列表

  HashMap


相关文章


课程介绍(1)SL110初级Java语言编程Java认证考试
JAVA实现支持视频点播WEB服务器Java认证考试
谈谈JAVA程序的反编译Java认证考试
Java中静态变量的适用场景Java认证考试
一个简单的java网络爬虫(spider)Java认证考试
通过HttpClient获取响应内容字符集Java认证考试
Java应用中使用ProxoolJava认证考试
Java向线程传递数据的三种方法Java认证考试
Java按字节长度截取字符串Java认证考试
澳大利亚华人论坛
考好网
日本华人论坛
华人移民留学论坛
英国华人论坛