2009年4月15日

摘要: package Observer;import java.util.ArrayList;import java.util.List;//import java.lang.Exception;//事件类,用来响应事件class WakenUpEvent{ private long time; private String loc; private Child source;// 发出这件事的源对象 ... 阅读全文

posted @ 2009-04-15 18:02 pual.k3 阅读(192) 评论(0) 推荐(0)


2009年4月10日

摘要: Java从网络上获取资源的步骤一般如下:首先,生成URL对象;然后,用Java中相应的方法去获取对象中所代表的资源;最后,可以使用相应的方法对该资源进行相应的操作。下面是几个常用的Java获取网络资源的例子:1. Java从网络上获取图片:Java Applet可以直接从网络上结点获取图象并显示出来。有两种格式,举例如下:格式一:import java.net.MalformedURLExcept... 阅读全文

posted @ 2009-04-10 16:42 pual.k3 阅读(464) 评论(0) 推荐(0)


2009年4月8日

摘要: wait(object对象方法)时别的线程可以访问锁定对象*调用wait方法时必须锁定该对象Sleep(String对象方法)时别的线程不能访问锁定对象 阅读全文

posted @ 2009-04-08 12:40 pual.k3 阅读(189) 评论(0) 推荐(0)


2009年4月3日

摘要: java常见错误以及可能原因集锦 2008-07-08 15:550、 需要标识符 a) 不在函数内 1、 非法表达式开始 b) 可能:丢失括号 . 2. no data found a) 可能:setInt(1,100)中,没有100这个值 3. 找不到符号 a) 可能:没导入包 4. 指定了无效URL a) 可能:数据库名或IP错误,即连接出错 5. 类路径没有找到 a) 可能: ClassN... 阅读全文

posted @ 2009-04-03 11:32 pual.k3 阅读(2345) 评论(1) 推荐(0)


2009年4月2日

摘要: 有以下三点体会:进程是一个静态的概念;线程是一个进程中不同的执行路径;在同一个时间点上一个CPU只能支持一个线程在执行;多核可以支持多线程。Java通过Java.lang.Thread实现多线程,可以通过创建Thread对象的run()方法来实现,也可以通过使用start()来启动新线程。通过run()有两种方法实现:定义线程实现Runnable接口: Thread myThread=new Th... 阅读全文

posted @ 2009-04-02 17:40 pual.k3 阅读(262) 评论(0) 推荐(0)

摘要: 网上找到的两个简单爬虫的类图和序列图。仔细分析一下,可以知道一个网络爬虫需要完成的任务流程是: 获得网页的URL->根据URL进行连接->获得网页内容 阅读全文

posted @ 2009-04-02 11:56 pual.k3 阅读(1533) 评论(0) 推荐(0)

摘要: 这几天一直在看爬虫的东西,找到的一点东西先放着。import java.io.*;import java.net.*;public class FirstSocket{ public static void main(String args[]) { //判断参数是否为两个,正确的用法为 FirstSocket 网站 页面 if(args.length!=2) { System.out.print... 阅读全文

posted @ 2009-04-02 11:05 pual.k3 阅读(833) 评论(0) 推荐(0)

摘要: publicclassAccessimplementsRunnable{HttpURLConnectionhuc;InputStreamis;BufferedReaderreader;Stringurl;publicAccess(){try{url="http://www.yahoo.com.cn";}catch(Exceptione){e.printStackTrace();}try{huc=(... 阅读全文

posted @ 2009-04-02 11:03 pual.k3 阅读(484) 评论(0) 推荐(0)

摘要: 主题网络爬虫就是根据一定的网页分析算法过滤与主题无关的链接, 保留主题相关的链接并将其放入待抓取的URL 队列中; 然后根据一定的搜索策略从队列中选择下一步要抓取的网页URL, 并重复上述过程, 直到达到系统的某一条件时停止。所有被网络爬虫抓取的网页将会被系统存储, 进行一定的分析、过滤, 并建立索引, 对于主题网络爬虫来说, 这一过程所得到的分析结果还可能对后续的抓取过程进行反馈和指导。主题网络... 阅读全文

posted @ 2009-04-02 10:14 pual.k3 阅读(1320) 评论(1) 推荐(0)

摘要: RBSE (Eichmann,1994)是第一个发布的爬虫。它有两个基础程序。第一个是“spider”,抓取队列中的内容到一个关系数据库中,第二个程序是“mite”,是一个修改后的www的ASCII浏览器,负责从网络上下载页面。   WebCrawler(Pinkerton,1994)是第一个公开可用的 用来建立全文索引的一个子程序,他使用库www... 阅读全文

posted @ 2009-04-02 09:50 pual.k3 阅读(1557) 评论(1) 推荐(0)


博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3