摘要:
http://blog.csdn.net/lwm_1985/article/details/6738112打造自己的中文分词器之如何让Lucene认识自己的分词器 2011-09-01 09:25 12人阅读 评论(0) 收藏 举报 更新日期:2008-11-08 点击... 阅读全文
posted @ 2011-09-30 20:44
lexus
阅读(455)
评论(0)
推荐(0)
摘要:
http://blog.csdn.net/lwm_1985/article/details/6738112打造自己的中文分词器之如何让Lucene认识自己的分词器 2011-09-01 09:25 12人阅读 评论(0) 收藏 举报 更新日期:2008-11-08 点击... 阅读全文
posted @ 2011-09-30 20:44
lexus
阅读(455)
评论(0)
推荐(0)
摘要:
http://hi.baidu.com/chanajianxin/blog/item/9b36608bb7dfc013c8fc7a9c.html 改写lucene的Analyzer,添加自己的中文分词系统的方法(原创) 2007-04-30 16:16 /***作者:夺天策 百度空间名:刹那剑欣*转载请说明出处!*/ 这几天完成了我的中文分词算法,就着手把它加入到lucene中去... 阅读全文
posted @ 2011-09-30 20:30
lexus
阅读(733)
评论(2)
推荐(0)
摘要:
ArrayList Vector LinkedList 区别与用法 最近用到了,所以依然是转载ArrayList 和Vector是采用数组方式存储数据,此数组元素数大于实际存储的数据以便增加和插入元素,都允许直接序号索引元素,但是插入数据要设计到数组元素移动 等内存操作,所以索引数据快插入数据慢,Vector由于使用了synchronized方法(线程安全)所以性能上比Array... 阅读全文
posted @ 2011-09-30 18:44
lexus
阅读(426)
评论(0)
推荐(0)
摘要:
ArrayList Vector LinkedList 区别与用法 最近用到了,所以依然是转载ArrayList 和Vector是采用数组方式存储数据,此数组元素数大于实际存储的数据以便增加和插入元素,都允许直接序号索引元素,但是插入数据要设计到数组元素移动 等内存操作,所以索引数据快插入数据慢,Vector由于使用了synchronized方法(线程安全)所以性能上比Array... 阅读全文
posted @ 2011-09-30 18:38
lexus
阅读(179)
评论(0)
推荐(0)
摘要:
http://mqbing.iteye.com/blog/76913 LinkedList vs ArrayList RESTJDK.netBlog 晚上和同学讨论 LinkedList 和 ArrayList的区别... 讨论时发现信息太少,于是在网上找了些资料..存一下. 今天看到的一个Blog上的内容,我把大致... 阅读全文
posted @ 2011-09-30 18:35
lexus
阅读(185)
评论(0)
推荐(0)
摘要:
[博主推荐]一个允许你反悔的hook--PushbackInputStream和PushbackReader 2008-08-01 23:12 [转载]:http://hi.baidu.com/ppchar/blog/item/b3738364f532e1f1f6365479.html PushbackInputStream和PushbackReader是Java I/... 阅读全文
posted @ 2011-09-30 18:27
lexus
阅读(446)
评论(0)
推荐(0)
摘要:
nutch1.3和solr3.x集成时出现Invalid UTF-8 character问题 http://blog.csdn.net/laigood12345/article/details/6689611Hadoop的Python语言封装 Gao Ang 发表于 2010年05月25日 11:38 | Hits: 1404 Tag: 编程语言 ... 阅读全文
posted @ 2011-09-30 16:09
lexus
阅读(458)
评论(0)
推荐(0)
摘要:
Hadoop的Python语言封装 Gao Ang 发表于 2010年05月25日 11:38 | Hits: 1404 Tag: 编程语言 Hadoop使
用Java语言实现,编写具体的应用业务除了借助Hadoop的Java API外,还可以使用开发者所熟悉的Python或C++等其他语言编码。在Hadoop安装路径的/src/examples/目录中,给出了
Python实现... 阅读全文
posted @ 2011-09-30 16:07
lexus
阅读(1279)
评论(0)
推荐(0)
摘要:
Nutch 使用入门(一)——准备工作及Intranet抓取http://softkid.iteye.com/blog/625736http://51mst.iteye.com/blog/1155120 2011-08-22 nutch1.3 +hadoop 分布式部署(亲测) 博客分类:nutchhadoop ... 阅读全文
posted @ 2011-09-30 15:56
lexus
阅读(634)
评论(0)
推荐(0)
摘要:
Nutch 使用入门(一)——准备工作及Intranet抓取http://softkid.iteye.com/blog/625736 阅读全文
posted @ 2011-09-30 15:15
lexus
阅读(246)
评论(0)
推荐(0)
摘要:
Other ways to get JRuby If you use RVM, then installing JRuby is also a piece of cake: <font color="#CC0000"><code>rvm install jruby</code></font> JRuby might also be available as OS packages for y... 阅读全文
posted @ 2011-09-30 14:26
lexus
阅读(160)
评论(0)
推荐(0)
摘要:
由于在google和cnblogs的搜索引擎里都没有收录完全,自己找东西很麻烦,搜索不到,之前还考虑说solr,现在看来直接nutch就好了 阅读全文
posted @ 2011-09-30 13:53
lexus
阅读(155)
评论(0)
推荐(0)
摘要:
http://www.donanza.com/jobs/p3315101-crawler_with_data_analysis_hadoop_mapreduce_hbase_phase_icrawler with data analysis (Hadoop, MapReduce, HBase) - Phase I - Data Modeling Goal for Phase ... 阅读全文
posted @ 2011-09-30 13:49
lexus
阅读(275)
评论(0)
推荐(0)
摘要:
http://www.donanza.com/jobs/p3315101-crawler_with_data_analysis_hadoop_mapreduce_hbase_phase_icrawler with data analysis (Hadoop, MapReduce, HBase) - Phase I - Data Modeling Goal for Phase ... 阅读全文
posted @ 2011-09-30 13:39
lexus
阅读(225)
评论(0)
推荐(0)
摘要:
http://www.searchtb.com/2011/01/understanding-hbase.htmlHBase vs Cassandra: 我们迁移系统的原因 http://wangxu.me/blog/p/371 阅读全文
posted @ 2011-09-30 10:44
lexus
阅读(244)
评论(0)
推荐(0)
摘要:
http://chandlerproject.org/wikihome 阅读全文
posted @ 2011-09-30 08:39
lexus
阅读(255)
评论(0)
推荐(0)
摘要:
基于 hive 的日志数据统计实战http://blog.javaworker.cn/index.php/archives/104 阅读全文
posted @ 2011-09-30 08:18
lexus
阅读(279)
评论(0)
推荐(0)
|