星云外

2010年4月16日

MATLAB与word,excel,powerpoint联用(2009-02-24 16:40:39)转载

摘要: http://blog.sina.com.cn/s/blog_5ecfd9d90100ciwr.htmlMATLAB与Microsoft Excel的连接本章需要读者对MATLAB与Microsoft Excel有一定的使用经验。介绍使用MATLAB ExcelBuilder实现MATLAB和MicrosoftExcel连接的方法和技巧,从而实现两者的无缝接口。希望通过本章的学习,能够让读者对Ex... 阅读全文

posted @ 2010-04-16 12:51 星云外 阅读(612) 评论(0) 推荐(0) 编辑

2010年4月15日

zz信息检索领域相关资料

摘要: 其一、领域内出名的国际会议,ACM SIGIR/SIGKDD, WWW, ECIR其二、ACM library和IEEE,springer的网站信息检索领域相关资料 (A Guide to Information Retrieval) Organized by Hongfei Yan Last updated on April 19, 2006 --------------------- Cont... 阅读全文

posted @ 2010-04-15 00:10 星云外 阅读(843) 评论(0) 推荐(0) 编辑

2010年4月13日

zt SQL Server如何定时作业

摘要: 文章来源: http://www.zc2008.com/blog/post/331.html 如果在SQL Server 里需要定时或者每隔一段时间执行某个存储过程或3200字符以内的SQL语句时,可以用管理->SQL Server代理->作业来实现。 1、管理->SQL Server代理->作业(按鼠标右键)->新建作业-> 2、新建作业属性(常规)->... 阅读全文

posted @ 2010-04-13 10:50 星云外 阅读(187) 评论(0) 推荐(0) 编辑

2010年4月10日

zt "你不是不好,你只是不够好"

摘要: “因为屡次被封禁,已经许久没有规律性的上欧洲留学这个版面了。个人以为封禁我的原因多种多样,最欣慰的是看到从来没有因为我说了一些政治敏感言论而封我,警告我的,从这点来说,我可以说与现在的版主版务道不同,不相为谋,倒也可以说这几位不失为正人。至于说到我和其他老校友对骂,或者我骂了对方不回应等待我被封,然后在被封之后又出来跳梁这种《奥塞罗》式的做法,说实话,我根本不在乎。而其实我被封最多的原... 阅读全文

posted @ 2010-04-10 15:45 星云外 阅读(232) 评论(0) 推荐(0) 编辑

2010年4月9日

搜索排名与点击率分析(含明细) AOL-user-ct报告(1)

摘要: ·AOL-user-ct 基本信息总日志条数:36,389,567条 (约3639万条)有点击搜索条数:19,442,628 (约1944万条)·排名点击率分布小结1-18名占据九成三占击1-18名占据总点击数比率:93.42%前10名占据点击率9成89.65%的点击来自于第1页。第2页及以后所占有的点击率约10%。大致的情况。第1名与第2,3名点击率有关明显的差异。(... 阅读全文

posted @ 2010-04-09 15:21 星云外 阅读(457) 评论(0) 推荐(0) 编辑
AOL-user-ct-collection

摘要: 500k User Session Collection----------------------------------------------This collection is distributed for NON-COMMERCIAL RESEARCH USE ONLY. Any application of this collection for commercial purpose... 阅读全文

posted @ 2010-04-09 15:19 星云外 阅读(557) 评论(0) 推荐(0) 编辑

2010年4月7日

C# SortedList 和 SortedDictionary 集合类型

摘要: System.Collections.SortedList 类、System.Collections.Generic.SortedList 泛型类和 System.Collections.Generic.SortedDictionary 泛型类类似于 Hashtable 类和 Dictionary 泛型类,因为它们也实现 IDictionary 接口,但是它们以基于键的排序顺序维护元素,没有哈希表... 阅读全文

posted @ 2010-04-07 14:55 星云外 阅读(1218) 评论(0) 推荐(0) 编辑

2010年4月5日

测试nutch-1.0的IndexWriter

摘要: public static void main(String[] args) throws IOException{ String indexPath = "F:\\nutch\\test1"; LuceneWriter writer = new LuceneWriter(); Configuration conf= NutchConfiguration.create(); JobConf job... 阅读全文

posted @ 2010-04-05 22:01 星云外 阅读(339) 评论(0) 推荐(0) 编辑
Nutch中MapReduce的分析

摘要: Nutch是最早用MapReduce的项目 (Hadoop其实原来是Nutch的一部分),Nutch的plugin机制吸取了eclipse的plugin设计思路。在Nutch中 MapReduce编程方式占据了其核心的结构大部分。从插入url列表(Inject),生成抓取列表(Generate),抓取内容(Fetch), 分析处理内容(Parse),更新Crawl DB库(Update ),转化链... 阅读全文

posted @ 2010-04-05 11:30 星云外 阅读(813) 评论(0) 推荐(0) 编辑

2010年4月4日

Introduction to Nutch, Part 2: Searching

摘要: Introduction to Nutch, Part 2: SearchingThu, 2006-02-16Tom WhiteIn part one of this two part series on Nutch, theopen-source Java search engine, we looked at how to crawl websites.Recall that the Nutc... 阅读全文

posted @ 2010-04-04 12:05 星云外 阅读(761) 评论(0) 推荐(0) 编辑