上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 26 下一页
摘要: Lucene支持基于词条的TermQuery、RangeQuery、PrefixQuery、BolleanQuery、PhraseQuery、WildcardQuery、FuzzyQuery,另外lucene提供了功能强大的QueryParse用于从查询表达式中分析出查询请求。 1. TermQuery与QueryParser 单个单词作为查询表达式时,它相当于一个单独的项。如果表达式是由单个... 阅读全文
posted @ 2013-04-19 14:09 ydzhang 阅读(288) 评论(0) 推荐(0)
摘要: 花了点时间研究lucene的索引格式,测试的时候我使用的是2.9.3版本的,但由于后来版本的索引相对较复杂,我就学习了下1.4版本的索引格式,主要是参见lucene官方网站上的文档(http://lucene.apache.org/java/1_4_3/fileformats.html)。 1. Lucene中的基本概念 Lucene中基本的概念包括索引,文档,域,和词条。 l 索引(inde... 阅读全文
posted @ 2013-04-19 14:09 ydzhang 阅读(312) 评论(0) 推荐(0)
摘要: Tair是由淘宝开发的一个key/value存储系统。 参考:http://rdc.taobao.com/blog/cs/?p=302 在数据分配方面,Tair使用了对照表,对照表由于数据路由功能,由配置服务器(configserver负责维护),configserver周期性的初始化各个数据节点的信息,并通过Heartbeat来管理数据节点的状态。对照表通常包含多个slot(应远大于数据... 阅读全文
posted @ 2013-04-19 14:09 ydzhang 阅读(600) 评论(0) 推荐(0)
摘要: Bitcask来自于riak,是一个日志(log-structured)存储系统。用在riak的分布式数据库的底层key/value的存储。 Bitcask的一些基本特征: 1. key/value以日志的形式按顺序存储,只能追加(append-only)写入key/value,每次写操作都是顺序写入。当某个key所对应的value发生变化时,新的key/value被追加到文件末尾。 2... 阅读全文
posted @ 2013-04-19 14:09 ydzhang 阅读(1340) 评论(0) 推荐(0)
摘要: 有限状态机是文本处理的利器,关于有限状态机的理论比较复杂,但在实际文本处理应用中, 只需要对有限状态机的模型有所了解,搞清楚状态转移关系即可快速的写出程序。 如对网络配置文件进行解析(与/etc/sysconfig/network-scripts/ifcfg-eth0文件类似的格式) 格式如下:(其中以#开头的行为注释行,有效的配置字符为数字,字母和点号) #this is a net wor... 阅读全文
posted @ 2013-04-19 14:09 ydzhang 阅读(297) 评论(0) 推荐(0)
摘要: 115优盘(http://u.115.com) 115优盘是由雨林木风最新推出具有存储容量大、免费、高速、稳定、易用,安全等特点的免费网络硬盘,即免费网络存储空间服务。115优盘初始提供3G的永久存储空间以及5G的临时存储空间,支持文件共享,支持外链,并提供了客户端工具。 联想网盘 (http://www.lenovodata.com) 联想网盘为用户提供了5G的“免费”存储空间,但我最近登录时... 阅读全文
posted @ 2013-04-19 14:09 ydzhang 阅读(445) 评论(0) 推荐(0)
摘要: 在HDFS中,NameNode用来管理文件系统的命名空间,其将所有的文件和文件夹的元数据保存在一个文件系统树中,这些信息会在硬盘上保存为fsimage(命名空间镜像)和edits(修改日志)文件;其还保存了文件包含哪些数据块,分布在哪些数据节点上,但这些数据并不保存在硬盘上,而是在系统启动的时候从数据节点收集而来的。DataNode是文件系统中真正存储数据的地方,其周期性的向元数据节点回报期存储... 阅读全文
posted @ 2013-04-19 14:09 ydzhang 阅读(1528) 评论(0) 推荐(0)
摘要: 1. 创建java运行环境 l 下载jdk for linux: jdk-6u22-linux-i586.bin http://www.java.com/zh_CN/download/manual.jsp l 安装jdk:chmod a+x jdk-6u22-linux-i586.bin; ./ jdk-6u22-linux-i586.bin l 设置环境变量 #vi /etc/pr... 阅读全文
posted @ 2013-04-19 14:09 ydzhang 阅读(337) 评论(0) 推荐(0)
摘要: 内核中很多地方都需要跟踪记录C语言中结构的实例。尽管这些对象的用法大不相同,但各个子系统的某些操作都非常类似,如引用计数,内核为了减少代码复制,采用了一般性的方法来管理内核对象。所引入的框架并不只是为了减少代码复制,同时也为内核不同部分管理的对象提供了一致的视图。 一般性的内核对象机制可用于执行下列对象操作: 1. 引用计数; 2. 管理对象链表; 3. 集合加锁; 4. 将对象属性... 阅读全文
posted @ 2013-04-19 14:09 ydzhang 阅读(825) 评论(0) 推荐(0)
摘要: 什么是 XML? 1. XML是一种可扩展的标记语言 (Extensible Markup Language)。 2. XML的标记 (tag) 没有被预定义,用户可以自行定义标记来描述数据。 3. XML主要用来描述和存储数据。 4. XML具有自我描述性。 5. XML是树状结构的文档,是个结构化的文档。 6. XML文档是个文本文件。 XML 的优点 1. 易携带和传输: XML... 阅读全文
posted @ 2013-04-19 14:09 ydzhang 阅读(168) 评论(0) 推荐(0)
上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 26 下一页