摘要:
每次逛fuse的sourceforge主页都会有新的收获,今天在Filesystem Based on Fuse列表中,发现了一个fusefile的文件系统,其提供将一个文件挂载到另一个文件上的功能(支持偏移和追加模式),如对于/dev/sda的磁盘文件,通常是不推荐用户直接读写磁盘文件的,一旦不小心破坏了超级块或重要的数据块就麻烦了。此时就可通过fusefile,将/dev/sda的一部分挂载... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(360)
评论(0)
推荐(0)
摘要:
Man page of xargs
xargs reads items from the standard input, delimited by blanks (which can be protected with double or single quotes or a backslash) or newlines, and executes the command (default is... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(296)
评论(0)
推荐(0)
摘要:
FAT文件系统分为三个部分:保留区、FAT区和数据区,如下所示:
|--- 保留区 ---|--- FAT1 ---|---FAT2---|---数据区 ---| 1. 保留区中包含文件系统的一些总体信息,类似于unix文件系统里的超级块信息。
2. FAT区包含文件的分配表链。
3. 数据区存放实际的文件数据(目录的数据为目录项列表)。 本人电脑C盘的空间约为40G,簇大小为32k(簇类似... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(1653)
评论(0)
推荐(0)
摘要:
为了使问题简单化,在根目录下创建文件dnfs-server.conf,由于根目录的inode节点为2(ls –i –l –d /),且第一个块组的inode table起始块号为483),查看根目录的索引节点信息。
(参考http://blog168.chinaunix.net/space.phpuid=20196318&do=blog&id=31362)
hexdump /dev/sda1 -... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(396)
评论(0)
推荐(0)
摘要:
以前在做项目的时候简单的研究过一致性hash,后来看Dynamo的实现原理时,对里面的虚拟节点不是很理解,也一直没有找到好的资料解释这个问题,昨天在光谷书城偶然看到一本讲网络爬虫的书上分析了这个问题,今天再在网上找了些资料,加深了对这个问题的认识。 一致性hash原理:http://blog.csdn.net/sparkliang/archive/2010/02/02/5279393.aspx
... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(619)
评论(0)
推荐(0)
摘要:
最近几天看了些搜索引擎方面的书,主要阅读了《自己动手写搜索引擎》、《自己动手写网络爬虫》、《搜索引擎技术实践》、《搜索模式》、《瞬间之美》等书,都很不错,也学到了不少知识,本文谈一下我对构建搜索引擎的认识。 要构建一个搜索引擎,首先要确定搜索源,也即被搜索的对象。被搜索的对象可以是一堆文档,用户需要确定包含某关键字的文档集合;可以是一系列网页,用户需要确定跟关键字内容相关的网页;或是一系列的图片... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(932)
评论(0)
推荐(0)
摘要:
腾讯的纯真IP数据库收集了包括中国电信、中国移动、中国联通、长城宽带、聚友宽带等 ISP 的最新准确 IP 地址数据,包含了IP地址与国家/地区的对应关系,其信息保存在QQWry.dat文件中。 IP数据库应用的场合较为广泛,下面举几个常见的例子:
1.根据客户的IP地址确定客户来源,为后期的客户行为分析提供基础,例如需要统计学生群体的访问特点,这时我们就是通过分析来自教育网的IP地址的那些请... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(563)
评论(0)
推荐(0)
摘要:
最近两个月都在研究元数据组织与检索的问题,没有方向、没有借鉴,没有取得任何进展。在调研的过程中,发现自己很out,win7的强大是我之前没有想到的,以为Win7只是界面绚丽了一些,用户体验好了一点点,但没有发现Win7的库那么强大,据我所知,很多Win7的用户并不使用库。 Win7的库是建立在文件系统之上,按照文件的属性/标签(可设置)建立索引(以文件的形式),通过库能很方便的管理系统的文档、... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(167)
评论(0)
推荐(0)
摘要:
Lucene不是一个完整的全文索引应用,而是是一个用Java写的全文索引引擎工具包,它可以方便的嵌入到各种应用中实现针对应用的全文索引/检索功能,Lucene的目标是为各种中小型应用程序加入全文检索功能。(参考http://www.chedong.com/tech/lucene.html)
Lucene包含分词,索引,搜索等几个模块,支持单个关键字查询、范围查询、短语查询等,为构建全文搜索引擎提... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(319)
评论(0)
推荐(0)
摘要:
/dev/sda1为ext3格式的分区,使用dumpe2fs /dev/sda1可查看文件系统的总体信息。
#dumpe2fs /dev/sda1 Filesystem OS type: Linux
Inode count: 491520
Block count: 1965402
Reserved block count: 98270
Free blocks: 1020744
Free ino... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(292)
评论(0)
推荐(0)
浙公网安备 33010602011771号