摘要:
1. TaggedFrog特性分析(http://lunarfrog.com/) TaggedFrog特点:
1. 导入文件时添加标签(不支持动态标签设置)。
2. 标签以标签云的方式呈现,支持标签搜索。
3. 支持扩展的元数据分析,音视频分析等(需要下扩展包)。
4. 支持对标签进行分组管理。
5. 支持导入/导出标签元数据。 2. TaggTool特性分析 (http://www.tagg... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(1463)
评论(0)
推荐(0)
摘要:
1. Linux系统调用的作用?
系统调用是操作系统为用户态运行的进程与系统内核、硬件设备(如CPU、磁盘、打印机等)进行交互提供的一组接口,在应用程序和硬件之间设置一个额外层的优点包括:
1. 用户编程更加简单,不必学习硬件设备的低级编程特性;
2. 提高了系统的安全性,内核在试图满足某个请求前在接口级可以检查请求正确性。
3. 这组接口使得程序具有可移植性,只要内核所提供的接口相同,使用这些接... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(327)
评论(0)
推荐(0)
摘要:
1. 内核与普通进程获取内存时有何不同?
内核是操作系统中优先级最高的成分,如果某个内核函数请求动态内存,则其必定有正当的理由发出那个请求,内核的内存请求应该立即被满足;内核信任自己,所有的内核函数都被假定是没有错误的,内核函数不必考虑编程错误的保护措施。
而当用户态进程请求分配内存时,进程对动态内存的请求被认为是不紧迫的,当进程的可执行文件被装入时,进程并不一定立即对所有的代码页进行访问,同样的... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(292)
评论(0)
推荐(0)
摘要:
同一硬件高速缓存行可以映射RAM中多个不同的块,相同大小的对象倾向于存放在高速缓存内相同的偏移量处。在不同slab内具有相同偏移量的对象最终很可能映射到同一高速缓存行中。而使用slab分配器的对象通常是频繁使用的小对象,高速缓存的硬件可能因此而花费内存周期在同一高速缓存行与RAM内存单元之间来来往往的传送两个对象。 如下例:假设cache行为32Bytes,CPU包含512个cache行(缓存大... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(1047)
评论(0)
推荐(1)
摘要:
Man page of xargs
xargs reads items from the standard input, delimited by blanks (which can be protected with double or single quotes or a backslash) or newlines, and executes the command (default is... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(296)
评论(0)
推荐(0)
摘要:
以前在做项目的时候简单的研究过一致性hash,后来看Dynamo的实现原理时,对里面的虚拟节点不是很理解,也一直没有找到好的资料解释这个问题,昨天在光谷书城偶然看到一本讲网络爬虫的书上分析了这个问题,今天再在网上找了些资料,加深了对这个问题的认识。 一致性hash原理:http://blog.csdn.net/sparkliang/archive/2010/02/02/5279393.aspx
... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(619)
评论(0)
推荐(0)
摘要:
最近几天看了些搜索引擎方面的书,主要阅读了《自己动手写搜索引擎》、《自己动手写网络爬虫》、《搜索引擎技术实践》、《搜索模式》、《瞬间之美》等书,都很不错,也学到了不少知识,本文谈一下我对构建搜索引擎的认识。 要构建一个搜索引擎,首先要确定搜索源,也即被搜索的对象。被搜索的对象可以是一堆文档,用户需要确定包含某关键字的文档集合;可以是一系列网页,用户需要确定跟关键字内容相关的网页;或是一系列的图片... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(932)
评论(0)
推荐(0)
摘要:
腾讯的纯真IP数据库收集了包括中国电信、中国移动、中国联通、长城宽带、聚友宽带等 ISP 的最新准确 IP 地址数据,包含了IP地址与国家/地区的对应关系,其信息保存在QQWry.dat文件中。 IP数据库应用的场合较为广泛,下面举几个常见的例子:
1.根据客户的IP地址确定客户来源,为后期的客户行为分析提供基础,例如需要统计学生群体的访问特点,这时我们就是通过分析来自教育网的IP地址的那些请... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(563)
评论(0)
推荐(0)
摘要:
最近两个月都在研究元数据组织与检索的问题,没有方向、没有借鉴,没有取得任何进展。在调研的过程中,发现自己很out,win7的强大是我之前没有想到的,以为Win7只是界面绚丽了一些,用户体验好了一点点,但没有发现Win7的库那么强大,据我所知,很多Win7的用户并不使用库。 Win7的库是建立在文件系统之上,按照文件的属性/标签(可设置)建立索引(以文件的形式),通过库能很方便的管理系统的文档、... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(167)
评论(0)
推荐(0)
摘要:
Lucene不是一个完整的全文索引应用,而是是一个用Java写的全文索引引擎工具包,它可以方便的嵌入到各种应用中实现针对应用的全文索引/检索功能,Lucene的目标是为各种中小型应用程序加入全文检索功能。(参考http://www.chedong.com/tech/lucene.html)
Lucene包含分词,索引,搜索等几个模块,支持单个关键字查询、范围查询、短语查询等,为构建全文搜索引擎提... 阅读全文
posted @ 2013-04-19 14:08
ydzhang
阅读(319)
评论(0)
推荐(0)
浙公网安备 33010602011771号