上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 26 下一页
摘要: 1. TaggedFrog特性分析(http://lunarfrog.com/) TaggedFrog特点: 1. 导入文件时添加标签(不支持动态标签设置)。 2. 标签以标签云的方式呈现,支持标签搜索。 3. 支持扩展的元数据分析,音视频分析等(需要下扩展包)。 4. 支持对标签进行分组管理。 5. 支持导入/导出标签元数据。 2. TaggTool特性分析 (http://www.tagg... 阅读全文
posted @ 2013-04-19 14:08 ydzhang 阅读(1463) 评论(0) 推荐(0)
摘要: 1. Linux系统调用的作用? 系统调用是操作系统为用户态运行的进程与系统内核、硬件设备(如CPU、磁盘、打印机等)进行交互提供的一组接口,在应用程序和硬件之间设置一个额外层的优点包括: 1. 用户编程更加简单,不必学习硬件设备的低级编程特性; 2. 提高了系统的安全性,内核在试图满足某个请求前在接口级可以检查请求正确性。 3. 这组接口使得程序具有可移植性,只要内核所提供的接口相同,使用这些接... 阅读全文
posted @ 2013-04-19 14:08 ydzhang 阅读(327) 评论(0) 推荐(0)
摘要: 1. 内核与普通进程获取内存时有何不同? 内核是操作系统中优先级最高的成分,如果某个内核函数请求动态内存,则其必定有正当的理由发出那个请求,内核的内存请求应该立即被满足;内核信任自己,所有的内核函数都被假定是没有错误的,内核函数不必考虑编程错误的保护措施。 而当用户态进程请求分配内存时,进程对动态内存的请求被认为是不紧迫的,当进程的可执行文件被装入时,进程并不一定立即对所有的代码页进行访问,同样的... 阅读全文
posted @ 2013-04-19 14:08 ydzhang 阅读(292) 评论(0) 推荐(0)
摘要: 同一硬件高速缓存行可以映射RAM中多个不同的块,相同大小的对象倾向于存放在高速缓存内相同的偏移量处。在不同slab内具有相同偏移量的对象最终很可能映射到同一高速缓存行中。而使用slab分配器的对象通常是频繁使用的小对象,高速缓存的硬件可能因此而花费内存周期在同一高速缓存行与RAM内存单元之间来来往往的传送两个对象。 如下例:假设cache行为32Bytes,CPU包含512个cache行(缓存大... 阅读全文
posted @ 2013-04-19 14:08 ydzhang 阅读(1047) 评论(0) 推荐(1)
摘要: Man page of xargs xargs reads items from the standard input, delimited by blanks (which can be protected with double or single quotes or a backslash) or newlines, and executes the command (default is... 阅读全文
posted @ 2013-04-19 14:08 ydzhang 阅读(296) 评论(0) 推荐(0)
摘要: 以前在做项目的时候简单的研究过一致性hash,后来看Dynamo的实现原理时,对里面的虚拟节点不是很理解,也一直没有找到好的资料解释这个问题,昨天在光谷书城偶然看到一本讲网络爬虫的书上分析了这个问题,今天再在网上找了些资料,加深了对这个问题的认识。 一致性hash原理:http://blog.csdn.net/sparkliang/archive/2010/02/02/5279393.aspx ... 阅读全文
posted @ 2013-04-19 14:08 ydzhang 阅读(619) 评论(0) 推荐(0)
摘要: 最近几天看了些搜索引擎方面的书,主要阅读了《自己动手写搜索引擎》、《自己动手写网络爬虫》、《搜索引擎技术实践》、《搜索模式》、《瞬间之美》等书,都很不错,也学到了不少知识,本文谈一下我对构建搜索引擎的认识。 要构建一个搜索引擎,首先要确定搜索源,也即被搜索的对象。被搜索的对象可以是一堆文档,用户需要确定包含某关键字的文档集合;可以是一系列网页,用户需要确定跟关键字内容相关的网页;或是一系列的图片... 阅读全文
posted @ 2013-04-19 14:08 ydzhang 阅读(932) 评论(0) 推荐(0)
摘要: 腾讯的纯真IP数据库收集了包括中国电信、中国移动、中国联通、长城宽带、聚友宽带等 ISP 的最新准确 IP 地址数据,包含了IP地址与国家/地区的对应关系,其信息保存在QQWry.dat文件中。 IP数据库应用的场合较为广泛,下面举几个常见的例子: 1.根据客户的IP地址确定客户来源,为后期的客户行为分析提供基础,例如需要统计学生群体的访问特点,这时我们就是通过分析来自教育网的IP地址的那些请... 阅读全文
posted @ 2013-04-19 14:08 ydzhang 阅读(563) 评论(0) 推荐(0)
摘要: 最近两个月都在研究元数据组织与检索的问题,没有方向、没有借鉴,没有取得任何进展。在调研的过程中,发现自己很out,win7的强大是我之前没有想到的,以为Win7只是界面绚丽了一些,用户体验好了一点点,但没有发现Win7的库那么强大,据我所知,很多Win7的用户并不使用库。 Win7的库是建立在文件系统之上,按照文件的属性/标签(可设置)建立索引(以文件的形式),通过库能很方便的管理系统的文档、... 阅读全文
posted @ 2013-04-19 14:08 ydzhang 阅读(167) 评论(0) 推荐(0)
摘要: Lucene不是一个完整的全文索引应用,而是是一个用Java写的全文索引引擎工具包,它可以方便的嵌入到各种应用中实现针对应用的全文索引/检索功能,Lucene的目标是为各种中小型应用程序加入全文检索功能。(参考http://www.chedong.com/tech/lucene.html) Lucene包含分词,索引,搜索等几个模块,支持单个关键字查询、范围查询、短语查询等,为构建全文搜索引擎提... 阅读全文
posted @ 2013-04-19 14:08 ydzhang 阅读(319) 评论(0) 推荐(0)
上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 26 下一页