摘要: LevelDB库简介一、LevelDB入门LevelDB是Google开源的持久化KV单机数据库,具有很高的随机写,顺序读/写性能,但是随机读的性能很一般,也就是说,LevelDB很适合应用在查询较少,而写很多的场景。LevelDB应用了LSM (Log Structured Merge) 策略,l... 阅读全文
posted @ 2014-10-15 15:28 如果的事 阅读(20368) 评论(0) 推荐(2)
摘要: 贝叶斯过滤器过滤垃圾邮件什么是贝叶斯过滤器?垃圾邮件是一种令人头痛的顽症,困扰着所有的互联网用户。正确识别垃圾邮件的技术难度非常大。传统的垃圾邮件过滤方法,主要有"关键词法"和"校验码法"等。前者的过滤依据是特定的词语;后者则是计算邮件文本的校验码,再与已知的垃圾邮件进行对比。它们的识别效果都不理想... 阅读全文
posted @ 2014-09-30 18:26 如果的事 阅读(1329) 评论(0) 推荐(0)
摘要: 朴素贝叶斯分类器一、贝叶斯定理所谓"条件概率"(Conditional probability),就是指在事件B发生的情况下,事件A发生的概率,用P(A|B)来表示。根据文氏图,可以发现同理可得,所以,即其中,P(A)称为"先验概率"(Prior probability),即在B事件发生之前,我们对... 阅读全文
posted @ 2014-09-30 18:19 如果的事 阅读(720) 评论(0) 推荐(0)
摘要: TF-IDF 加权及其应用TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索的常用加权技术。TF-IDF是一种统计方法,用以评估某个单词对于一个文档集合(或一个语料库)中的其中一份文件的重要程度。单词的重要性随着它在文件中出现的次数成... 阅读全文
posted @ 2014-09-30 17:41 如果的事 阅读(5004) 评论(0) 推荐(0)
摘要: 相似图片搜索相似图片搜索是指怎么计算两张图片的相似程度,这里的关键技术叫做"感知哈希算法"(Perceptual hash algorithm),它的作用是对每张图片生成一个"指纹"(fingerprint)字符串,然后比较不同图片的指纹。结果越接近,就说明图片越相似。一、感知哈希算法1、缩小尺寸将... 阅读全文
posted @ 2014-09-30 15:54 如果的事 阅读(1504) 评论(0) 推荐(0)
摘要: 字符集与编码缩写含义:ASCII: American Standard Code for Information InterchangeUCS: Universal Character SetUTF: Unicode/UCS Transformation FormatASCII编码ASCII码是7位... 阅读全文
posted @ 2014-09-29 17:09 如果的事 阅读(518) 评论(0) 推荐(0)
摘要: mysql的Replication机制参考文档:http://www.doc88.com/p-186638485596.htmlMysql的 Replication 是一个异步的复制过程。从上图可以看见MySQL 复制的基本过程如下:Slave 上面的IO线程连接上 Master,并请求从指定日志文... 阅读全文
posted @ 2014-09-28 15:41 如果的事 阅读(1018) 评论(0) 推荐(0)
摘要: git 使用简明手册 git 是由Linus Torvalds领衔开发的一款开源、分布式版本管理系统,显然,git最初是为了帮助管理Linux内核开发而开发的版本控制系统。 版本控制系统本身并不要求一个中央服务器(远端仓库)来存储所有数据,虽然svn是这样做的。 Git允许克隆仓库,克隆的仓库跟被克 阅读全文
posted @ 2014-09-28 11:07 如果的事 阅读(890) 评论(0) 推荐(0)
摘要: 字符串匹配算法 KMP算法 KMP算法是由D.E.Knuth,J.H.Morris和V.R.Pratt提出的。 首先,要了解两个概念: 前缀 (prefix),指除了最后一个字符以外,一个字符串的全部头部组合; 后缀 (suffix),指除了第一个字符以外,一个字符串的全部尾部组合。 "部分匹配值" 阅读全文
posted @ 2014-09-27 19:08 如果的事 阅读(378) 评论(0) 推荐(0)
摘要: TCP/IP协议栈概述这篇文章虽然只是很粗浅的介绍了ISO/OSI 网络模型,但确实把握住了关键点,某种意义上,简单回顾一下就可以加深对TCP/IP协议栈的理解。原作者:阮一峰链接:http://www.ruanyifeng.com/blog/2012/05/internet_protocol_su... 阅读全文
posted @ 2014-09-26 19:10 如果的事 阅读(663) 评论(0) 推荐(0)