会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
草屋主人的blog
专注互联网系统架构
博客园
首页
新随笔
联系
管理
订阅
上一页
1
2
3
4
5
6
7
下一页
2009年3月8日
Tokyo Tyrant(TTServer)系列-启动参数和配置
摘要: 介绍ttserver的各种启动参数以及性能优化。展示了一个线上ttserver实例,数据库文件有28G,读取速度一样非常快,读一次不到1ms。
阅读全文
posted @ 2009-03-08 12:36 草屋主人
阅读(11762)
评论(2)
推荐(0)
2009年3月7日
Tokyo Tyrant(TTServer)系列-介绍和安装
摘要: Tokyo Cabinet 是日本人 Mikio Hirabayashi(平林幹雄)のページ 开发的一款DBM数据库(注:大名鼎鼎的DBM数据库qdbm就是他开发的),该数据库读写非常快。insert:0.4sec/1000000 recordes(2500000qps),写入100万数据只需要0.4秒。search:0.33sec/1000000 recordes (3000000 qps),读取100万数据只需要0.33秒。下图为各种key-value数据库读写数据的性能测试,可以看出Tokyo Cabinet的速度是非常快的。
阅读全文
posted @ 2009-03-07 11:50 草屋主人
阅读(14841)
评论(11)
推荐(0)
2008年11月1日
如何对memcache的数据(key-value)进行遍历操作
摘要: 什么是memcache memcache是一个高性能的分布式的内存对象缓存系统,通过在内存里维护一个统一的巨大的hash表,它能够用来存储各种格式的数据,包括图像、视频、文件以及数据库检索的结果等。Memcache是danga.com的一个项目,最早是为 LiveJournal 服务的,最初为了加速 LiveJournal 访问速度而开发的,后来被很多大型的网站采用。目前全世界不少人使用这个缓存项目来构建自己大负载的网站,来分担数据库的压力。 为什么要遍历 目前,用到memcache的公司和网站也越来越多。Memcache的客户端操作一般都只提供了get,set等简单的操作,这些操作都是非常高效的。 虽然memcache是个key-value存储的系统,但是在某些时候,我们可能需要遍历memcache的数据。
阅读全文
posted @ 2008-11-01 11:08 草屋主人
阅读(22915)
评论(6)
推荐(1)
2007年11月21日
汉语转拼音(带音调和多音字识别)
摘要: 汉语转拼音-----带音调和多音字识别1、 背景几年前就在网上看到过汉字转拼音的程序,大都就是按汉字的编码转换,单字对应的算法实现的。在网上搜索“汉字转拼音”的文章可以搜索到很多,基本都是同一个算法,各种语言的移植版本都有,但是都有一个共同的缺点,不能支持多音字。比如“重庆”,“重量”这样的词语就不能正确的识别,这在很多应用中会是一个非常大的缺陷,更不用说支持音调。(来自http://sunli....
阅读全文
posted @ 2007-11-21 15:31 草屋主人
阅读(25272)
评论(42)
推荐(1)
2006年4月7日
后天去北京了
摘要: 胡乱的完成了令我讨厌的毕业设计,订好了后天中午的机票到北京了,又买了个160G的硬盘对数据进行整理了下。
阅读全文
posted @ 2006-04-07 23:49 草屋主人
阅读(736)
评论(0)
推荐(0)
2006年3月26日
[转]一个简单的中文分词
摘要: CLucene - a C++ search engine http://sourceforge.net/projects/clucene/ 传统的全文检索都是基于数据库的,Sql Server Oracle mysql 都提供全文检索,但这些比较大,不适合单机或小应用程序(Mysql4.0以上可以作为整合开发),Mysql也不支持中文。 后来得知Apache有一个开源的全文检索引...
阅读全文
posted @ 2006-03-26 10:14 草屋主人
阅读(1621)
评论(4)
推荐(0)
[转]基于逆向最大化词表中文分词法。
摘要: 以前做知识管理系统的时候,由于需要建立全文检索和统计词频,需要对中文文本进行分词。对于中文分词, 国内做到好的应该是中科院自然研究所,但是相对比较复杂,我看了几次没有看明白. :) ,由于平常我们的知识系统对分词的要求没有这么高,所以 就选择了最大化的词表分词法. 词表选择的是人民日报97版的词表.实际效果可以达到90%以上,基本可以满足需要。支持 Lucene.net分词,词表是启动时一次性...
阅读全文
posted @ 2006-03-26 10:11 草屋主人
阅读(1163)
评论(2)
推荐(0)
2006年3月5日
asp模板引擎终结者(WEB开发之ASP模式)
摘要: 作者: 孙立 Email: 17bizAT126.com写于:2006/3/5版权声明:可以任意转载,转载时请务必以超链接形式标明文章原始出处和作者信息及本声明http://sunli.cnblogs.com/archive/2006/03/05/343095.html关键词:ASP 模板摘要: 阐述一种全新的ASP模板引擎,实现代码(逻辑)层与HTML(表现)层的分离.这种模板实现方法避免了一 ...
阅读全文
posted @ 2006-03-05 09:22 草屋主人
阅读(3578)
评论(6)
推荐(0)
2006年1月1日
今天2006的第一天,灰蒙蒙的元旦节!
摘要: 本来天气预报说今天多云,结果上午下雨了!下午没下了,3点钟才出去转了下西湖!天气不好,有点雾,灰蒙蒙,一个下午没有发现一点点的节日气氛,今年怎么了,因为天气吗? 下午拍了些西湖的照片.
阅读全文
posted @ 2006-01-01 19:06 草屋主人
阅读(683)
评论(0)
推荐(0)
2005年12月31日
2005年即将过去,迎来崭新的2006
摘要: 2005,我从大三走进大四,走进学生生涯的最后一年,这一年过得很平常,也过得很充实,这一年发生了很多事,有好事也有不好的事. 这一年我在web开发`这一块算是进步比较大,基础了很多新的东西,也学到很多新的东西,但是却发现不懂的东西和需要学习的东西是约来越多.在web开发上基本上可以自由发挥了,再也不一定需要去改别人的程序.在搜索引擎上有很大进步,开发出一个spider,做了一个rs...
阅读全文
posted @ 2005-12-31 22:53 草屋主人
阅读(646)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
下一页
公告