摘要:
Kafka[1]是linkedin用于日志处理的分布式消息队列,linkedin的日志数据容量大,但对可靠性要求不高,其日志数据主要包括用户行为(登录、浏览、点击、分享、喜欢)以及系统运行日志(CPU、内存、磁盘、网络、系统及进程状态)。 当前很多的消息队列服务提供可靠交付保证,并默认是即时消费(不适合离线)。高可靠交付对linkedin的日志不是必须的,故可通过降低可靠性来提高性能,同时通... 阅读全文
posted @ 2013-04-19 14:11
ydzhang
阅读(283)
评论(0)
推荐(0)
摘要:
svnadmin与svnserve建立代码仓库 1. 假设当前目录为/data/ 2. 建立文件夹: mkdir repos 3. 创建仓库:
(1) cd /data/repos/
(2) svnadmin create myproj 4. 启动svn server:
svnserve -d -r /data/repos/ 5.客户端check out:
svn co svn://1... 阅读全文
posted @ 2013-04-19 14:11
ydzhang
阅读(194)
评论(0)
推荐(0)
摘要:
以前学C++时记的比较,因最近开发用C++较多,把笔记翻出来复习了一下,跟大家分享一下。类的声明及定义 1. class、struct、union保留字都可以用来声明和定义类。class中成员默认为private类型,struct、union与C语言兼容,成员默认为public类型。 2. 只有当类没有显式的定义构造/析构函数时,C++才会提供默认的构造/析构函数;默认的构造函数只负责创建... 阅读全文
posted @ 2013-04-19 14:11
ydzhang
阅读(191)
评论(0)
推荐(0)
摘要:
目前机器上vim的配置为: Vim + ctags + taglist + omnicppcomplete + MiniBufExplorer +BufExplorer +
NERD_tree + DoxgenToolkit 1. taglist插件:用于显示文件的tag,需要ctags的支持 下载:http://vim.sourceforge.net/scripts/script.... 阅读全文
posted @ 2013-04-19 14:11
ydzhang
阅读(270)
评论(0)
推荐(0)
摘要:
micro_httpd是一个轻量级的http服务器 (http://www.acme.com/software/micro_httpd/),micro_httpd从xinetd运行,性能较差,但对于负载较小的网站,micro_httpd是能胜任的,其实现了http服务器的一些基本特征功能:
1. ..文件名探测以保证安全;
2. 常用MIME类型识别;
3. Trailing-slash重定向;... 阅读全文
posted @ 2013-04-19 14:11
ydzhang
阅读(1113)
评论(0)
推荐(0)
摘要:
TCTDB是tokyo cabinet家族中的表格数据库(如上图),其实现基于TCHDB(hash
database)和TCBDB(B-tree database)。 TCHDB参考:http://blog.chinaunix.net/space.php?uid=20196318&do=blog&id=327754 TCBDB的代码没有读过,有时间也阅读一下,其结构如下图所示。 TC... 阅读全文
posted @ 2013-04-19 14:11
ydzhang
阅读(435)
评论(0)
推荐(0)
摘要:
中国大的视频服务网站主要有优酷、土豆、酷六、还有几大门户(腾讯、新浪、搜狐等),他们都是以提供视频发布及观看、视频搜索(目录分类及导航)为主,网站上提供视频的主要是由专门的娱乐、体育类的网络编辑整理并发布到网站上的,视频大都来自于各大电视台、还有电影公司、当然还会有一些热心的拍客会上传他们的作品(有的拍客是把视频网站当做一个广告平台来宣传自己的)。 有些视频网站也会做一些特别的策划,在所有的视... 阅读全文
posted @ 2013-04-19 14:11
ydzhang
阅读(330)
评论(0)
推荐(0)
摘要:
位图主要用于快速检索关键字状态,通常要求关键字是一个连续的序列(或者关键字是一个连续序列中的大部分), 最基本的情况,使用1bit标示一个关键字的状态(可标示两种状态),但根据需要也可以使用2bit(标示4种状态),3bit(标示8种状态),当一个状态标示需要的位数达到32bit时,就演变成来一个整型数组了。 位图的主要应用场合:标示连续(或接近连续,即大部分会出现)的关键字序列的状态(状态数/... 阅读全文
posted @ 2013-04-19 14:11
ydzhang
阅读(854)
评论(0)
推荐(0)
摘要:
1. linux提供opendir、readdir(readdir_r)、closedir和scandir等接口实现对目录的读取;2. readdir返回指向下一个目录项的指针,如果要自己传入缓冲区存储目录项,应使用readdir_r代替。readdir的结果中包含当前目录和上一级目录的目录项信息。3. 在遍历过程中,进程的工作目录不会改变,在递归遍历的时候,需要改变工作目录(chdir)以识别相对路径,或者每次都限定全局路径。4. 深度优先遍历目录树采用递归实现易编码(参见如下代码),广度优先遍历则需借助队列实现。当目录下的文件数量较少时,采用广度优先遍历效率会更高,因目录下的目录项基本都是 阅读全文
posted @ 2013-04-19 14:11
ydzhang
阅读(1091)
评论(0)
推荐(0)
摘要:
TC(Tokyo Cabinet )是日本人平林幹雄开发的一款 Key-Value 键值数据库。Tokyo Cabinet实现的数据库类型分为:TCHDB 哈希数据库、TCBDB B+Tree数据库、TCFDB 定长数据库、TCTDB 表格数据库、TCMDB 内存哈希数据库、TCNDB 内存B+Tree数据库。 下载了TC-0.2.9的源代码(比较老的一版,只实现了TCHDB),简要的了解... 阅读全文
posted @ 2013-04-19 14:11
ydzhang
阅读(301)
评论(0)
推荐(0)
浙公网安备 33010602011771号