会员
众包
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
奔跑的小河
Talk is cheap. Show me the code.
导航
博客园
首页
新随笔
联系
订阅
管理
公告
2017年5月23日
常用文本操作命令
摘要: 1. tr 按列替换 删除输入中的 "{" 和 "}" 将文件testfile中的小写字母全部转换成大写字母 2. cut : cut [ b] [file] 列切分 cut 命令从文件的每一行剪切字节、字符和字段并将这些字节、字符和字段写至标准输出。 如果不指定 File 参数,cut 命令将读取
阅读全文
posted @ 2017-05-23 20:27 奔跑的小河
阅读(598)
评论(0)
推荐(0)
编辑
2017年4月19日
记一次蛋疼的mongo to hive导数过程
摘要: 1. 起因 一次hive查数过程中,发现hive中缺省了10天的近3000w的数据,自问自答:怎么办,当然是要补数啊!从哪里补,mongo啊(还好mongo中有一份)! mongo中数据是bson保存,而且数据列与hive不一样! 2. 解决方案 方案1: 思路:由于 只能以逗号分割字段,所以要导到
阅读全文
posted @ 2017-04-19 20:11 奔跑的小河
阅读(327)
评论(0)
推荐(0)
编辑
记一次22亿大数据分析处理踩坑经历
摘要: 前言 :用最简单最少的语言,分享我的坑,理不理解需求不重要,问题都在shell代码中,看shell极度枯燥,希望能有帮助! 一. 起因 需求,分析hive表中两年内用户XX的所有数据,按照每天早,中,晚三个时间段统计,按照两年内的节假日统计,按照月份的上旬,中旬,下旬统计,按照周末,工作日统计等等。
阅读全文
posted @ 2017-04-19 20:10 奔跑的小河
阅读(1079)
评论(0)
推荐(0)
编辑
2015年7月20日
说说我对写技术博客的感受
摘要: 前言 其实在读大学时就开始想写技术博客,可是一直都没有开始,就在今年的一个偶然的想法,就陆陆续续开始写自己的博客,后来基本就成为一种习惯,当每遇到或学习了一种 新的技术或知识,第一想法就是整理到自己的博客里去,而以前总是喜欢拿个txt或者word总结整理出来。写到txt或word中一个非常不好的就是
阅读全文
posted @ 2015-07-20 18:12 奔跑的小河
阅读(169)
评论(0)
推荐(0)
编辑
2015年7月19日
仰视源码,实现strlen
摘要: 最近对于C++源码特别感兴趣,读源码,然后根据源码实现一遍,对我帮助蛮大的。下面给出我们天天用的strlen的实现: 普通实现 size_t strlen1(const char* str){ const char* tmp = str; size_t rtn = 0; while(tmp++ !=
阅读全文
posted @ 2015-07-19 20:27 奔跑的小河
阅读(130)
评论(0)
推荐(0)
编辑
字符串匹配算法——Boyer-Moore算法
摘要: 字符串匹配算法很多,Boyer-Moore算法也不算是效率最高的算法,它常用于各种文本编辑器的”查找”功能(Ctrl+F)。 比较经典的字符串模式匹配算法还有:Horspool算法、Sunday算法、KR算法、AC自动机等。不多说,进入主题。 Boyer-Moore算法概率 假定字符串为”HERE
阅读全文
posted @ 2015-07-19 17:29 奔跑的小河
阅读(337)
评论(0)
推荐(0)
编辑
2015年7月18日
KMP字符串匹配算法—用最容易理解的方式描述(整理)
摘要: 看了数据结构书上对于快速模式匹配算法KMP的介绍,感觉云里雾里。本文根据自己理解,并查资料整理了一种非常清晰简单的字符串匹配算法,并给予实现,自诩原创吧。 字符串匹配是我们经常要用到的一种算法,与普通的匹配算法相比KMP算法效率更高,时间复杂度为O(m+n)。下面给予详细讲解: 概念详解 设原字符串
阅读全文
posted @ 2015-07-18 21:00 奔跑的小河
阅读(253)
评论(0)
推荐(0)
编辑
LeetCode之RemoveElement
摘要: 题目: Given an array and a value, remove all instances of that value in place and return the new length. The order of elements can be changed. It doesn’
阅读全文
posted @ 2015-07-18 10:18 奔跑的小河
阅读(84)
评论(0)
推荐(0)
编辑
2015年7月16日
Linux中fork函数详解
摘要: 如果对中间的零碎的讲解没有兴趣,可以直接跳到文章末尾,看总结。 一、fork基础知识 一个进程,包括代码、数据和分配给进程的资源。fork()函数通过系统调用创建一个与原来进程几乎完全相同的进程,也就是两个进程可以做完全相同的事,但如果初始参数或者传入的变量不同,两个进程也可以做不同的事。 一个进程
阅读全文
posted @ 2015-07-16 20:47 奔跑的小河
阅读(250)
评论(0)
推荐(0)
编辑
Linux中的经典双链表的实现
摘要: 首先上一篇博客介绍了Linux下的两个经典宏,它可以根据结构体中的成员变量地址,计算出结构体地址。有了它,就可以实现可复用的高效双链表。这次我再Windows环境下给予的实现,看完觉得会受益匪浅。 Linux中双向链表的使用思想 它是将双向链表节点嵌套在其它的结构体中;在遍历链表的时候,根据双链表节
阅读全文
posted @ 2015-07-16 19:29 奔跑的小河
阅读(265)
评论(0)
推荐(0)
编辑
下一页