会员
众包
新闻
博问
AI培训
云市场
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Eric.cpp
博客园
|
首页
|
新随笔
|
新文章
|
联系
|
订阅
|
管理
2013年9月9日
海量数据处理
摘要: 1亿个ip取频率最高的k个time awk '{++a[$2]}END{for(e in a){print a[e],e}}' xx | sort -rnk1 | head -nk随机取出100个数:grep -v "用户" spam.sort | awk 'BEGIN{v=100/2700050}{if(rand()<v) print $0}' | wc -l
阅读全文
posted @ 2013-09-09 17:07 Eric.cpp
阅读(281)
评论(0)
推荐(0)
编辑
mysql数据导出
摘要: mysql -uUSERNAME -pPASSWORD -hIP -e"select * from TABLENAME" > FILENAME
阅读全文
posted @ 2013-09-09 17:06 Eric.cpp
阅读(173)
评论(0)
推荐(0)
编辑
公告