摘要: 1、什么是大数据 百度百科描述:大数据(bigdata)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。 IBM提出了大数据的5V特征:Volume(大量)、Velocity(高速 阅读全文
posted @ 2016-11-17 18:03 dolittle 阅读(3686) 评论(0) 推荐(0) 编辑
摘要: kylin部署 阅读全文
posted @ 2016-09-28 10:55 dolittle 阅读(2399) 评论(0) 推荐(0) 编辑
摘要: 1、按照时间戳范围查询记录 echo "scan 'event_log', { COLUMN => 'cf:sid', TIMERANGE => [1466265600272, 1471622400481]} " | hbase shell > ./record.txt 其中这里的cf:sid和ke 阅读全文
posted @ 2016-08-30 16:49 dolittle 阅读(6248) 评论(1) 推荐(1) 编辑
摘要: SHELL 阅读全文
posted @ 2016-08-30 16:25 dolittle 阅读(1057) 评论(0) 推荐(0) 编辑
摘要: solr使用点滴 阅读全文
posted @ 2016-08-19 14:17 dolittle 阅读(1326) 评论(0) 推荐(0) 编辑
摘要: 详细记录了cm5.7.2和cdh5.7.2卸载过程 阅读全文
posted @ 2016-08-13 10:10 dolittle 阅读(6216) 评论(0) 推荐(0) 编辑
摘要: 通过yum离线部署cm,易于后期升级 阅读全文
posted @ 2016-08-12 15:45 dolittle 阅读(1013) 评论(0) 推荐(0) 编辑
摘要: 记录CDH部署步骤过程,记录重要问题 阅读全文
posted @ 2016-08-04 19:20 dolittle 阅读(2511) 评论(0) 推荐(0) 编辑