11 2016 档案

摘要:1、cloudera 数据压缩的一般准则 一般准则 是否压缩数据以及使用何种压缩格式对性能具有重要的影响。在数据压缩上,需要考虑的最重要的两个方面是 MapReduce 作业和存储在 HBase 中的数据。在大多数情况下,每个的原则都类似。 您需要平衡压缩和解压缩数据所需的能力、读写数据所需的磁盘 阅读全文
posted @ 2016-11-30 23:32 林场 阅读(1307) 评论(0) 推荐(0)
摘要:这是15年初,在高德负责数据挖掘团队所做的人地挖掘的一份报告,后续经过几版的迭代,应该是累计国内最全的家和公司位置挖掘,已经应用在多个产品线上。过一段时间分享下具体的实现方法。 1. 摘要 人地关系的家和公司挖掘,经过三轮迭代,融合了AMap和开放平台用户数据,挖掘出来3.32亿名用户的常驻地,家和 阅读全文
posted @ 2016-11-25 15:18 林场 阅读(348) 评论(0) 推荐(0)

知识共享许可协议
本作品由VentLam创作,采用知识共享署名-非商业性使用-相同方式共享 2.5 中国大陆许可协议进行许可。