摘要: 1. 问题描述 收集日志avro数据中有两个Map字段 、`appUse 支付宝|京东|淘宝|天猫`的用户名单;MapReduce 解决办法如下: 但是,如果要匹配游戏类的app、金融类的app类呢?如果匹配关键词发生了变化呢?显然,我们应该将匹配关键词开放成API,可以自由地匹配正则表达式。这时, 阅读全文
posted @ 2016-01-14 10:46 Treant 阅读(1379) 评论(0) 推荐(1) 编辑
摘要: 最近特别喜欢用Pig,拥有能满足大部分需求的内置函数(built in functions),支持自定义函数(user defined functions, UDF ),能load 纯文本、avro等格式数据;illustrate看pig执行步骤的结果,describe看alias的schema;以 阅读全文
posted @ 2016-01-12 20:21 Treant 阅读(2943) 评论(3) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2015-03-20 10:08 Treant 阅读(1304) 评论(0) 推荐(3) 编辑
摘要: 1. 介绍 Dijsktra算法是大牛Dijsktra于1956年提出,用来解决有向图单源最短路径问题;但是不能解决负权的有向图,若要解决负权图则需要用到Bellman Ford算法。Dijsktra算法思想:在DFS遍历图的过程中,每一次取出离源点的最近距离的点,将该点标记为已访问,松弛与该点相邻 阅读全文
posted @ 2014-08-28 18:00 Treant 阅读(4130) 评论(0) 推荐(1) 编辑