摘要:
1. 问题描述 收集日志avro数据中有两个Map字段 、`appUse 支付宝|京东|淘宝|天猫`的用户名单;MapReduce 解决办法如下: 但是,如果要匹配游戏类的app、金融类的app类呢?如果匹配关键词发生了变化呢?显然,我们应该将匹配关键词开放成API,可以自由地匹配正则表达式。这时, 阅读全文
摘要:
最近特别喜欢用Pig,拥有能满足大部分需求的内置函数(built in functions),支持自定义函数(user defined functions, UDF ),能load 纯文本、avro等格式数据;illustrate看pig执行步骤的结果,describe看alias的schema;以 阅读全文
摘要:
1. 介绍 Dijsktra算法是大牛Dijsktra于1956年提出,用来解决有向图单源最短路径问题;但是不能解决负权的有向图,若要解决负权图则需要用到Bellman Ford算法。Dijsktra算法思想:在DFS遍历图的过程中,每一次取出离源点的最近距离的点,将该点标记为已访问,松弛与该点相邻 阅读全文