摘要:本身是一个常见简单的需求,目的是得到一个权值流量的分布情况。数据原型是几T的日志数据,每条记录都有很多字段,其中有一个字段为该记录的权重。每一条记录是一个流量。A B CTanx FourthView 0Tencent Na 20Allyes FirstView 200Adx OtherView 5...
阅读全文
随笔分类 - Hadoop与分布式
MapReduce/hdfs/...
摘要:引用一个正式的 Apache Maven的定义: Maven是一个项目管理工具,它包含了一个项目对象模型 (Project Object Model),一组标准集合,一个项目生命周期(ProjectLifecycle),一个依赖管理系统(Dependency Management System),和用来运行定义在生命周期阶段(phase)中插件(plugin)目标(goal)的逻辑。 当你使用Maven的时候,你用一个明确定义的项目对象模型来描述你的项目,然后 Maven 可以应用横切的逻辑,这些逻辑来自一组共享的(或者自定义的)插件。maven安装好后的目录项:LICENSE.txt包含Ap
阅读全文

浙公网安备 33010602011771号