木柴

  博客园 :: 首页 :: 新随笔 :: 联系 :: 订阅 :: 管理 ::

随笔分类 -  Hadoop与分布式

MapReduce/hdfs/...
摘要:本身是一个常见简单的需求,目的是得到一个权值流量的分布情况。数据原型是几T的日志数据,每条记录都有很多字段,其中有一个字段为该记录的权重。每一条记录是一个流量。A B CTanx FourthView 0Tencent Na 20Allyes FirstView 200Adx OtherView 5... 阅读全文
posted @ 2014-04-26 20:26 木柴 阅读(415) 评论(0) 推荐(0)

摘要:引用一个正式的 Apache Maven的定义: Maven是一个项目管理工具,它包含了一个项目对象模型 (Project Object Model),一组标准集合,一个项目生命周期(ProjectLifecycle),一个依赖管理系统(Dependency Management System),和用来运行定义在生命周期阶段(phase)中插件(plugin)目标(goal)的逻辑。 当你使用Maven的时候,你用一个明确定义的项目对象模型来描述你的项目,然后 Maven 可以应用横切的逻辑,这些逻辑来自一组共享的(或者自定义的)插件。maven安装好后的目录项:LICENSE.txt包含Ap 阅读全文
posted @ 2013-07-13 18:56 木柴 阅读(327) 评论(0) 推荐(0)