摘要: hadoop计算需要在hdfs文件系统上进行,文件上传到hdfs上通常有三种方法:a hadoop自带的dfs服务,put;b hadoop的API,Writer对象可以实现这一功能;c 调用OTL可执行程序,数据从数据库直接进入hadoop hadoop计算需要在hdfs文件系统上进行,因此每次计算之前必须把需要用到的文件(我们称为原始文件)都上传到hdfs上。文件上传到hdfs上通常有三种方法: ahadoop自带的dfs服务,put; bhadoop的API,Writer对象可以实现这一功能; c调用OTL可执行程序,数据从数据库直接进入hadoop 由于存在ETL层,因此第三种方案.. 阅读全文
posted @ 2012-12-19 18:35 ccmaotang 阅读(2580) 评论(0) 推荐(0)