【第三天】从本地(或hdfs)文本文件导入数据到Hive

  由于之前对hive基本没了解过,所以,上午花了点时间,专门去了解下Hive的基本操作和命令。

 

 

  步骤分为两步:

①从文本文件读取数据,这个直接在kettle输入里面选择控件就行了,注意下分隔符要设置成和文件里面对应的分隔符,比如空格或TAB,否则将不能成功识别数据。

②第一步成功后,将能成功预览数据,接下来需要将数据导入到Hive上去,

先hive --service hiveserver启动服务(注意不要CTRL-C,否则服务就断了)

然后再添加一个表输出空间,选择Hive,做好相应的设置

但,最后还是无法成功运行,提示

Caused by: HiveServerException(message:Query returned non-zero code: 40000, cause: FAILED: ParseException line 1:12 missing TABLE at 'logs' near 'logs' in select clause
line 1:17 cannot recognize input near '(' 'id' ',' in select clause
, errorCode:40000, SQLState:42000)

这个问题目前无法解决,据大神说是jar包或者是kettle本身源码就有问题。

posted @ 2014-07-14 17:39  allan00  阅读(554)  评论(0编辑  收藏  举报