【第三天】从本地(或hdfs)文本文件导入数据到Hive
由于之前对hive基本没了解过,所以,上午花了点时间,专门去了解下Hive的基本操作和命令。
步骤分为两步:
①从文本文件读取数据,这个直接在kettle输入里面选择控件就行了,注意下分隔符要设置成和文件里面对应的分隔符,比如空格或TAB,否则将不能成功识别数据。
②第一步成功后,将能成功预览数据,接下来需要将数据导入到Hive上去,
先hive --service hiveserver启动服务(注意不要CTRL-C,否则服务就断了)
然后再添加一个表输出空间,选择Hive,做好相应的设置
但,最后还是无法成功运行,提示
Caused by: HiveServerException(message:Query returned non-zero code: 40000, cause: FAILED: ParseException line 1:12 missing TABLE at 'logs' near 'logs' in select clause
line 1:17 cannot recognize input near '(' 'id' ',' in select clause
, errorCode:40000, SQLState:42000)
这个问题目前无法解决,据大神说是jar包或者是kettle本身源码就有问题。