摘要:
在把hdfs上数据迁移到hive中的表时,若出现数据位NULL,是因为没有指定列分隔符。由于hive默认的分隔符是/u0001(Ctrl+A),为了平滑迁移,需要在创建表格时指定数据的分割符号,语法如下:[sql]view plaincopyprint?hive(default)>createext... 阅读全文
posted @ 2015-07-14 15:34
数据手艺人
阅读(3435)
评论(0)
推荐(0)
摘要:
一、 控制hive任务中的map数:1. 通常情况下,作业会通过input的目录产生一个或者多个map任务。主要的决定因素有: input的文件总个数,input的文件大小,集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到,该参数不能自定义修... 阅读全文
posted @ 2015-07-14 15:31
数据手艺人
阅读(415)
评论(0)
推荐(0)
摘要:
hive内部表、外部表区别自不用说,可实际用的时候还是要小心。1. 内部表:[sql]view plaincopyprint?createtablett(namestring,agestring)location'/input/table_data';此时,会在hdfs上新建一个tt表的数据存放地,... 阅读全文
posted @ 2015-07-14 15:14
数据手艺人
阅读(1147)
评论(0)
推荐(0)
摘要:
1.Hive中的数据库:它是表的一个目录或者命名空间,用来避免表命名冲突,我们通常使用数据库来将生产表组织成逻辑组。基本命令:(1)创建一个数据库(如果不存在该数据库):create databaseif not existstime;(2)查看Hive中所包含的所有数据库:show databas... 阅读全文
posted @ 2015-07-14 15:09
数据手艺人
阅读(239)
评论(0)
推荐(0)
摘要:
insert 语法格式为:1. 基本的插入语法:insert overwrite table tablename [partition(partcol1=val1,partclo2=val2)] select_statement;insert into table tablename [partit... 阅读全文
posted @ 2015-07-14 14:57
数据手艺人
阅读(2323)
评论(0)
推荐(0)
摘要:
我们为你的面试准备选择了 70 个你可能遇到的 shell 脚面问题及解答。了解脚本或至少知道基础知识对系统管理员来说至关重要,它也有助于你在工作环境中自动完成很多任务。在过去的几年里,我们注意到所有的 linux 工作职位都要求脚本技能。1) 如何向脚本传递参数 ?./script argumen... 阅读全文
posted @ 2015-07-14 08:29
数据手艺人
阅读(338)
评论(0)
推荐(0)