摘要:
Linux find 命令用来在指定目录下查找文件。任何位于参数之前的字符串都将被视为欲查找的目录名。如果使用该命令时,不设置任何参数,则 find 命令将在当前目录下查找子目录与文件。并且将查找到的子目录和文件全部进行显示。 参考网址:https://www.cnblogs.com/chyingp 阅读全文
posted @ 2021-06-08 17:41
温家三哥
阅读(3846)
评论(0)
推荐(0)
摘要:
特殊变量 首先来看几个特殊变量: 1 #!/bin/bash 2 echo $0 # 当前脚本的文件名(间接运行时还包括绝对路径)。 3 echo $n # 传递给脚本或函数的参数。n 是一个数字,表示第几个参数。例如,第一个参数是 $1 。 4 echo $# # 传递给脚本或函数的参数个数。 5 阅读全文
posted @ 2021-06-08 17:01
温家三哥
阅读(3377)
评论(0)
推荐(0)
摘要:
-- hive的库、表等数据操作实际是hdfs系统中的目录和文件,让开发者可以通过sql语句, 像操作关系数据库一样操作文件内容。 一、hiveSQL转化为MR过程 一直好奇hiveSQL转化为MR过程,好奇hive是如何做到这些的,所以在网上找了几篇相关博客,根据自己理解重新画了一份执行过程图,做 阅读全文
posted @ 2021-06-08 16:22
温家三哥
阅读(1249)
评论(0)
推荐(0)
摘要:
一、 控制hive任务中的map数: 1. 通常情况下,作业会通过input的目录产生一个或者多个map任务。主要的决定因素有: input的文件总个数,input的文件大小,集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到,该参数不能自定义 阅读全文
posted @ 2021-06-08 16:11
温家三哥
阅读(282)
评论(0)
推荐(0)
摘要:
1.hive是什么? 2.MapReduce框架实现SQL基本操作的原理是什么? 3.Hive怎样实现SQL的词法和语法解析? hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。hive数据仓库工具能将结构 阅读全文
posted @ 2021-06-08 15:33
温家三哥
阅读(2197)
评论(0)
推荐(1)

浙公网安备 33010602011771号