HDFS 中 -test 的用法(判断后面路径的属性)、Linux查看进程 ps、实现需求的步骤、solr是什么?

HDFS 中 -test 的用法(判断后面路径的属性)

hadoop fs -test -[参数] <path>

参数:

-d :后面路径为目录,返回0

-e :后面路径存在,返回0

-f :后面路径为文件,返回0

-s :若path大小大于0字节,返回0

-z :若path大小为0字节,返回0,否则返回1

shell中 一般0代表true,1代表false

Linux查看进程 ps

主要的两种:两者没太大差别

ps -aux: 用于查看进程

-a:查看所有终端机的进程

-u:列出属于该用户的进程

-x:显示所有

同ps -ef 不同的有列有
USER      //用户名 
%CPU      //进程占用的CPU百分比 
%MEM      //占用内存的百分比 
VSZ      //该进程使用的虚拟內存量(KB) 
RSS      //该进程占用的固定內存量(KB)(驻留中页的数量) 
STAT      //进程的状态 
START    //该进程被触发启动时间 
TIME      //该进程实际使用CPU运行的时间
其中STAT状态位常见的状态字符有
D      //无法中断的休眠状态(通常 IO 的进程); 
R      //正在运行可中在队列中可过行的; 
S      //处于休眠状态; 
T      //停止或被追踪; 
W      //进入内存交换 (从内核2.6开始无效); 
X      //死掉的进程 (基本很少见); 
Z      //僵尸进程; 
<      //优先级高的进程 
N      //优先级较低的进程 
L      //有些页被锁进内存; 
s      //进程的领导者(在它之下有子进程); 
l      //多线程,克隆线程(使用 CLONE_THREAD, 类似 NPTL pthreads); 
+      //位于后台的进程组;

ps -ef: 常用于查看进程号

-e:列出进程时显示每个进程所用的环境变量

-f:显示进程之间的相互关系

UID    //用户ID、但输出的是用户名 
PID    //进程的ID 
PPID    //父进程ID 
C      //进程占用CPU的百分比 
STIME  //进程启动到现在的时间 
TTY    //该进程在那个终端上运行,若与终端无关,则显示? 若为pts/0等,则表示由网络连接主机进程。 
CMD    //命令的名称和参数

做需求的步骤:

  1. 熟悉所涉及的表结构及表中数据
  2. 分析需求
  3. 分布实现需求

solr是什么?

Solr是一个开源搜索平台,用于构建搜索应用程序。 它建立在Lucene(全文搜索引擎)之上。 Solr是企业级的,快速的和高度可扩展的。 使用Solr构建的应用程序非常复杂,可提供高性能。

Solr是一个可扩展的,可部署,搜索/存储引擎,优化搜索大量以文本为中心的数据。

posted @ 2022-06-06 10:49  赤兔胭脂小吕布  阅读(340)  评论(0)    收藏  举报