HDFS 中 -test 的用法(判断后面路径的属性)、Linux查看进程 ps、实现需求的步骤、solr是什么?
HDFS 中 -test 的用法(判断后面路径的属性)
hadoop fs -test -[参数] <path>
参数:
-d :后面路径为目录,返回0
-e :后面路径存在,返回0
-f :后面路径为文件,返回0
-s :若path大小大于0字节,返回0
-z :若path大小为0字节,返回0,否则返回1
shell中 一般0代表true,1代表false
Linux查看进程 ps
主要的两种:两者没太大差别
ps -aux: 用于查看进程
-a:查看所有终端机的进程
-u:列出属于该用户的进程
-x:显示所有
同ps -ef 不同的有列有
USER //用户名
%CPU //进程占用的CPU百分比
%MEM //占用内存的百分比
VSZ //该进程使用的虚拟內存量(KB)
RSS //该进程占用的固定內存量(KB)(驻留中页的数量)
STAT //进程的状态
START //该进程被触发启动时间
TIME //该进程实际使用CPU运行的时间
其中STAT状态位常见的状态字符有
D //无法中断的休眠状态(通常 IO 的进程);
R //正在运行可中在队列中可过行的;
S //处于休眠状态;
T //停止或被追踪;
W //进入内存交换 (从内核2.6开始无效);
X //死掉的进程 (基本很少见);
Z //僵尸进程;
< //优先级高的进程
N //优先级较低的进程
L //有些页被锁进内存;
s //进程的领导者(在它之下有子进程);
l //多线程,克隆线程(使用 CLONE_THREAD, 类似 NPTL pthreads);
+ //位于后台的进程组;
ps -ef: 常用于查看进程号
-e:列出进程时显示每个进程所用的环境变量
-f:显示进程之间的相互关系
UID //用户ID、但输出的是用户名
PID //进程的ID
PPID //父进程ID
C //进程占用CPU的百分比
STIME //进程启动到现在的时间
TTY //该进程在那个终端上运行,若与终端无关,则显示? 若为pts/0等,则表示由网络连接主机进程。
CMD //命令的名称和参数
做需求的步骤:
- 熟悉所涉及的表结构及表中数据
- 分析需求
- 分布实现需求
solr是什么?
Solr是一个开源搜索平台,用于构建搜索应用程序。 它建立在Lucene(全文搜索引擎)之上。 Solr是企业级的,快速的和高度可扩展的。 使用Solr构建的应用程序非常复杂,可提供高性能。
Solr是一个可扩展的,可部署,搜索/存储引擎,优化搜索大量以文本为中心的数据。