摘要:
版本控制 ElasticSearch采用了乐观锁来保证数据的一致性,也就是说,当用户对document进行操作时,并不需要对该doucument作加锁和解锁的操作,只需要指定要操作的版本即可。当版本号一致时,ElasticSearch会允许该操作顺利执行,而当版本号存在冲突时,ElasticSear
阅读全文
posted @ 2019-03-03 15:06
0x153_小波
阅读(498)
推荐(0)
摘要:
倒排索引 ElasticSearch使用一种称为倒排索引的结构,它适用于快速的全文搜索。一个倒排索引由文档中所有不重复词的列表构成,对于其中每个词,有一个包含它的文档列表。 ElasticSearch使用一种称为倒排索引的结构,它适用于快速的全文搜索。一个倒排索引由文档中所有不重复词的列表构成,对于
阅读全文
posted @ 2019-03-03 15:05
0x153_小波
阅读(397)
推荐(0)
摘要:
基本概念 Index(索引) 含有相同属性的文档集合 类似于mysql数据库中的database Type(类型) 索引可以定义一个或多个类型,文档必须属于一个类型; 类似于mysql数据库中的table表,es中可以在index中建立type(table),通过mapping进行映射 Docume
阅读全文
posted @ 2019-03-03 15:03
0x153_小波
阅读(117)
推荐(0)
posted @ 2019-03-01 21:22
0x153_小波
阅读(98)
推荐(0)
摘要:
写流程 读流程 HDFS写数据流程 HDFS读数据流程 网络拓扑-节点距离计算 节点距离:两个节点到达最近的共同祖先的距离总和
阅读全文
posted @ 2019-03-01 21:18
0x153_小波
阅读(135)
推荐(0)
摘要:
概述 开源、分布式存储、分布式计算 大数据生态体系 特点:开源、社区活跃 囊括了大数据处理的方方面面 成熟的生态圈 推荐系统 应用场景 搭建大型数据仓库,PB级数据的存储、处理、分析、统计 日志分析 数据挖掘 核心组件 HDFS(分布式文件存储系统) 特点:扩展性、容错性、海量数据存储 将文件切分成
阅读全文
posted @ 2019-03-01 20:35
0x153_小波
阅读(146)
推荐(0)
摘要:
面试题 使用Linux命令查询file1中空行所在的行号 [root@slave2 testshell]# awk '/^$/{print NR}' sed.txt 5 [root@slave2 testshell]# cat sed.txt dong shen guan zhen wo wo la
阅读全文
posted @ 2019-02-23 09:55
0x153_小波
阅读(339)
推荐(0)
摘要:
sort sort命令是在Linux里非常有用,它将文件进行排序,并将排序结果标准输出 基本语法 选项说明 案例实操 数据准备 按照第三列排序
阅读全文
posted @ 2019-02-23 09:48
0x153_小波
阅读(145)
推荐(0)
摘要:
awk 一个强大的文本分析工具,把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行分析处理。 基本用法 选项参数说明 案例实操 数据准备 搜索passwd文件以root关键字开头的所有行,并输出该行的第7列 搜索passwd文件以root关键字开头的所有行,并输出该行的第1和7列,中间
阅读全文
posted @ 2019-02-23 09:45
0x153_小波
阅读(359)
推荐(0)
摘要:
sed sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”,接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断反复,直到文件末尾。**文件内容并没有改变**,除非你你使用重定向存储输出 基本用法 选项参数
阅读全文
posted @ 2019-02-22 20:27
0x153_小波
阅读(133)
推荐(0)