摘要: hadoop--MapReduce倒排索引 1.倒排索引介绍 倒排索引是文档检索系统中最常用的数据结构,被广泛应用于全文搜索引擎。倒排索引主要用来存储某个单词(或词组)在一组文档中的存储位置的映射,提供了可以根据内容来查找文档的方式,而不是根据文档来确定内容,因此称为倒排索引(Inverted In 阅读全文
posted @ 2020-09-24 16:14 贾高兴 阅读(643) 评论(0) 推荐(0)
摘要: 使用java api操作hdfs 1. eclipse中创建maven项目 1.1 apache-maven-3.3.9环境配置 新建一个目录存放maven 配置maven环境变量 系统变量:MAVAN_HOME=C:\Application\apache-maven-3.3.9 //地址是存放ma 阅读全文
posted @ 2020-09-21 15:48 贾高兴 阅读(132) 评论(0) 推荐(0)
摘要: MarkDown //#+内容 二级标题 //##+内容 三级标题 //###+内容 四级标题 //###+内容 字体 HelloWorld! //两个乘号+内容+两个乘号 HelloWorld! //一个乘号+内容+一个乘号 HelloWorld! //三个乘号+内容+三个乘号 HelloWorl 阅读全文
posted @ 2020-09-20 22:23 贾高兴 阅读(41) 评论(0) 推荐(0)