会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
打赏
大数据和人工智能躺过的坑
我是一枚热衷技术的程序员,我是九月哥,每天都在路上! 3个微信公众号:大数据躺过的坑、九哥九嫂小日子、今日热点在线 2个 百家号:九哥九嫂小日子、九哥聊IT 欢迎您的加入,一起来探讨交流技术。 目前重点研究Spring、Spring boot、Hadoop、HBase、Zookeeper、Flume、Kafka、Sqoop、Hive、Spark、Flink、Docker等,对Kettle二次开发有一定研究。
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
89
90
91
92
93
94
95
96
97
···
180
下一页
2017年4月24日
-bash : ** : command not found的问题解决(图文详解)
摘要: 问题来源 我不小心,配置错了,少了个export和PATH没配对。 source /etc/profile 之前一定要留心,否则出错让你后悔去! 问题导致现象1 问题导致现象2 解决办法 按e键,进入 再按e键,选择kernel选项 再按e,输入single 输入“singel“ 或者是“1“”,又
阅读全文
posted @ 2017-04-24 10:21 大数据和AI躺过的坑
阅读(61400)
评论(0)
推荐(0)
2017年4月23日
java.lang.RuntimeException: HRegionServer Aborted的问题
摘要: 进程情况 问题 解决办法 分布式集群HBase启动后某节点的HRegionServer自动消失问题
阅读全文
posted @ 2017-04-23 17:54 大数据和AI躺过的坑
阅读(7913)
评论(0)
推荐(0)
2017年4月22日
Solr 读数据流程
摘要: Solr 读数据流程: 1、用户提供搜索关键词,也就是搜索语句,需要经过分词器处理以及语言处理。 2、对处理之后的关键词,搜索索引找出对应Document 即记录。 3、用户根据需要从找到的Document中提取需要的Field字段。
阅读全文
posted @ 2017-04-22 18:12 大数据和AI躺过的坑
阅读(666)
评论(0)
推荐(0)
Solr 写数据流程
摘要: Solr 写数据流程: 1、源字符串首先经过分词器处理,包括:拆分词以及去除stopword。 2、然后经过语言处理,包括大小写转换以及单词转换。 3、将源数据中需要的信息加入到Document中的各个Field字段中,并把需要索引的Field字段索引起来,同时把需要存储的Field字段存储起来。然
阅读全文
posted @ 2017-04-22 14:55 大数据和AI躺过的坑
阅读(833)
评论(0)
推荐(0)
solr索引创建流程
摘要: solr索引创建流程: 分词组件Tokenizer 分词组件(Tokenizer)会做以下几件事情(这个过程称为:Tokenize),处理得到的结果是词汇单元(Token)。 1、将文档分成一个一个单独的单词。 2、去除标点符号。 3、去除停词(stop word)。 语言处理组件 语言处理组件(l
阅读全文
posted @ 2017-04-22 14:54 大数据和AI躺过的坑
阅读(1249)
评论(0)
推荐(0)
Solr 倒排索引
摘要: 正排索引(正向索引):正排表是以文档的ID为关键字,表中记录文档中每个字的位置信息,查找时扫描表中每个文档中字的信息直到找出所有包含查询关键字的文档。 正排表结构如图1所示,这种组织方法在建立索引的时候结构比较简单,建立比较方便且易于维护;因为索引是基于文档建立的,若是有新的文档加入,直接为该文档建
阅读全文
posted @ 2017-04-22 14:50 大数据和AI躺过的坑
阅读(3106)
评论(0)
推荐(0)
Solr 核心组成
摘要: Solr 核心组成就是:SolrHome 和 SolrCore。 SolrHome:SolrHome是Solr运行的主目录,该目录可以包含多个solrcore目录。 SolrCore:每个solrcore相互独立,可以单独对外提供搜索和索引服务;Solr实例就是一个solrcore目录,包含运行so
阅读全文
posted @ 2017-04-22 14:49 大数据和AI躺过的坑
阅读(618)
评论(0)
推荐(0)
Solr的关键特性
摘要: 1.基于标准的开放接口:Solr搜索服务器支持通过XML、JSON和HTTP查询和获取结果。 2.易管理:Solr可以通过HTML页面管理,Solr配置通过XML完成。 3.可伸缩性:能够有效地复制到另外一个Solr搜索服务器。 4.灵活的插件体系:新功能能够以插件的形式方便的添加到Solr服务器上
阅读全文
posted @ 2017-04-22 14:45 大数据和AI躺过的坑
阅读(516)
评论(0)
推荐(0)
为什么选择Solr?
摘要: 在大型的SQL数据库上很难执行高速的查询有Solr是Apache 下的一个开源项目,使用Java基于Lucene开发的全文检索服务; 它是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;
阅读全文
posted @ 2017-04-22 14:44 大数据和AI躺过的坑
阅读(1177)
评论(0)
推荐(0)
2017年4月21日
kibana-4.6.3-linux-x86_64.tar.gz的安装(图文详解)(升级)
摘要: 前期博客 kibana-4.6.3-linux-x86_64.tar.gz的下载(图文详解) 因为,我的机器情况是如下: 1、上传 2、解压 3、删除压缩包和赋予用户组和用户权限 4、为了后续灵活多变,使用多版本(想变成高手的实力必备),创建软链接 大数据各子项目的环境搭建之建立软连接(博主推荐)
阅读全文
posted @ 2017-04-21 22:21 大数据和AI躺过的坑
阅读(2052)
评论(0)
推荐(0)
上一页
1
···
89
90
91
92
93
94
95
96
97
···
180
下一页
公告