摘要:ES中,每个索引都将被划分为若干分片,每个分片可以有多个副本。这些副本共同组成复制组,复制组中的分片在添加或删除文档时必须保持同步,否则,从一个副本中读取的数据将与从另一个副本读取的结果有差异。保持复制组中分片数据同步以及从它们中读取的过程称为数据复制模型。 阅读全文
posted @ 2020-10-21 07:46 奥辰 阅读(235) 评论(0) 推荐(0) 编辑
摘要:ES中的映射(mapping)是用于定义索引中文档以及文档中的字段如何被存储和索引(动词)的一种机制,例如,通过映射我们可以进行如下的这些定义: 索引文档中,哪些字符型字段应该被当做全文本类型; 哪些字段是数值型、时间日期型或者地理空间数据; 定义时间日期型字段的格式; 为动态添加的字段自定义映射规则; 阅读全文
posted @ 2020-10-14 07:37 奥辰 阅读(77) 评论(0) 推荐(0) 编辑
摘要:ES中可以为索引添加别名,一个别名可以指向到多个索引中,同时在添加别名时可以设置筛选条件,指向一个索引的部分数据,实现在关系数据库汇总的视图功能,这就是ES中别名的强大之处。别名是一个非常实用的功能,为我们使用索引提供了极大的灵活性,许多ES的API都支持用别名来代替真实索引名。 阅读全文
posted @ 2020-10-12 07:41 奥辰 阅读(70) 评论(0) 推荐(0) 编辑
摘要:魔法函数是指类内部以双下划线开头,并且以双下划线结尾的函数,在特定时刻,Python会自动调用这些函数。魔法函数不是通过继承等机制获得的,而是类一旦定义,Python内部机制自动会给类赋予这些特殊的函数,且用户是不能创建魔法函数的,即使函数名以双下划线开头和双下划线结尾。通过魔法函数可以实现许多个性化、便捷的操作。 阅读全文
posted @ 2020-09-30 07:29 奥辰 阅读(329) 评论(0) 推荐(0) 编辑
摘要:在上一篇博客中,介绍了ES中的一些核心概念和ES、Kibana安装方法。本节开始,我们从索引开始来学习ES的操作方法。 阅读全文
posted @ 2020-09-28 07:23 奥辰 阅读(236) 评论(0) 推荐(0) 编辑
摘要:Elasticsearch 是一个分布式的 RESTful 风格的分布式可扩展的准实时搜索和分析引擎,一个建立在全文搜索引擎 Apache Lucene(TM) 基础上的搜索引擎.当然 Elasticsearch 并不仅仅是 Lucene 那么简单,它不仅包括了全文搜索功能(或者说倒排索引,将一段词语进行分词,并且将分出的单个词语统一的放到一个分词库中,在搜索时,根据关键字去分词库中检索,找到匹配的内容),还可以进行以下工作 阅读全文
posted @ 2020-09-22 07:24 奥辰 阅读(212) 评论(1) 推荐(1) 编辑
摘要:学过java语言的童鞋都知道,java是一门面向对象语言,其基本思想就是一切皆对象。Python也是一样的,甚至Python将面向对象思想贯彻地更加彻底,因为在Python中,class本身是一个对象,class实例化出来的实例也是对象,方法函数是一个对象,甚至代码模块都是一个对象,这是java不曾拥有的。 阅读全文
posted @ 2020-09-21 07:35 奥辰 阅读(81) 评论(0) 推荐(0) 编辑
摘要:jupyter lab是科学计算的一个十分便捷工具,但其安装配置稍有些繁琐,本文针对jupyter lab安装配置全过程进行记录总结,可使读者少走很多弯路。 阅读全文
posted @ 2020-08-24 09:02 奥辰 阅读(591) 评论(0) 推荐(0) 编辑
摘要:对于英文文本,句子中的词汇可以通过空格很容易得进行划分,但是在我们中文中则不然,没有明显的划分标志,所以需要通过专门的方法(算法)进行分词。在Python中,有多种库实现了各种方法支持中文分词,例如:jieba、hanlp、pkuseg等。在本篇中,先来说说jieba分词。 阅读全文
posted @ 2020-08-18 07:15 奥辰 阅读(384) 评论(0) 推荐(2) 编辑
摘要:循环神经网络(Recurrent Neural Network,RNN)是一种别具一格的网络模型,其循环元节点不仅可以接上来自上层的输入数据,也可以接收自身上一次迭代的输出,基于这种特殊的结构,循环神经网络拥有了短期记忆能力,通过“记忆”保存了数据间的关联关系,所以尤为适合处理语言、文本、视频等时序相关的数据。 阅读全文
posted @ 2020-07-14 07:38 奥辰 阅读(314) 评论(0) 推荐(1) 编辑