摘要: 文本挖掘 1. 文本挖掘 1.1. 什么是文本挖掘 文本挖掘指的是从文本数据中获取有价值的信息和知识,它是数据挖掘中的一种方法。文本挖掘中最重要最基本的应用是实现文本的分类和聚类,前者是有监督的挖掘算法,后者是无监督的挖掘算法。 文本挖掘是一个多学科混杂的领域,涵盖了多种技术,包括数据挖掘技术、信息 阅读全文
posted @ 2019-09-21 13:46 木林森__𣛧 阅读(784) 评论(0) 推荐(0)
摘要: elasticsearch数据组织结构 1. mapping 1.1. 简介 mapping:意为映射关系,特别是指组织结构。在此语境中可理解为数据结构,包括表结构,表约束,数据类型等。(非母语环境伤不起。。。晦涩无比,半小时才转过圈来) 1.2. mapping type 每个索引都有一个映射类型 阅读全文
posted @ 2019-09-21 13:43 木林森__𣛧 阅读(671) 评论(0) 推荐(0)
摘要: ik解析器 1. ik解析器 The IK Analysis plugin integrates Lucene IK analyzer (http://code.google.com/p/ik-analyzer/) into elasticsearch, support customized dic 阅读全文
posted @ 2019-09-21 13:41 木林森__𣛧 阅读(427) 评论(0) 推荐(0)
摘要: elasticsearch概念 1. 前言 它是一个数据库?但一般叫它搜索引擎 为什么需要这么一种数据存储及搜索模式?以下面的数据为例: name:小明 id:007 info:巴拉巴拉巴拉巴拉 msg:巴拉巴拉巴拉巴拉 数据库的功能实际只有两种,存储,搜索; elasticsearch的方法就是把 阅读全文
posted @ 2019-09-21 13:40 木林森__𣛧 阅读(229) 评论(0) 推荐(0)
摘要: elasticsearch 分词器 1. 分词器构造 一个分词器——无论内置还是自定义,是一个包含三个生成块的包:character filters, tokenizers, and token filter.(字符过滤器,断词,分词过滤) 1.1. character filters 字符过滤器接 阅读全文
posted @ 2019-09-21 13:35 木林森__𣛧 阅读(184) 评论(0) 推荐(0)
摘要: 解析-analysis 1. 解析-analysis 可以理解为分词。 解析由解析器——analyzer执行,解析器包括内置和用户自定义两种。 1.1. 解析器 1.1.1. 内置解析器 doc:https://www.elastic.co/guide/en/elasticsearch/refere 阅读全文
posted @ 2019-09-21 13:34 木林森__𣛧 阅读(865) 评论(0) 推荐(0)
摘要: python 语法-参数注释 最近碰到的这样的代码: def func(a:"shuoming") -> int: print("函数已运行。") func(34) 查阅得知它是一种新的参数注释方式,在3.5引入。 参数注释以冒号为分隔符,函数注释以->为分隔符。 它只是一种说明,并没有强制检查功能 阅读全文
posted @ 2019-09-21 13:06 木林森__𣛧 阅读(578) 评论(0) 推荐(0)
摘要: markdown 语法 一、标题 在想要设置为标题的文字前面加 (有一个空格)来表示 一个 是一级标题,二个 是二级标题,以此类推。支持六级标题。 示例: 这是一级标题 这是二级标题 这是三级标题 这是四级标题 这是五级标题 这是六级标题 二、字体 左右各两个\ 号 加粗 左右各一个\ 号 斜体 左 阅读全文
posted @ 2019-09-21 12:59 木林森__𣛧 阅读(200) 评论(0) 推荐(0)