上一页 1 2 3 4 5 6 ··· 8 下一页
摘要: 一、拉格朗日乘数法简介 在日常的生产生活中,当我们要要安排生产生活计划的时候,常常会在现实物理资源约束的条件下,计算得到收益最大或者损失最小的计划; 像这种对自变量有附加条件的极值称为条件极值;拉格朗日乘数法是一种直接计算解决条件极值的方法; 拉格朗日乘数法的定义如下: 设有 \(f(x, y), 阅读全文
posted @ 2022-04-19 09:12 无风听海 阅读(1387) 评论(0) 推荐(0) 编辑
摘要: 一、从生活角度来理解朴素贝叶斯算法 朴素贝叶斯算法是统计学味道最浓的一款算法,也是最能体现我们日常生活经验的算法; 与我们读万卷书行万里路形成我们自己的生活经验类似,朴素贝叶斯算法也是基于收集的历史数据分析得到相关事情发生的原因,从而形成解决问题的模型; 与我们面对未知的未来类似,基于自己的生活经验 阅读全文
posted @ 2022-04-12 09:11 无风听海 阅读(548) 评论(0) 推荐(0) 编辑
摘要: 一、高亮的一些问题 elasticsearch提供了三种高亮方式,前面我们已经简单的了解了elasticsearch的高亮原理; 高亮处理跟实际使用查询类型有十分紧密的关系,其中主要的一点就是muti term 查询的重写,例如wildcard、prefix等,由于查询本身和高亮都涉及到查询语句的重 阅读全文
posted @ 2022-03-30 08:45 无风听海 阅读(662) 评论(0) 推荐(0) 编辑
摘要: 1.双击执行脚本文件 在控制台中执行脚本文件,相当于调用应用程序,控制太需要检查脚本文件具有执行权限,同时需要注意通过相对路径结合path定位文件的问题; 通过在文件系统中设置双击可执行文件的行为,可以实现双击直接执行脚本的功能; 2.cent os 7 防火墙开启某个端口 firewall-cmd 阅读全文
posted @ 2022-03-28 09:53 无风听海 阅读(62) 评论(0) 推荐(0) 编辑
摘要: 一、问题源起 从Web From过来的人应该会比较熟悉以下下载文件的代码; [HttpPost] [Route("Download")] public void Download() { HttpResponse response = HttpContext.Current.Response; re 阅读全文
posted @ 2022-03-28 08:26 无风听海 阅读(568) 评论(0) 推荐(2) 编辑
摘要: 1.远程调试Java应用 -agentlib:jdwp=transport=dt_socket,server=y,suspend=n,address=*:5005 阅读全文
posted @ 2022-03-24 08:56 无风听海 阅读(26) 评论(0) 推荐(0) 编辑
摘要: 一、highlight简介 highlight是提升用户体验的重要手段,搜索引擎通过高亮突出命中关键字等方式,方便用户通过关键字周围的信息快速的确认是否是自己希望的结果; highlight功能通常包含以下三个主要的处理过程 1.将字段文本拆分为小的片段; 2.找出最相关的片段; 3.高亮查询关键字 阅读全文
posted @ 2022-03-17 08:36 无风听海 阅读(1427) 评论(1) 推荐(0) 编辑
摘要: 一、什么是词项向量 词项向量(term vector)是由elasticsearch在index document的时候产生,其包含对document解析过程中产生的分词的一些信息,例如分词在字段值中的位置、开始和结束的字符位置、分词的元数据payloads等; term vector是单独进行存储 阅读全文
posted @ 2022-03-15 07:29 无风听海 阅读(451) 评论(0) 推荐(0) 编辑
摘要: 决策树算法是一种通用的机器学习算法,既可以执行分类也可以执行回归任务,同时也是一种可以拟合复杂数据集的功能强大的算法; 一、可视化决策树模型 通过以下代码,我们使用iris数据集构建一个决策树模型,我们使用数据的后两个维度并设置决策树的最大深度为2,最后通过export出iris_tree.dot文 阅读全文
posted @ 2022-03-07 08:36 无风听海 阅读(841) 评论(0) 推荐(0) 编辑
摘要: 一、K近邻算法简介 K近邻算法(K-Nearest Neighbor)简称KNN算法,是最简单的预测模型之一,它没有多少数学上的假设,也不要求任何复杂的处理,它所要求的只有以下两点 1.某种距离计算概念 2.彼此接近的点具有相似的性质 即对于一个新样本,算法在已有数据中寻找与它最相似的K个数据,或者 阅读全文
posted @ 2022-03-03 09:02 无风听海 阅读(595) 评论(0) 推荐(0) 编辑
摘要: 面对海量的信息,我们很容易被淹没在信息的海洋中;当我们需要查找某个信息的时候,我们就会输入能够体现我们意图的关键字,搜索引擎会通过解析我们的关键字从而构造相应的查询表示方法;然后搜索引擎通过构造的查询在内存存储的文档集合中查找跟用户需求相关的文档,并根据相关度进行排序;以上搜索引擎进行计算的过程就是 阅读全文
posted @ 2022-03-02 08:25 无风听海 阅读(840) 评论(0) 推荐(0) 编辑
摘要: 一、使用场景介绍 elasticsearch除了普通的全文检索之外,在很多的业务场景中都有使用,各个业务模块根据自己业务特色设置查询条件,通过elasticsearch执行并返回所有命中的记录的id;如果命中的记录数达到数万级别的话,查询性能会有明显的下降,尤其是命中超大型的document的时候; 阅读全文
posted @ 2022-02-19 08:24 无风听海 阅读(885) 评论(0) 推荐(0) 编辑
摘要: 一、elasticsearch智能推荐简介 elasticsearch作为一个流行搜索引擎,通过用户输入的关键字来寻找匹配的文档,以便用户触达想要的信息;而推荐系统也是类似的处理过程,其首先拿到一个可以表征用户或者物品的数据记录,然后找到跟此记录最接近的记录推荐给用户; the more link 阅读全文
posted @ 2022-02-11 09:06 无风听海 阅读(230) 评论(0) 推荐(0) 编辑
摘要: 一、测试环境 python 3.7 elasticsearch 6.8 elasticsearch-dsl 7 安装elasticsearch-dsl pip install elasticsearch-dsl 测试elasticsearch连通性 from elasticsearch import 阅读全文
posted @ 2022-02-09 08:59 无风听海 阅读(698) 评论(2) 推荐(0) 编辑
摘要: 一、 要解决的问题 search命中的记录特别多,使用from+size分页,直接触发了elasticsearch的max_result_window的最大值; { "error": { "root_cause": [ { "type": "query_phase_execution_excepti 阅读全文
posted @ 2022-02-08 08:31 无风听海 阅读(1112) 评论(1) 推荐(2) 编辑
摘要: 一、推荐系统简介 推荐系统主要基于对用户历史的行为数据分析处理,寻找得到用户可能感兴趣的内容,从而实现主动向用户推荐其可能感兴趣的内容; 从物品的长尾理论来看,推荐系统通过发掘用户的行为,找到用户的个性化需求,从而将长尾商品准确地推荐给需要它的用户,帮助用户发现那些他们感兴趣但很难发现的商品。 推荐 阅读全文
posted @ 2022-01-27 08:39 无风听海 阅读(1012) 评论(0) 推荐(0) 编辑
摘要: 六、莱文斯坦编辑距离 前边的几种距离计算方法都是针对相同长度的词项,莱文斯坦编辑距离可以计算两个长度不同的单词之间的距离;莱文斯坦编辑距离是通过添加、删除、或者将一个字符替换为另外一个字符所需的最小编辑次数; 我们假设两个单词u、v的长度分别为i、j,则其可以分以下几种情况进行计算 当有一个单词的长 阅读全文
posted @ 2022-01-24 07:59 无风听海 阅读(485) 评论(0) 推荐(2) 编辑
摘要: 一、词项相似度 elasticsearch支持拼写纠错,其建议词的获取就需要进行词项相似度的计算;今天我们来通过不同的距离算法来学习一下词项相似度算法; 二、数据准备 计算词项相似度,就需要首先将词项向量化;我们可以使用以下两种方法 字符向量化,其将每个字符映射为一个唯一的数字,我们可以直接使用字符 阅读全文
posted @ 2022-01-20 08:40 无风听海 阅读(544) 评论(0) 推荐(0) 编辑
摘要: 一、什么是拼写纠错 拼写纠错就是搜索引擎可以智能的感知用户输入关键字的错误,并使用纠正过的关键字进行搜索展示给用户;拼写纠错是一种改善用户体验的功能; elasticsearch提供了以下不同类型的suggester来完成拼写纠错和自动完成功能; term suggester主要针对单个的term分 阅读全文
posted @ 2022-01-16 22:37 无风听海 阅读(756) 评论(0) 推荐(0) 编辑
摘要: 拼音搜索在中文搜索环境中是经常使用的一种功能,用户只需要输入关键词的拼音全拼或者拼音首字母,搜索引擎就可以搜索出相关结果。在国内,中文输入法基本上都是基于汉语拼音的,这种在符合用户输入习惯的条件下缩短用户输入时间的功能是非常受欢迎的; 一、安装拼音搜索插件 下载对应版本的elasticsearch- 阅读全文
posted @ 2022-01-14 08:59 无风听海 阅读(359) 评论(0) 推荐(0) 编辑
摘要: IK是基于字典的一款轻量级的中文分词工具包,可以通过elasticsearch的插件机制集成; 一、集成步骤 1.在elasticsearch的安装目录下的plugin下新建ik目录; 2.在github下载对应版本的ik插件; https://github.com/medcl/elasticsea 阅读全文
posted @ 2022-01-11 22:44 无风听海 阅读(635) 评论(0) 推荐(1) 编辑
摘要: 一、MongoDB如何选择索引 如果我们在Collection建了5个index,那么当我们查询的时候,MongoDB会根据查询语句的筛选条件、sort排序等来定位可以使用的index作为候选索引;然后MongoDB会创建对应数量的查询计划,并分别使用不同线程执行查询计划,最终会选择一个执行最快的i 阅读全文
posted @ 2022-01-11 08:33 无风听海 阅读(663) 评论(0) 推荐(0) 编辑
摘要: 一、inner hits简介 elasticsearch提供了nested数据类型来处理主子文档的问题,可以解决子文档字段被分裂平铺导致字段之间失去了整体的关联性; elasticsearch提供的inner hits主要完成在通过子文档进行匹配查询的时候,可以方便控制匹配的子文档的返回; 二、数据 阅读全文
posted @ 2022-01-06 22:39 无风听海 阅读(2067) 评论(1) 推荐(0) 编辑
摘要: 一、什么是子字符串查找 子字符串查找是一种基本的字符串操作,是给定一段长度为N的文本和一个长度为M的模式(pattern)字符串,在文本中找到一个和该模式相符的子字符串的操作; 在实际的应用场景中,模式相对文本来说是很短的,即M远小于N,我们一般也会对模式进行预处理来支持在文本中的快速查找。 二、测 阅读全文
posted @ 2022-01-04 08:54 无风听海 阅读(632) 评论(1) 推荐(2) 编辑
摘要: 一、问题源起 在elasticsearch的查询中,我们一般直接通过URL来设置要search的index; 如果我们需要查询的索引比较多并且没有什么规律的话,就会面临一个尴尬的局面,超过URL的长度限制; 二、测试环境 elasticsearch 6.8.12 测试数据 新增三个测试的index, 阅读全文
posted @ 2021-12-31 07:52 无风听海 阅读(2454) 评论(0) 推荐(1) 编辑
摘要: 一、问题描述 今天使用笔记本远程办公的时候,突然电脑无法联网了,使用chrome浏览器访问网页出现如下错误 This site can’t be reachedwww.baidu.com’s server IP address could not be found. Try: Checking th 阅读全文
posted @ 2021-12-30 09:08 无风听海 阅读(1177) 评论(0) 推荐(0) 编辑
摘要: 一、异步编程概述 异步编程是一种并发编程的模式,其关注点是通过调度不同任务之间的执行和等待时间,通过减少处理器的闲置时间来达到减少整个程序的执行时间;异步编程跟同步编程模型最大的不同就是其任务的切换,当遇到一个需要等待长时间执行的任务的时候,我们可以切换到其他的任务执行; 与多线程和多进程编程模型相 阅读全文
posted @ 2021-12-17 08:25 无风听海 阅读(1270) 评论(0) 推荐(0) 编辑
摘要: 一、概念描述 可迭代对象就是可以迭代的对象,我们可以通过内置的iter函数获取其迭代器,可迭代对象内部需要实现__iter__函数来返回其关联的迭代器; 迭代器是负责具体数据的逐个遍历的,其通过实现__next__函数得以逐个的访问关联的数据元素;同时通过实现__iter__来实现对可迭代对象的兼容 阅读全文
posted @ 2021-12-16 08:35 无风听海 阅读(381) 评论(0) 推荐(1) 编辑
摘要: 一、什么是函数装饰器 1.函数装饰器是Python提供的一种增强函数功能的标记函数; 2.装饰器是可调用的函数对象,其参数是另一个函数(被装饰的函数); 我们可以使用修饰器来封装某个函数,从而让程序在执行这个函数之前与执行完这个函数之后,分别运行某些代码。这意味着,调用者传给函数的参数值、函数返回给 阅读全文
posted @ 2021-12-02 09:13 无风听海 阅读(394) 评论(0) 推荐(0) 编辑
摘要: 一、什么是元编程 元编程是一种编写计算机程序的技术,这些程序可以将自己看作数据,因此你可以在运行时对它进行内省、生成和/或修改。 Python在语言层面对函数、类等基本类型提供了内省及实时创建和修改的能力;我们可以使用装饰器向现有的函数、方法或类添加附加功能;同时我们也可以通过修改一些特殊的方法来变 阅读全文
posted @ 2021-11-29 22:26 无风听海 阅读(495) 评论(0) 推荐(1) 编辑
上一页 1 2 3 4 5 6 ··· 8 下一页