11 2024 档案

(转)数仓建模—ID Mapping
摘要:https://mp.weixin.qq.com/s/c9PI9Aj8IU023ktQXZgBDA?spm=a2c6h.12873639.article-detail.5.572763120dqNXJ 早晨起床的时候,发现自己尿分叉,我没有多想,简单洗洗就匆忙出门。路过早餐店,我看到师傅熟练的拉扯一 阅读全文

posted @ 2024-11-28 16:53 ExplorerMan 阅读(47) 评论(0) 推荐(0)

AutoML(Automated Machine Learning) 自动化机器学习
摘要:AutoML(Automated Machine Learning),即自动化机器学习,是指利用机器学习算法和技术来自动化机器学习的各个阶段,包括数据预处理、特征工程、模型选择、超参数调优和模型部署等过程。以下是对AutoML的详细解释: 一、AutoML的定义与目的 AutoML旨在降低机器学习的 阅读全文

posted @ 2024-11-20 19:12 ExplorerMan 阅读(796) 评论(0) 推荐(0)

ES调优建议
摘要:查询模块 保证ES节点有充足的内存 ES默认分配节点一半的内存给JVM(最多会分配30GB),剩余的内存用于向量索引和pagecache,节点内存不足会导致频繁触发向量索引的驱逐和加载,导致查询延迟较高。 因此需要确保数据节点有足够的内存,使向量索引常驻内存。可以通过以下方式获取节点向量数据的内存使 阅读全文

posted @ 2024-11-13 11:42 ExplorerMan 阅读(118) 评论(0) 推荐(0)

elasticsearch 的索引过程分析和segment的数据结构
摘要:一、预备知识1.1、索引不可变看到这篇文章相信大家都知道es是倒排索引,在es的索引过程中为了满足一下特点,落盘的es索引是不可变的。 1 不需要锁。如果从来不需要更新一个索引,就不必担心多个程序同时尝试修改。 2 一旦索引被读入文件系统的缓存(内存),它就一直在那儿,因为不会改变。只要文件系统缓存 阅读全文

posted @ 2024-11-13 11:41 ExplorerMan 阅读(209) 评论(0) 推荐(0)

ES 布尔查询中 minimum_should_match 参数使用避坑
摘要:简介: ES 布尔查询中 minimum_should_match 参数使用避坑 在 Elasticsearch (ES) 中,布尔查询(Boolean Query)是一种查询类型,它允许你组合多个查询子句以控制搜索结果的匹配逻辑。minimum_should_match 是布尔查询中一个重要的参数 阅读全文

posted @ 2024-11-08 16:16 ExplorerMan 阅读(811) 评论(0) 推荐(0)

算法笔记\python 笔记: 相似性度量
摘要:本文介绍了多种距离度量方法,包括欧氏距离、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、马氏距离、夹角余弦、汉明距离、杰卡德距离、相关距离以及半正矢距离(球面距离)。这些方法在处理不同类型的数据和问题时有不同的适用性和优缺点,如欧氏距离易受离群点影响,马氏距离则考虑了变量的相关性和量纲。摘要由CSDN通 阅读全文

posted @ 2024-11-07 11:42 ExplorerMan 阅读(57) 评论(0) 推荐(0)

杰卡德相似度矩阵python
摘要:我整理的一些关于【Python】的项目学习资料(附讲解~~)和大家一起分享、学习一下: https://d.51cto.com/Hpqqk2 使用Python计算杰卡德相似度矩阵 在数据科学与机器学习的领域,相似度度量是一项重要的技术,广泛应用于推荐系统、聚类分析和信息检索等。杰卡德相似度(Jacc 阅读全文

posted @ 2024-11-07 11:42 ExplorerMan 阅读(157) 评论(0) 推荐(0)

导航