全部文章

文章分类 -  AI-4-4机器学习-算法实战

摘要:什么是集成学习 集成学习通过建⽴⼏个模型来解决单⼀预测问题。它的⼯作原理是⽣成多个分类器/模型,各⾃独⽴地学习和作出预测。这些预测最后结合成组合预测,因此优于任何⼀个单分类的做出预测。 复习:机器学习的两个核⼼任务 任务⼀:主要⽤于解决⽋拟合问题 任务⼆:主要⽤于解决过拟合问题 集成学习中boost 阅读全文
posted @ 2025-06-17 21:17 指尖下的世界 阅读(67) 评论(0) 推荐(0)
摘要:EM算法 EM算法也称期望最⼤化(Expectation-Maximum,简称EM)算法。 它是⼀个基础算法,是很多机器学习领域算法的基础,⽐如隐式⻢尔科夫算法(HMM)等等。 EM算法是⼀种迭代优化策略,由于它的计算⽅法中每⼀次迭代都分两步: 期望步(E步) 极⼤步(M步) 所以算法被称为EM算法 阅读全文
posted @ 2025-06-16 21:07 指尖下的世界 阅读(53) 评论(0) 推荐(0)
摘要:支持向量机是一种用于分类的学习模型:群体中的哪些个体属于哪个类别?那么……SVM 和神秘的“核函数”是如何工作的呢? 下面我像对待五岁小孩一样给你解释 SVM: 在很久以前的情⼈节,⼤侠要去救他的爱⼈,但魔⻤和他玩了⼀个游戏。 魔⻤在桌⼦上似乎有规律放了两种颜⾊的球,说: “你⽤⼀根棍分开它们?要求 阅读全文
posted @ 2025-06-12 16:33 指尖下的世界 阅读(23) 评论(0) 推荐(0)
摘要:概率基础复习 概率定义 概率定义为⼀件事情发⽣的可能性 扔出⼀个硬币,结果头像朝上 P(X) : 取值在[0, 1] 联合概率、条件概率与相互独⽴ 联合概率:包含多个条件,且所有条件同时成⽴的概率 记作:P(A,B) 条件概率:就是事件A在另外⼀个事件B已经发⽣条件下的发⽣概率 记作:P(A|B) 阅读全文
posted @ 2025-06-11 18:29 指尖下的世界 阅读(16) 评论(0) 推荐(0)
摘要:认识聚类算法 使⽤不同的聚类准则,产⽣的聚类结果不同。 1.1 聚类算法在现实中的应⽤ ⽤户画像,⼴告推荐,Data Segmentation,搜索引擎的流量推荐,恶意流量识别 基于位置信息的商业推送,新闻聚类,筛选排序 图像分割,降维,识别;离群点检测;信⽤卡异常消费;发掘相同功能的基因⽚段 1. 阅读全文
posted @ 2025-06-09 16:38 指尖下的世界 阅读(62) 评论(0) 推荐(0)
摘要:决策树思想的来源⾮常朴素,程序设计中的条件分⽀结构就是if-else结构,最早的决策树就是利⽤这类结构分割数据的⼀种分类学习⽅法 决策树: 是⼀种树形结构,本质是⼀颗由多个判断节点组成的树 其中每个内部节点表示⼀个属性上的判断, 每个分⽀代表⼀个判断结果的输出, 最后每个叶节点代表⼀种分类结果。 怎 阅读全文
posted @ 2025-06-04 22:16 指尖下的世界 阅读(42) 评论(0) 推荐(0)
摘要:逻辑回归(Logistic Regression)是机器学习中最基础且最常用的⼀种分类模型,尽管名字中有"回归",但它实际上解决的是​​分类问题​​,特别是二分类问题。由于算法的简单和⾼效,在实际中应⽤⾮常⼴泛。 逻辑回归的应⽤场景 是否会⼴告点击 是否为垃圾邮件 是否患病 ⾦融诈骗识别 虚假账号识 阅读全文
posted @ 2025-06-02 17:12 指尖下的世界 阅读(36) 评论(0) 推荐(0)
摘要:线性回归简介 线性回归应⽤场景 房价预测 销售额度预测 贷款额度预测 举例: 什么是线性回归 定义与公式 线性回归(Linear regression)是利⽤回归⽅程(函数)对⼀个或多个⾃变量(特征值)和因变量(⽬标值)之间关系进⾏建模的⼀种分析⽅式。 特点:只有⼀个⾃变量的情况称为单变量回归,多于 阅读全文
posted @ 2025-05-28 17:54 指尖下的世界 阅读(95) 评论(0) 推荐(0)
摘要:1 什么是K-近邻算法 根据你的“邻居”来推断出你的类别。 那么如何查找和你距离最近的邻居是哪个呢?这就要使用到最近邻与搜索。 最近邻域搜索(Nearest-Neighbor Lookup) 最近邻域搜索(Nearest-Neighbor Lookup,NNL)是一种在数据集中查找与给定查询点最相似 阅读全文
posted @ 2025-04-28 20:46 指尖下的世界 阅读(202) 评论(0) 推荐(0)