全部文章

文章分类 -  AI-4-1机器学习-周边知识储备

摘要:激活函数是神经网络中的核心组件,决定了神经元的输出形式和非线性特性。 一、认识激活函数 神经元是如何工作的? 神经元接收到一个或多个输入,对他们进行加权并相加,总和通过一个非线性函数(激活函数)产生输出。 激活函数(Activation Function),就是在神经网络的神经元上运行的函数,负责将 阅读全文
posted @ 2025-06-26 21:22 指尖下的世界 阅读(189) 评论(0) 推荐(0)
摘要:一个模型,我们训练了很长时间,我们不可能使用的时候再次训练,那么如何保存呢? 训练好的模型保存非常重要,这样可以在需要时直接加载使用,无需重新训练。以下是保存和加载模型的常用方法: 1. Python内置模块:pickle import pickle # 保存模型 with open('model. 阅读全文
posted @ 2025-05-31 20:14 指尖下的世界 阅读(49) 评论(0) 推荐(0)
摘要:熵 “熵”是一个非常重要的概念,在物理、信息论、机器学习等领域都有广泛应用。 一、熵的本质:衡量“不确定性”​​ ​​熵(Entropy)的本质是描述一个系统的不确定性或混乱程度​​。 ​​熵越高​​,系统越混乱、越难预测(比如抛一枚均匀硬币,结果最不确定)。 ​​熵越低​​,系统越有序、越容易预测 阅读全文
posted @ 2025-05-26 21:11 指尖下的世界 阅读(226) 评论(0) 推荐(0)
摘要:核函数(Kernel Function)是机器学习和统计学中的核心概念,主要用于将低维数据隐式映射到高维空间,从而解决线性不可分问题。 它在支持向量机(SVM)、核主成分分析(Kernel PCA)等算法中广泛应用。 注意!在升维的时候,构造出来的新维度可能毫无意义,或者意义根本不明确,单纯就是为了 阅读全文
posted @ 2025-05-26 11:23 指尖下的世界 阅读(412) 评论(0) 推荐(0)
摘要:​​泰坦尼克号数据集(Titanic Dataset)简介​​ ​​1. 背景​​ 泰坦尼克号数据集记录了1912年泰坦尼克号沉船事件中乘客的个人信息及生存情况,是机器学习领域经典的二分类任务数据集,常用于预测乘客生存概率。 ​​2. 数据内容​​ ​​样本数量​​:共 ​​891 条​​乘客数据( 阅读全文
posted @ 2025-04-30 10:33 指尖下的世界 阅读(121) 评论(0) 推荐(0)
摘要:1 距离公式的基本性质 在机器学习过程中,对于函数 dist(., .),若它是⼀"距离度量" (distance measure),则需满⾜⼀些基本性质: ⾮负性: dist(Xi, Xj) >= 0 ; 同⼀性:dist(xi, xj) = 0。当且仅当 Xi = Xj ; 对称性: dist( 阅读全文
posted @ 2025-04-29 10:02 指尖下的世界 阅读(244) 评论(0) 推荐(0)
摘要:1 什么是机器学习 机器学习就是让机器从过去已知的大量数据中进行学习,进而得到一个无限接近现实的规律,最后通过这个规律对未知数据进行预测。 2 机器学习工作流程 机器学习工作流程总结 1.获取数据 2.数据基本处理 即对数据进行缺失值、去除异常值等处理 3.特征工程 4.机器学习(模型训练) 5.模 阅读全文
posted @ 2025-04-12 00:31 指尖下的世界 阅读(19) 评论(0) 推荐(0)