文章分类 - AI-4-1机器学习-周边知识储备
摘要:激活函数是神经网络中的核心组件,决定了神经元的输出形式和非线性特性。 一、认识激活函数 神经元是如何工作的? 神经元接收到一个或多个输入,对他们进行加权并相加,总和通过一个非线性函数(激活函数)产生输出。 激活函数(Activation Function),就是在神经网络的神经元上运行的函数,负责将
阅读全文
摘要:一个模型,我们训练了很长时间,我们不可能使用的时候再次训练,那么如何保存呢? 训练好的模型保存非常重要,这样可以在需要时直接加载使用,无需重新训练。以下是保存和加载模型的常用方法: 1. Python内置模块:pickle import pickle # 保存模型 with open('model.
阅读全文
摘要:熵 “熵”是一个非常重要的概念,在物理、信息论、机器学习等领域都有广泛应用。 一、熵的本质:衡量“不确定性” 熵(Entropy)的本质是描述一个系统的不确定性或混乱程度。 熵越高,系统越混乱、越难预测(比如抛一枚均匀硬币,结果最不确定)。 熵越低,系统越有序、越容易预测
阅读全文
摘要:核函数(Kernel Function)是机器学习和统计学中的核心概念,主要用于将低维数据隐式映射到高维空间,从而解决线性不可分问题。 它在支持向量机(SVM)、核主成分分析(Kernel PCA)等算法中广泛应用。 注意!在升维的时候,构造出来的新维度可能毫无意义,或者意义根本不明确,单纯就是为了
阅读全文
摘要:泰坦尼克号数据集(Titanic Dataset)简介 1. 背景 泰坦尼克号数据集记录了1912年泰坦尼克号沉船事件中乘客的个人信息及生存情况,是机器学习领域经典的二分类任务数据集,常用于预测乘客生存概率。 2. 数据内容 样本数量:共 891 条乘客数据(
阅读全文
摘要:1 距离公式的基本性质 在机器学习过程中,对于函数 dist(., .),若它是⼀"距离度量" (distance measure),则需满⾜⼀些基本性质: ⾮负性: dist(Xi, Xj) >= 0 ; 同⼀性:dist(xi, xj) = 0。当且仅当 Xi = Xj ; 对称性: dist(
阅读全文
摘要:1 什么是机器学习 机器学习就是让机器从过去已知的大量数据中进行学习,进而得到一个无限接近现实的规律,最后通过这个规律对未知数据进行预测。 2 机器学习工作流程 机器学习工作流程总结 1.获取数据 2.数据基本处理 即对数据进行缺失值、去除异常值等处理 3.特征工程 4.机器学习(模型训练) 5.模
阅读全文