随笔分类 -  Ai

摘要:介绍神经网络之激活函数 阅读全文
posted @ 2026-02-28 20:25 ffff5 阅读(35) 评论(0) 推荐(0)
摘要:PyTorch 提供了一个非常强大的自动求导引擎(Autograd),它能够自动计算神经网络中张量的梯度,是训练深度学习模型的基础。 1. 核心概念:计算图与 requires_grad 在 PyTorch 中,当创建一个张量(Tensor)并设置 requires_grad=True 时,PyTo 阅读全文
posted @ 2026-02-27 21:03 ffff5 阅读(5) 评论(0) 推荐(0)
摘要:介绍SGD梯度下降原理和工作流程 阅读全文
posted @ 2026-02-23 15:40 ffff5 阅读(38) 评论(0) 推荐(0)
摘要:介绍斜率、导数和梯度 阅读全文
posted @ 2026-02-22 21:53 ffff5 阅读(28) 评论(0) 推荐(0)
摘要:介绍Z-Score标准化的数学原理和代码实现 阅读全文
posted @ 2026-02-10 21:23 ffff5 阅读(50) 评论(0) 推荐(0)
摘要:介绍Min-Max归一化的数学原理、公式推到和代码实现 阅读全文
posted @ 2026-02-10 21:15 ffff5 阅读(126) 评论(0) 推荐(0)
摘要:一、什么是模型(Model) 1.1 模型的本质 模型是现实世界中复杂关系的简化数学表示。在机器学习中,模型是一个从输入到输出的映射函数: f: X → Y 输入特征 → 预测输出 1.2 模型的组成要素 # 机器学习模型的三个核心组件: 1. 结构(Architecture):如何组织计算(如线性 阅读全文
posted @ 2026-02-08 21:18 ffff5 阅读(8) 评论(0) 推荐(0)
摘要:简单来说: Dataset 是一个仓库或菜单。它定义了数据的来源(如图片文件、文本列表),并告诉程序如何根据索引(像菜单编号)获取一个单独的数据样本。 DataLoader 是一个高效的服务员和厨房。它从 Dataset 中取数据,按照你的要求(如批量大小、是否打乱)打包成批,并利用多进程并行加载, 阅读全文
posted @ 2026-02-08 12:03 ffff5 阅读(30) 评论(0) 推荐(0)
摘要:重点梳理了均值、方差、均匀分布、正态分布的概念、数学本质及其在大模型训练中的关键应用 一、 核心概念:描述数据的基础 1. 均值 (Mean / Average) 数学定义:数据集中所有数值之和除以数据个数。 总体均值:μ = (1/N) Σ x_i 样本均值:x̄ = (1/n) Σ x_i 本质 阅读全文
posted @ 2026-02-08 10:44 ffff5 阅读(9) 评论(0) 推荐(0)
摘要:系统地解释每个数学概念,提供清晰的数学公式,并用最小但完整的代码示例说明其在大模型中的应用。 1. 基本概念:从标量到张量 1.1 标量 (Scalar) 定义:单个数值,只有大小,没有方向。 数学表示:\(a \in \mathbb{R}\) 大模型意义:表示学习率、温度参数等超参数。 # 标量示 阅读全文
posted @ 2026-02-06 16:08 ffff5 阅读(43) 评论(0) 推荐(0)
摘要:本文为NumPy系列第二篇,深入解析数组操作的核心方法: 重塑:通过reshape()灵活调整维度,利用flatten()一键展平多维数据; 合并:掌握np.concatenate()、vstack/hstack实现垂直/水平拼接,解决多数据集整合难题; 分割:精准切割数组的np.split()策略,应对数据分块处理需求。 阅读全文
posted @ 2025-03-27 23:41 ffff5 阅读(145) 评论(0) 推荐(0)
摘要:本文系统讲解NumPy数组的核心操作,涵盖五大创建方法(np.array()、np.zeros()等)、关键属性(shape、dtype等)及数据类型转换(astype()),通过代码示例演示如何高效构建和操作多维数组。适合Python数据科学初学者。 阅读全文
posted @ 2025-03-25 22:38 ffff5 阅读(103) 评论(0) 推荐(0)