随笔分类 - Ai
摘要:PyTorch 提供了一个非常强大的自动求导引擎(Autograd),它能够自动计算神经网络中张量的梯度,是训练深度学习模型的基础。 1. 核心概念:计算图与 requires_grad 在 PyTorch 中,当创建一个张量(Tensor)并设置 requires_grad=True 时,PyTo
阅读全文
摘要:一、什么是模型(Model) 1.1 模型的本质 模型是现实世界中复杂关系的简化数学表示。在机器学习中,模型是一个从输入到输出的映射函数: f: X → Y 输入特征 → 预测输出 1.2 模型的组成要素 # 机器学习模型的三个核心组件: 1. 结构(Architecture):如何组织计算(如线性
阅读全文
摘要:简单来说: Dataset 是一个仓库或菜单。它定义了数据的来源(如图片文件、文本列表),并告诉程序如何根据索引(像菜单编号)获取一个单独的数据样本。 DataLoader 是一个高效的服务员和厨房。它从 Dataset 中取数据,按照你的要求(如批量大小、是否打乱)打包成批,并利用多进程并行加载,
阅读全文
摘要:重点梳理了均值、方差、均匀分布、正态分布的概念、数学本质及其在大模型训练中的关键应用 一、 核心概念:描述数据的基础 1. 均值 (Mean / Average) 数学定义:数据集中所有数值之和除以数据个数。 总体均值:μ = (1/N) Σ x_i 样本均值:x̄ = (1/n) Σ x_i 本质
阅读全文
摘要:系统地解释每个数学概念,提供清晰的数学公式,并用最小但完整的代码示例说明其在大模型中的应用。 1. 基本概念:从标量到张量 1.1 标量 (Scalar) 定义:单个数值,只有大小,没有方向。 数学表示:\(a \in \mathbb{R}\) 大模型意义:表示学习率、温度参数等超参数。 # 标量示
阅读全文
摘要:本文为NumPy系列第二篇,深入解析数组操作的核心方法:
重塑:通过reshape()灵活调整维度,利用flatten()一键展平多维数据;
合并:掌握np.concatenate()、vstack/hstack实现垂直/水平拼接,解决多数据集整合难题;
分割:精准切割数组的np.split()策略,应对数据分块处理需求。
阅读全文
摘要:本文系统讲解NumPy数组的核心操作,涵盖五大创建方法(np.array()、np.zeros()等)、关键属性(shape、dtype等)及数据类型转换(astype()),通过代码示例演示如何高效构建和操作多维数组。适合Python数据科学初学者。
阅读全文

浙公网安备 33010602011771号