会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
FFFF5
博客园
首页
新随笔
联系
订阅
管理
2026年2月28日
神经网络之激活函数
摘要: 介绍神经网络之激活函数
阅读全文
posted @ 2026-02-28 20:25 ffff5
阅读(16)
评论(0)
推荐(0)
2026年2月27日
用pytorch来自动求导
摘要: PyTorch 提供了一个非常强大的自动求导引擎(Autograd),它能够自动计算神经网络中张量的梯度,是训练深度学习模型的基础。 1. 核心概念:计算图与 requires_grad 在 PyTorch 中,当创建一个张量(Tensor)并设置 requires_grad=True 时,PyTo
阅读全文
posted @ 2026-02-27 21:03 ffff5
阅读(2)
评论(0)
推荐(0)
2026年2月24日
TCP三次握手总结
摘要: TCP三次握手总结
阅读全文
posted @ 2026-02-24 22:42 ffff5
阅读(3)
评论(0)
推荐(0)
2026年2月23日
SGD随机梯度下降
摘要: 介绍SGD梯度下降原理和工作流程
阅读全文
posted @ 2026-02-23 15:40 ffff5
阅读(14)
评论(0)
推荐(0)
2026年2月22日
大模型数学基础3
摘要: 介绍斜率、导数和梯度
阅读全文
posted @ 2026-02-22 21:53 ffff5
阅读(10)
评论(0)
推荐(0)
2026年2月10日
Z-Score归一化
摘要: 介绍Z-Score标准化的数学原理和代码实现
阅读全文
posted @ 2026-02-10 21:23 ffff5
阅读(15)
评论(0)
推荐(0)
Min-Max归一化
摘要: 介绍Min-Max归一化的数学原理、公式推到和代码实现
阅读全文
posted @ 2026-02-10 21:15 ffff5
阅读(25)
评论(0)
推荐(0)
2026年2月8日
神经网络模型基础与简单实现
摘要: 一、什么是模型(Model) 1.1 模型的本质 模型是现实世界中复杂关系的简化数学表示。在机器学习中,模型是一个从输入到输出的映射函数: f: X → Y 输入特征 → 预测输出 1.2 模型的组成要素 # 机器学习模型的三个核心组件: 1. 结构(Architecture):如何组织计算(如线性
阅读全文
posted @ 2026-02-08 21:18 ffff5
阅读(6)
评论(0)
推荐(0)
PyTorch-Dataset和 DataLoader
摘要: 简单来说: Dataset 是一个仓库或菜单。它定义了数据的来源(如图片文件、文本列表),并告诉程序如何根据索引(像菜单编号)获取一个单独的数据样本。 DataLoader 是一个高效的服务员和厨房。它从 Dataset 中取数据,按照你的要求(如批量大小、是否打乱)打包成批,并利用多进程并行加载,
阅读全文
posted @ 2026-02-08 12:03 ffff5
阅读(6)
评论(0)
推荐(0)
大模型数学基础2
摘要: 重点梳理了均值、方差、均匀分布、正态分布的概念、数学本质及其在大模型训练中的关键应用 一、 核心概念:描述数据的基础 1. 均值 (Mean / Average) 数学定义:数据集中所有数值之和除以数据个数。 总体均值:μ = (1/N) Σ x_i 样本均值:x̄ = (1/n) Σ x_i 本质
阅读全文
posted @ 2026-02-08 10:44 ffff5
阅读(6)
评论(0)
推荐(0)
下一页
公告