摘要:
一、函数基础:train_test_split 是什么? train_test_split 是 sklearn 提供的数据集划分工具,核心功能是: 随机打乱原始数据(避免数据有序性导致的偏差); 按指定比例拆分数据为「两部分」(默认是训练集和测试集); 保证拆分后,x 和 y 的对应关系不混乱(即某 阅读全文
posted @ 2025-11-28 21:56
wangya216
阅读(74)
评论(0)
推荐(0)
摘要:
一、完整语法与参数解释 np.random.normal(loc=0, scale=1, size=None) 是 NumPy 中生成「正态分布(高斯分布)」随机数的核心函数,参数含义如下: 参数名 默认值 作用说明 对应代码中的含义 loc 0 正态分布的「均值(μ)」,决定分布的中心位置 噪声的 阅读全文
posted @ 2025-11-28 21:41
wangya216
阅读(84)
评论(0)
推荐(0)
摘要:
在编程(尤其是数据科学、机器学习)中,随机种子(Random Seed)是一个用于初始化随机数生成器的“起始值”,核心作用是让「随机过程可复现」——简单说,用相同的随机种子,每次运行代码得到的随机结果(如随机划分数据、生成随机噪声、模型初始化权重)完全一致;不设置种子则每次结果都不同。 一、先看直观 阅读全文
posted @ 2025-11-28 21:31
wangya216
阅读(95)
评论(0)
推荐(0)
摘要:
多项式次数选择完整演示(Python) 本文将通过 人工生成数据→数据划分→多次数模型训练→验证集筛选最优次数→测试集评估 的全流程,演示多项式回归中如何通过验证集选择最优次数,所有代码逐行解释,兼顾理论与实践。 核心逻辑 多项式回归的核心是通过增加高次项(如 (x^2, x^3))拟合复杂数据,但 阅读全文
posted @ 2025-11-28 21:25
wangya216
阅读(15)
评论(0)
推荐(0)
摘要:
需要预先指定多项式的次数,且这个次数属于「超参数」,需通过验证集优化选择,核心逻辑和实操步骤如下: 一、关键结论 多项式回归中,“一次(线性)、二次、三次”本质是模型的结构超参数(决定模型复杂度),不能由数据自动学习,必须先指定候选次数(如1、2、3、4次),再通过训练+验证的流程筛选最优解。 二、 阅读全文
posted @ 2025-11-28 20:25
wangya216
阅读(14)
评论(0)
推荐(0)

浙公网安备 33010602011771号