01 2019 档案

摘要:1. Python内保存和读取模型——pickle pickle是负责将Python对象序列化(Serialization)和反序列化(de-serialization)的模块。 可使用Pickle将对象转换为文件保存在硬盘里(pickle.dump),在需要的时候再读取并还原(pickle.loa 阅读全文
posted @ 2019-01-26 15:51 Colleen-Blog 阅读(700) 评论(0) 推荐(0)
摘要:案例: 制作玩偶的数量和成本之间的关系 生产个数: xi 实际生产成本:yi 模型预测的成本:yi^ 数学推导: 1.假设条件概率: yi = axi + b + εi 其中,a,b是模型参数,分别表示生产一个玩偶的变动成本和固定成本;εi 被称为噪声项,服从期望为0,方差为σ2的正态分布,记为εi 阅读全文
posted @ 2019-01-26 15:28 Colleen-Blog 阅读(350) 评论(0) 推荐(0)
摘要:模型陷阱: 1.要求准确度——易受过度拟合干扰 为了提高预测的准确度,常从已知的特征中提取出更多的特征,并以此搭建复杂的模型。如下 原有公式为:Y ~ (X) 转换成 :Y ~ (X,X2, X3,...,Xn) yi = b + a1xi + a2xi2 + a3xi3 + ... + anxin 阅读全文
posted @ 2019-01-26 15:28 Colleen-Blog 阅读(685) 评论(0) 推荐(0)
摘要:案例: 制作玩偶的数量和成本之间的关系 生产个数: xi 实际生产成本:yi 模型预测的成本:yi^ 数学推导: 1.数学公式 yi = xi + εi 2.损失函数(loss function) LL = Σi |yi -yi^| 因为上式不可导,重新定义损失函数如下: L = Σi (yi - 阅读全文
posted @ 2019-01-26 15:27 Colleen-Blog 阅读(457) 评论(0) 推荐(0)