摘要: 参考博客:https://www.cnblogs.com/rongyux/articles/5396844.html 目的: 1、帮助用户找到想要的商品(新闻/音乐/……),发掘长尾 帮用户找到想要的东西,谈何容易。商品茫茫多,甚至是我们自己,也经常点开淘宝,面对眼花缭乱的打折活动不知道要买啥。在经 阅读全文
posted @ 2019-05-16 18:05 Colleen-Blog 阅读(185) 评论(0) 推荐(0)
摘要: python读取文件时提示UnicodeDecodeError错误: "UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 205: illegal multibyte sequence" “UnicodeDecode 阅读全文
posted @ 2019-05-16 09:22 Colleen-Blog 阅读(294) 评论(0) 推荐(0)
摘要: from sklearn import preprocessing 自变量过多时,考虑降维,如PCA 自变量的多重共线性,内生性 阅读全文
posted @ 2019-04-11 21:01 Colleen-Blog 阅读(224) 评论(0) 推荐(0)
摘要: 1. Python内保存和读取模型——pickle pickle是负责将Python对象序列化(Serialization)和反序列化(de-serialization)的模块。 可使用Pickle将对象转换为文件保存在硬盘里(pickle.dump),在需要的时候再读取并还原(pickle.loa 阅读全文
posted @ 2019-01-26 15:51 Colleen-Blog 阅读(694) 评论(0) 推荐(0)
摘要: 案例: 制作玩偶的数量和成本之间的关系 生产个数: xi 实际生产成本:yi 模型预测的成本:yi^ 数学推导: 1.假设条件概率: yi = axi + b + εi 其中,a,b是模型参数,分别表示生产一个玩偶的变动成本和固定成本;εi 被称为噪声项,服从期望为0,方差为σ2的正态分布,记为εi 阅读全文
posted @ 2019-01-26 15:28 Colleen-Blog 阅读(346) 评论(0) 推荐(0)
摘要: 模型陷阱: 1.要求准确度——易受过度拟合干扰 为了提高预测的准确度,常从已知的特征中提取出更多的特征,并以此搭建复杂的模型。如下 原有公式为:Y ~ (X) 转换成 :Y ~ (X,X2, X3,...,Xn) yi = b + a1xi + a2xi2 + a3xi3 + ... + anxin 阅读全文
posted @ 2019-01-26 15:28 Colleen-Blog 阅读(683) 评论(0) 推荐(0)
摘要: 案例: 制作玩偶的数量和成本之间的关系 生产个数: xi 实际生产成本:yi 模型预测的成本:yi^ 数学推导: 1.数学公式 yi = xi + εi 2.损失函数(loss function) LL = Σi |yi -yi^| 因为上式不可导,重新定义损失函数如下: L = Σi (yi - 阅读全文
posted @ 2019-01-26 15:27 Colleen-Blog 阅读(452) 评论(0) 推荐(0)
摘要: 修改文件:fred.py 文件路径:~\Anaconda3\Lib\site-packages\pandas_datareader\fred.py 修改内容:将原来的import语句(from pandas.core.common import is_list_like) 改成(from panda 阅读全文
posted @ 2018-07-19 22:16 Colleen-Blog 阅读(205) 评论(0) 推荐(0)