上一页 1 ··· 24 25 26 27 28 29 30 31 32 ··· 39 下一页
  2020年8月20日
摘要: 推导过程: 取似然函数为: 对数似然函数为: 最大似然估计就是求使取最大值时的θ,其实这里可以使用梯度上升法求解,求得的θ就是要求的最佳参数。但是,在Andrew Ng的课程中将取为下式,即 因为乘了一个负的系数-1/m,所以取最小值时的θ为要求的最佳参数 梯度下降法求的最小值 https://bl 阅读全文
posted @ 2020-08-20 18:33 小小喽啰 阅读(420) 评论(0) 推荐(0)
摘要: 首先线性模型: 而logistic回归则通过函数L将w‘x+b对应一个隐状态p,p =L(w‘x+b),然后根据p 与1-p的大小决定因变量的值。如果L是logistic函数 而每一个观察到的样本(xi, yi)出现的概率是: 由于y的取值是(0,1),当y=1的时候,后面那一项是不是没有了,那就只 阅读全文
posted @ 2020-08-20 17:21 小小喽啰 阅读(419) 评论(0) 推荐(0)
摘要: 目录: 定义 期望与方差 两个二项分布的协方差 python画图 二项分布与其他分布的关系 一、定义 在n次独立重复的伯努利试验中,设每次试验中事件A发生的概率为p。用 X 表示n重伯努利试验中事件A发生的次数,则X的可能取值为0,1,…,n,且对每一个k(0≤k≤n),事件{X=k}即为“n次试验 阅读全文
posted @ 2020-08-20 14:27 小小喽啰 阅读(6857) 评论(0) 推荐(0)
  2020年8月19日
摘要: 文章转载于:https://www.cnblogs.com/jiaxin359/p/8615502.html 数据可视化可以帮助我们理解数据:查看数据的分布情况,观察有没有异常值,各个变量之间的相关情况。 当我们进行数据可视化的时候,我们要紧紧围绕着这个变量和我们的目标变量之间的关系,在绘制大多数图 阅读全文
posted @ 2020-08-19 17:11 小小喽啰 阅读(436) 评论(0) 推荐(0)
摘要: 目录 移除方差较低的特征 VarianceThreshold方法 单变量特征选择 回归特征消除 基于L1正则化的特征选择(线性模型的特征选择) 基于树结构的特征选择 特征选择 特征选择是从数据集的诸多特征里面选择和目标变量相关的特征,去掉那些不相关的特征。 特征选择分为两个问题:一个是子集搜索问题, 阅读全文
posted @ 2020-08-19 15:53 小小喽啰 阅读(523) 评论(0) 推荐(0)
摘要: reshape可以用于numpy库里的ndarray和array结构以及pandas库里面的DataFrame和Series结构。reshape用来更改数据的列数和行数reshape(行,列)可以根据指定的数值将数据转换为特定的行数和列数;那么reshape(1,-1)或者reshape(-1,1) 阅读全文
posted @ 2020-08-19 10:54 小小喽啰 阅读(1824) 评论(0) 推荐(0)
  2020年8月18日
摘要: 特征选择 主要思想:包裹式(封装器法)从初始特征集合中不断的选择特征子集,训练学习器,根据学习器的性能来对子集进行评价,直到选择出最佳的子集。包裹式特征选择直接针对给定学习器进行优化 案例一、封装器法 常用实现方法:循序特征选择。 循序向前特征选择:Sequential Forward Select 阅读全文
posted @ 2020-08-18 14:51 小小喽啰 阅读(2695) 评论(0) 推荐(0)
摘要: pd.to_datetime() 因为不了解该段代码意思: # 不过要注意,数据里有时间出错的格式,所以我们需要 errors='coerce' data['used_time'] = (pd.to_datetime(data['creatDate'], format='%Y%m%d', error 阅读全文
posted @ 2020-08-18 10:34 小小喽啰 阅读(54628) 评论(0) 推荐(1)
  2020年8月17日
摘要: sklearn.metrics.classification_report()模型评估的一种,输出一个报告 sklearn.metrics.classification_report(y_true, y_pred, labels=None, target_names=None, sample_wei 阅读全文
posted @ 2020-08-17 17:47 小小喽啰 阅读(2434) 评论(0) 推荐(0)
  2020年8月14日
摘要: 1.皮尔森相关系数(Pearson)评估两个连续变量之间的线性关系 -1 ≤ p ≤ 1p接近0代表无相关性p接近1或-1代表强相关性 代码: #相关系数显著性检验 import numpy as np import scipy.stats as stats import scipy x=np.ar 阅读全文
posted @ 2020-08-14 18:30 小小喽啰 阅读(7380) 评论(0) 推荐(0)
上一页 1 ··· 24 25 26 27 28 29 30 31 32 ··· 39 下一页