摘要: 1. data.describe() #基本统计量 count 195.000000 #数量 mean 2744.595385 #均值 std 424.739407 #标准差 min 865.000000 #最小值 25% 2460.600000 #下四分位 50% 2655.900000 #中位数 75% 3023.200000 #上四分位 max ... 阅读全文
posted @ 2018-11-09 14:55 今天看见未来 阅读(91) 评论(0) 推荐(0)
摘要: 监督学习 非监督学习 分类 一 线性回归与逻辑回归 二 支持向量机 三 决策树 四 集成算法和随机森林 五 贝叶斯 六 EM算法 七 聚类算法 八 神经网络 九 PCA降维 十 K近邻算法 https://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details 阅读全文
posted @ 2018-10-31 15:26 今天看见未来 阅读(146) 评论(0) 推荐(0)
摘要: 转载于https://testerhome.com/topics/10877 回顾 之前我们讲到了一些在训练模型的时候用到的超参数,例如上一次说的L2 正则, 在过拟合的场景中增加L2的值有助于减小网络的复杂度。 还有诸如学习率, 在梯度下降中,每一次迭代的下降的步长是学习率乘以成本函数对w的导数。 阅读全文
posted @ 2018-10-25 10:33 今天看见未来 阅读(973) 评论(0) 推荐(0)
摘要: 吴恩达老师利用作图解释如何使误差最小 VS 此处利用纯数学推导 利用最小二乘法解释如何使误差最小 1 似然函数(概率)求解:(拟合函数)参数跟数据结合后接近于真实函数的概率。 2 加log可以使乘法转换成加法 3 拿到数据先用逻辑回归分类看看效果,再用其他算法。 4 引入Sigmoid函数的意义:1 阅读全文
posted @ 2018-10-24 15:30 今天看见未来 阅读(293) 评论(0) 推荐(0)
摘要: 数据读取 1 代码和文件放到同一个文件夹下面 pandas.read_csv(" ") 2 pandas中核心结构是 DataFrame 3 pandas称字符型为 object numpy称做string 4 注意要把上一步执行完再执行下一步 不然报错 5 函数 .head(n) 显示前n条数据 阅读全文
posted @ 2018-10-22 11:01 今天看见未来 阅读(119) 评论(0) 推荐(0)
摘要: 利用jupyter notebook 基础操作 1 numpy.genfromtxt(设置路径) 读取数据 2 帮助函数 print(help(*)) 3 numpy.array nbarray格式 4 构建一二三维数据 5 print(vector.shape) 寻找bug 数组结构 1 numb 阅读全文
posted @ 2018-10-18 15:57 今天看见未来 阅读(116) 评论(0) 推荐(0)
摘要: numpy中文手册 https://www.numpy.org.cn numpy函数查阅 https://docs.scipy.org/doc/numpy/search.html?q=array 阅读全文
posted @ 2018-10-16 15:16 今天看见未来 阅读(86) 评论(0) 推荐(0)