随笔分类 -  数据分析方向

摘要:Matlab操作矩阵的相关方法 下面这篇文章主要是对吴恩达老师机器学习中matlab操作的一个整理和归纳 一、基本操作 1.生成矩阵(ones、zeros) A = [1 2;3 4;5 6] #生成3行4列的矩阵 B = [1 2 3] #B就是一个行向量 C = [1;2;3] #定义c为一个列 阅读全文
posted @ 2018-09-20 21:36 风起了,风停了 阅读(3019) 评论(0) 推荐(0)
摘要:是一种基于搜索的最优法方法 下面这个图是在一维方向的求导,但是在多维的我们需要对各个维度求导,然后进行一个合并。多维中叫做梯度。 在直线上,导数代表斜率 在曲线方程中,导数代表切线斜率。也代表theta单位变化时,J相应的变化 在这一点上,导数为负值,当theta增加,J是减小的。导数可以代表方向, 阅读全文
posted @ 2017-12-07 16:07 风起了,风停了 阅读(4053) 评论(0) 推荐(0)
摘要:1. 模型性能评价及选择 看下sklearn中支持哪些机器学习的评估指标: 1.1回归模型性能评价及选择 1.1.1Mean Absolute Error 平均绝对误差(MAE) 损失函数没有用这个,是因为绝对值不方便求导 1.1.2Mean Squared Error 均方误差(MSE) 1.1. 阅读全文
posted @ 2017-11-10 14:52 风起了,风停了 阅读(4817) 评论(1) 推荐(0)
摘要:1. 监督学习,非监督学习,半监督学习和增强学习 机器学习方法分类标准一: 监督学习:分类、回归 给机器的训练数据拥有“标记”或“答案” 有监督机器学习方法可以分为生成方法和判别方法(常见的生成方法有LDA主题模型、朴素贝叶斯算法和隐式马尔科夫模型等,常见的判别方法有SVM、LR等),生成方法学习出 阅读全文
posted @ 2017-10-24 15:04 风起了,风停了 阅读(1924) 评论(0) 推荐(0)
摘要:一、交叉连接(笛卡尔连接) 二、内连接(inner join) 三、左连接(left join) 四、右连接(right join) 五、全连接(full join) 阅读全文
posted @ 2017-10-21 00:20 风起了,风停了 阅读(2568) 评论(0) 推荐(0)
摘要:需要清洗的数据有下面几种形式 2.1错误值 出现大量0的话,可以使用缺失值替代,然后再用缺失值填补的方法处理 camp['AvgIncome']=camp['AvgIncome'].replace({0: np.NaN}) 2.2 缺失值 vmean = camp['Age'].mean(axis= 阅读全文
posted @ 2017-10-20 11:01 风起了,风停了 阅读(60956) 评论(4) 推荐(4)
摘要:Numpy 将字符型数据转为datetime 生成ndarray数组 - np.random.random((2,2))- np.ones((3,4))- np.zeros((2,2), dtype='int32')- np.arange(1,10)- np.linspace(0,2,10)- np 阅读全文
posted @ 2017-10-17 17:35 风起了,风停了 阅读(3510) 评论(0) 推荐(0)
摘要:Matplotlib matplotlib是python的绘图库,使用它可以很方便的绘制出版质量级别的图形 matplotlib的基本功能 1.基本绘图 1.1 绘制坐标系中连续的线,设置线型/线宽/颜色 绘制一条线的相关API 绘制水平线和垂直线相关API 线型/线宽/颜色 r 红色 g 绿色 b 阅读全文
posted @ 2017-10-17 15:33 风起了,风停了 阅读(2690) 评论(0) 推荐(0)