摘要: 1.K Means定义: K Means是一种无监督的基于距离的聚类算法,简单来说,就是将无标签的样本划分为k个簇(or类)。它以样本间的距离作为相似性的度量指标,常用的距离有曼哈顿距离、欧几里得距离和闵可夫斯基距离。两个样本点的距离越近,其相似度就越高;距离越远,相似度越低。 目的是,实现簇内的距 阅读全文
posted @ 2019-02-05 23:44 喜欢吃面的猪猪 阅读(2220) 评论(0) 推荐(0) 编辑
摘要: 决策树笔记 参考西瓜书及刘建平博客,仅此做简单笔记,帮助理解python操作。 决策树是一种常见的额机器学习方法。其中,CART算法可用于分类与回归问题。一般,一棵决策树包含一个根节点、若干个内部节点和若干个叶节点。根节点和内部节点都是对一个属性进行划分,而叶节点对应的是决策的结果。从根节点到每个叶 阅读全文
posted @ 2019-01-29 17:57 喜欢吃面的猪猪 阅读(297) 评论(0) 推荐(0) 编辑
摘要: 本文简单介绍一下read_csv()和 to_csv()的参数,最常用的拿出来讲,较少用的请转到官方文档看。 一.pd.read_csv() 作用:将csv文件读入并转化为数据框形式。 好多参数呀! 下面来看常用参数: 1.filepath_or_buffer :( 这是唯一一个必须有的参数,其它都 阅读全文
posted @ 2019-01-25 23:46 喜欢吃面的猪猪 阅读(68732) 评论(1) 推荐(3) 编辑
摘要: 背景: 在拿到的数据里,经常有分类型变量的存在,如下: 球鞋品牌:Nike、adidas、 Vans、PUMA、CONVERSE 性别:男、女 颜色:红、黄、蓝、绿 However,sklearn大佬不能直接分析这类变量呀。在回归,分类,聚类等机器学习算法中,特征之间距离的计算或相似度的计算是算法关 阅读全文
posted @ 2019-01-20 15:32 喜欢吃面的猪猪 阅读(8766) 评论(1) 推荐(3) 编辑
摘要: 分类模型效果评估 评估标准: Accuracy Precision Recal F Score ROC curve 以鸢尾花数据集为例子,我们用PCA(主成分回归法)(重点展示效果评估这一块,所以暂时只用这一方法选择特征)绛维,然后进行建模,最后对模型的效果进行评估。 .dataframe thea 阅读全文
posted @ 2019-01-06 14:21 喜欢吃面的猪猪 阅读(368) 评论(0) 推荐(0) 编辑
摘要: 公式: 标准差: 方差: 协方差: 意义: 方差(Variance):度量随机变量和其数学期望(即均值)之间的偏离程度。针对一维数据。 标准差:方差开根号。标准差和方差一般是用来描述一维数据的。 协方差:衡量两个变量之间的变化 方向关系 。协方差只是说明了线性相关的方向,说不能说明线性相关的程度,若 阅读全文
posted @ 2018-12-31 14:45 喜欢吃面的猪猪 阅读(4208) 评论(0) 推荐(0) 编辑
摘要: import copy a = [1, 2, 3, 4, ['a', 'b']] b = a 引用,除非直接给a重新赋值,否则a变则b变,b变则a变 c = copy.copy(a) 浅复制,只会拷贝父对象, 不会拷贝父对象中的子对象,所以若a的子对象变则c 变,但是父对象变c不会变 d = cop 阅读全文
posted @ 2018-11-21 16:38 喜欢吃面的猪猪 阅读(597) 评论(0) 推荐(0) 编辑
摘要: loc 用行列标签,iloc用数字索引。严格遵守使用规则,那么索引将很容易。 .dataframe thead tr:only child th { text align: right; } .dataframe thead th { text align: left; } .dataframe t 阅读全文
posted @ 2018-10-17 15:42 喜欢吃面的猪猪 阅读(1262) 评论(0) 推荐(0) 编辑
摘要: 直方图 数值型数据可视化的一种方式。 如果原始数值型数据经过类别化(分组)处理,则可以使用直方图来观察数据的分布。 如果原始数据没有经过分组处理,则使用茎叶图、箱线图、小提琴图、点图、核密度图等来观察数据的分布。 作用 :展示数据分布的一种常用方式,通过直方图可观察数据分布的大致形状,能看分布是否对 阅读全文
posted @ 2018-09-19 00:33 喜欢吃面的猪猪 阅读(1020) 评论(0) 推荐(0) 编辑
摘要: content: range() np.arange() np.linspace() 一.range(start, stop, step) 1.range() 为 python 自带函数 2.生成一个从start( 包含 )到stop( 不包含 ),以step为步长的序列。返回一个 list 对象 阅读全文
posted @ 2018-09-15 12:22 喜欢吃面的猪猪 阅读(1886) 评论(0) 推荐(0) 编辑