摘要: 首先生成一组数据 元素修改 可以使用下面的几种方法对数据中的元素进行修改,均为原地修改。 添加一列 使用at来定位修改 使用iat来定位修改 使用loc 使用loc来添加行或者列 当loc里面的索引不存在时,会自动添加新的行或者列 使用loc和at都可以进行赋值操作,但是loc可以用来查看已经存在的阅读全文
posted @ 2017-11-10 23:56 cnkai 阅读(63) 评论(0) 编辑
摘要: 高级方法 apply() apply()是一个非常常用并且好用的方法,它允许我们自定义一个函数并且应用到我们的数据中。 比如我们现在有这样的需求,求出每一列数据的最大值与最小值的差,可以这样使用。 默认情况,是以0轴方向应用的这个函数,但是我们可以指定1轴,这时候,我们求得就是每一行的最大值与最小值阅读全文
posted @ 2017-11-10 23:56 cnkai 阅读(67) 评论(0) 编辑
摘要: axis=0代表跨行(down),而axis=1代表跨列(across) 使用0值表示沿着每一列或行标签\索引值向下执行方法 使用1值表示沿着每一行或者列标签模向执行对应的方法 下图代表在DataFrame当中axis为0和1时分别代表的含义: axis参数作用方向图示 另外,Pandas保持了Nu阅读全文
posted @ 2017-11-10 23:56 cnkai 阅读(74) 评论(0) 编辑
摘要: 前段时间,我们爬取了几部热门的电影,分别是《三生三世》,《战狼》,《二十二》,我们今天 就以这几部为例,进行一个简单的词云的制作。 我们主要以《二十二》为例,来制作一个评论的词云。 首先需要安装几个必要的工具库: Pandas 用来实现文件读取和存储,以及必要的数据转换。 jieba 一个强大的分词阅读全文
posted @ 2017-11-08 21:52 cnkai 阅读(151) 评论(0) 编辑
摘要: 针对抓取到的南京市链家网的房源数据进行一次简单的数据可视化 首先导入必要的库。 读取链家网房源数据的csv文件。 原文件中有每一个房源的链接信息,在这里我们不需要,所以就可以直接删除。 上面表格中的列分别是南京市的行政区划,房源名称,房屋设置,面积,朝向,装修情况的描述,电梯与否,楼层高度,建造时间阅读全文
posted @ 2017-11-08 15:14 cnkai 阅读(272) 评论(0) 编辑
摘要: 注:本文是 "人工智能研究网" 的学习笔记 回归器评估方法 explained_variance_score(...) mean_absolute_erroe(...) 平均绝对损失 mean_squared_error(...) 均方损失 median_absolute_error(...) r2阅读全文
posted @ 2017-10-30 16:37 cnkai 阅读(349) 评论(0) 编辑
摘要: 注:本文是 "人工智能研究网" 的学习笔记 ROC是什么 二元分类器(binary classifier)的分类结果 ROC空间 最好的预测模型在左上角,代表100%的灵敏度和0%的虚警率,被称为完美分类器。 一个随机猜测模型。会给出从左下角到右上角的沿着对角线的点(对角线被称作line of no阅读全文
posted @ 2017-10-30 16:36 cnkai 阅读(276) 评论(0) 编辑
摘要: 注:本文是 "人工智能研究网" 的学习笔记 Precision和Recall都能够从下面的TP,TN,FP,FN里面计算出来。 几个缩写的含义 : 缩写 | 含义 | P | condition positive N | condition negative TP | true positive (阅读全文
posted @ 2017-10-30 16:35 cnkai 阅读(2121) 评论(2) 编辑
摘要: 注:本文是 "人工智能研究网" 的学习笔记 准确率 accuracy_score:函数计算分类准确率,返回被正确分类的样本比例(default)或者是数量(normalize=False) 在多标签分类问题中,该函数返回子集的准确率,对于一个给定的多标签样本,如果预测得到的标签集合与该样本真正的标签阅读全文
posted @ 2017-10-30 16:34 cnkai 阅读(7255) 评论(0) 编辑
摘要: 注:本文是 "人工智能研究网" 的学习笔记 使用sklearn.metrics包中的性能度量函数 1. 分类器性能指标 2. 回归器性能指标 3. 聚类器性能指标 4. 两两距离测度 分类器性能评估指标 将二元分类指标拓展到多类或多标签问题中去阅读全文
posted @ 2017-10-30 16:33 cnkai 阅读(146) 评论(0) 编辑