摘要: 1、问题: 如下示例,需要将右边的表格匹配上对应工号的销售额。 这属于vlookup函数最基础的单条件匹配应用,左边表称为A表。右边表称为B表。 2、vlookup函数套路介绍 vlookup函数涉及到4个参数: lookup_value: 根据什么查找你要匹配的内容,称为查阅值,该参数来源于B表。 阅读全文
posted @ 2020-02-02 21:30 gangandi 阅读(423) 评论(0) 推荐(0) 编辑
摘要: 最近一直断断续续的做这个泰坦尼克生存预测模型的练习,这个kaggle的竞赛题,网上有很多人都分享过,而且都很成熟,也有些写的非常详细,我主要是在牛人们的基础上,按照数据挖掘流程梳理思路,然后通过练习每一步来熟悉应用python进行数据挖掘的方式。 数据挖掘的一般过程是:数据预览——>数据预处理(缺失 阅读全文
posted @ 2018-05-25 00:03 gangandi 阅读(4527) 评论(0) 推荐(1) 编辑
摘要: 上一篇复盘的是选择行和列,这是利用python操作数据的基础和根本。本文将总结基本的算术运算规则。 算术运算 对于两个对象进行加减乘除的算数运算时,如果两个对象有不同的索引对,那么运算结果的索引就是该索引对的并集。而结果集索引对应的值是两个对象相同索引对应的值相加减乘除,不同的索引对应的值统一为Na 阅读全文
posted @ 2018-05-14 23:29 gangandi 阅读(16924) 评论(0) 推荐(0) 编辑
摘要: pandas主要的两个数据结构是:series(相当于一行或一列数据机构)和DataFrame(相当于多行多列的一个表格数据机构)。 本文为了方便理解会与excel或者sql操作行或列来进行联想类比 1.重新索引:reindex和ix 上一篇中介绍过数据读取后默认的行索引是0,1,2,3...这样的 阅读全文
posted @ 2018-05-03 00:16 gangandi 阅读(104859) 评论(2) 推荐(3) 编辑
摘要: 本文要点刚要: (一)读文本文件格式的数据函数:read_csv,read_table 1.读不同分隔符的文本文件,用参数sep 2.读无字段名(表头)的文本文件 ,用参数names 3.为文本文件制定索引,用index_col 4.跳行读取文本文件,用skiprows 5.数据太大时需要逐块读取文 阅读全文
posted @ 2018-04-26 23:07 gangandi 阅读(59505) 评论(1) 推荐(1) 编辑