随笔分类 -  数据分析

摘要:一、缺失数据NaN 1 from pandas import Series,DataFrame 2 import numpy as np 3 import pandas as pd 4 string_data = Series(['musickness','choke',np.nan,'love'] 阅读全文
posted @ 2019-12-13 11:18 闪亮可可仙 阅读(375) 评论(0) 推荐(0)
摘要:上一篇介绍了一些基本功能,包括一些方法:reindex(新索引)、drop(指定索引值丢弃某些项)、fill_value用来填充指定值、sort_index排序、rank排名等等。 其实有时候我并不知道这样写博客会不会有用,而且东西经常会忘记。不过希望每天都能学习一点吧! 一、统计方法 from p 阅读全文
posted @ 2019-11-19 16:54 闪亮可可仙 阅读(244) 评论(0) 推荐(0)
摘要:上一篇学习了Series与DataFrame这2种数据结构,Series就像array进化了,有了自己的索引值,有了属性。而DataFrame则包含了更广阔的范围,同样也有columns属性和index属性。最重要的一点就是:在运算中,大家只取相重叠的部分,你有我没有的东西就是缺失值NaN。 一、索 阅读全文
posted @ 2019-10-31 14:54 闪亮可可仙 阅读(303) 评论(0) 推荐(0)
摘要:一、Series与DataFrame from pandas import Series,DataFrame import pandas as pd 仅由一组简单的数据就可产生最简单的Series,数据+相关的标签: obj = Series([4,7,-5,3]) obj 0 4 1 7 2 -5 阅读全文
posted @ 2019-10-30 15:30 闪亮可可仙 阅读(326) 评论(0) 推荐(0)
摘要:变量:用来记录状态的变化。 基本类型:字符串、数字、列表、元组、字典。 分类:可变与不可变 如此可见:字符串类型就是不可变的(赋予新值时,地址变了) 由此可见:列表是可变的(更改值,地址不变) 同样,数字、元组为不可变类型,字典为可变类型。 访问顺序: 直接访问(变量名):数字 顺序访问(索引值): 阅读全文
posted @ 2019-06-11 22:01 闪亮可可仙 阅读(456) 评论(0) 推荐(0)