随笔分类 -  python

摘要:pandas Series 的 argmax 方法和 idxmax 方法用于获取 Series 的最大值的索引值: 举个栗子: 有一个pandas Series,它的索引是国家名,数据是就业率,要找出就业率最高的国家: 可以这样做: 如果是一个没有索引值的Series,则返回它的位置索引: 阅读全文
posted @ 2018-06-22 00:10 诗&远方 阅读(43659) 评论(1) 推荐(1)
摘要:pandas Series 比 numpy array 要强大很多,体现在很多方面 首先, pandas Series 有一些方法,比如: describe 方法可以给出 Series 的一些分析数据: 其次, pandas Series 和 numpy array 最大的区别是, pandas S 阅读全文
posted @ 2018-06-21 23:55 诗&远方 阅读(1873) 评论(0) 推荐(0)
摘要:numpy array 过滤后的数组,索引值从 0 开始. pandas Series 过滤后的 Series ,保持原来的索引,原来索引是几,就是几. 什么意思呢,来看个栗子: 可见, 对于 pd Series 来说,1234索引是 key ,而不是 index ,所以过滤后的数组,保留了原来的  阅读全文
posted @ 2018-06-20 00:31 诗&远方 阅读(739) 评论(0) 推荐(0)
摘要:python的 os 模块: 如果是 posix ,说明系统是Linux、Unix或Mac OS X,如果是 nt ,就是Windows系统。 uname() 函数在Windows上不提供,也就是说, os 模块的某些函数是跟操作系统相关的。 操作文件和目录的函数一部分放在os模块中,一部分放在os 阅读全文
posted @ 2018-06-15 00:02 诗&远方 阅读(564) 评论(0) 推荐(0)
摘要:在python中,可以对布尔值进行加减法运算. True会被看做 1 , False会被看做 0 : 阅读全文
posted @ 2018-06-10 01:33 诗&远方 阅读(3209) 评论(0) 推荐(0)
摘要:导入pandas life_expectancy = pd.Series(life_expectancy_values) gdp = pd.Series(gdp_values) pandas数组和numpy数组有很多一样的操作: (1) 截取部分 (2) 循环: (3) 常用函数: (4) 向量化运 阅读全文
posted @ 2018-06-10 01:27 诗&远方 阅读(2846) 评论(0) 推荐(0)
摘要:先解释下什么叫数据的相关性: 计算两个数组的平均值,如果两个数组中的两个值都大于平均值或者都小于平均值,则得到true. 如果一个大于平均值一个小于平均值,则得到false.最后计算true和false的个数. 比如,两个数组[1, 2, 3, 4] and [4, 5, 6, 7] , 得到 (4 阅读全文
posted @ 2018-06-10 01:21 诗&远方 阅读(7164) 评论(0) 推荐(0)
摘要:迭代器: 迭代器是一种数据流,可以进行迭代(循环),每次返回一个数据 生成器: 生成迭代器的函数就是生成器 比如: 上面这段代码里的 my_range 就是生成器, my_iterator 就是生成的迭代器, 可以循环迭代器. 生成器使用关键字 yield , yield 的值就是迭代器的数据流,每 阅读全文
posted @ 2018-06-06 00:12 诗&远方 阅读(443) 评论(0) 推荐(0)
摘要:lambda用来定义一个函数 普通函数: 使用lambda重写以上函数: lambda函数由三个部分组成: 1. lambda 关键字 2. 用 , 分割的参数,就是普通函数里的参数,后面跟一个 : 3. 函数体,就是普通函数里的函数体 一些栗子: 阅读全文
posted @ 2018-06-05 23:36 诗&远方 阅读(1539) 评论(0) 推荐(0)
摘要:列表推导式用于生成一个列表: 使用普通方法生成列表: 使用列表推导式生成列表: 列表推导式里有一个 for 循环, for 循环的前面部分是对元素的操作,对循环中的每个元素调用 .title() 方法. 列表推导式还可以添加 if 判断: 可以在 for 循环的最后添加条件,符合条件的元素再调用 f 阅读全文
posted @ 2018-06-03 01:45 诗&远方 阅读(196) 评论(0) 推荐(0)
摘要:enumerate方法用于循环list或tuple,循环的时候可以得到索引值和当前索引的对象: *注意: 也可以循环tuple 阅读全文
posted @ 2018-05-31 23:50 诗&远方 阅读(558) 评论(0) 推荐(0)
摘要:zip 返回一个将多个可迭代对象组合成一个元组序列的迭代器。 1. 循环多个list的数据: 2. 将多个list的数据组合成tuple的list: 3. 将tuple组成的list拆分成多个tuple: *注意,即使不是list,而是tuple,依然可以拆分,拆分后的结果都是tuple: *注意, 阅读全文
posted @ 2018-05-31 23:44 诗&远方 阅读(2456) 评论(0) 推荐(0)
摘要:标准化数据的公式: (数据值 - 平均数) / 标准差 结果: 阅读全文
posted @ 2018-05-31 23:16 诗&远方 阅读(8247) 评论(0) 推荐(0)
摘要:numpy截取数组部分和python的list截取部分不同,它不创建新数组,只是指向原数组的部分,所以当修改截取部分的某个值,原数组也会被修改,它们都指向同一个数组 阅读全文
posted @ 2018-05-31 23:14 诗&远方 阅读(19739) 评论(0) 推荐(1)