随笔分类 - python
摘要:一、基本概念 迭代(Iteration)是动词,是指通过遍历获取某容器内所有元素,特指遍历获取这个动作。 可迭代 (iterable)是形容词,是指某容器可被遍历获取内部所有元素,特指容器内元素可被遍历获取的特性。 在python中包含__iter__方法的对象就是可迭代的。 可迭代对象一般指某容器
阅读全文
摘要:写在前面: python装饰器(fuctional decorators)就是用于拓展原来函数功能的一种函数,目的是在不改变原函数名(或类名)的情况下,给函数增加新的功能。 这个函数的特殊之处在于它的返回值也是一个函数,这个函数是内嵌“原“”函数的函数。 一般而言,我们要想拓展原来函数代码,最直接的
阅读全文
摘要:我有两个列表:一个包含一组x点,另一个包含y点。我需要按照从最低到最高的顺序对x点的列表进行排序,并且移动y点以跟随它们的x个对应点。 x = [3,2,1] y = [1,2,3] points = zip(x,y) points [(3, 1), (2, 2), (1, 3)] sorted(p
阅读全文
摘要:d={"ok":1,"no":2} #对字典按键排序,用元组列表的形式返回 d1 = sorted(d.items(), key=lambda d:d[0],reverse = False) #[('no', 2), ('ok', 1)] #对字典按值排序,用元组列表的形式返回 d2 = sorte
阅读全文
摘要:Counter中文意思是计数器,也就是我们常用于统计的一种数据类型,在使用Counter之后可以让我们的代码更加简单易读。 我们先看一个简单的例子: #统计词频 colors = ['red', 'blue', 'red', 'green', 'blue', 'blue'] result = {}
阅读全文
摘要:1.什么是可变对象,什么是不可变对象 可变对象是指,一个对象(如列表)在不改变其所指向的地址的前提下,可以修改其所指向的地址中的值; 不可变对象是指,一个对象所指向的地址上值是不能修改的,如果你修改了这个对象的值,那么它指向的地址就改变了,相当于你把这个对象指向的值复制出来一份,然后做了修改后存到另
阅读全文
摘要:写在前面:城市计算研究中经常涉及到图论的相关知识,而且常常面对某些术语时,根本不知道在说什么.最近接触了NetworkX这个graph处理工具,发现这个工具已经解决绝大部分的图论问题(也许只是我自己认为的,没有证据证明),所以把这个工具的使用学习下,顺便学习图论的相关知识. 创建一个图 import
阅读全文
摘要:1.定义了一个需要两个参数的函数 def print_str(first, second): print first print second if __name__ == "__main__": print_str("hello", "world") 如果传一个参数调用,print_str("he
阅读全文
摘要:写在前面:python中的多线程其实并不是真正的多线程,如果想要充分地使用多核CPU的资源,在python中大部分情况需要使用多进程。Python提供了非常好用的多进程包multiprocessing,只需要定义一个函数,Python会完成其他所有事情。借助这个包,可以轻松完成从单进程到并发执行的转
阅读全文
摘要:一.在处理pandas表格数据时,有时会遇到这样的问题:按照某一列聚合后,判断另一列是否出现唯一值,比如安泰杯--跨境电商比赛中,某个商人的ID如果出现在两个国家(xx和yy),则要剔除这样的数据,这就需要我们按照商人ID进行groupby,然后判断每个商人所属的国家是否值唯一,不唯一则剔除。 de
阅读全文
摘要:刚接触pandas不久,在处理特征时,碰到一个恶心的问题:用groupby聚合后,之前的dataframe对象变成了series对象,聚合的字段变成了索引index,导致获取这些字段时很麻烦,后面发现reset_index()这个函数,兼职完美的解决了我的需求。 元素数据如下: 聚合后变成了这样:
阅读全文
摘要:os.path.abspath(path) #返回绝对路径 os.path.basename(path) #返回文件名 os.path.commonprefix(list) #返回list(多个路径)中,所有path共有的最长的路径。 os.path.dirname(path) #返回文件路径 os
阅读全文
摘要:import numpy as np import matplotlib.pyplot as plt ## %matplotlib inline表示在行中显示图片,在命令行运行报错 data = np.arange(0,1.1,0.01) plt.title('lines') ## 添加标题 plt
阅读全文
摘要:文章来自https://blog.csdn.net/qq_33120943/article/details/76569756 详细教程可以查看官方额示例:http://seaborn.pydata.org/examples/index.html
阅读全文
摘要:前面所介绍的都是以表格的形式中展现数据, 下面将介绍Pandas与Matplotlib配合绘制出折线图, 散点图, 饼图, 柱形图, 直方图等五大基本图形. Matplotlib是python中的一个2D图形库, 它能以各种硬拷贝的格式和跨平台的交互式环境生成高质量的图形, 比如说柱状图, 功率谱,
阅读全文
摘要:13. 简单计算 新建一个数据表df 13.1 加法计算 有两种方式, 一种是利用add()函数: a.add(b) 表示a与b之和, 另一种是直接利用加法运算符号"+" 两者运算的结果都是相同的: 对于累加求和上述两种方法同样适用, 还有一种方式就是采用apply()函数, 参考文档: https
阅读全文
摘要:1. 重复值的处理 利用drop_duplicates()函数删除数据表中重复多余的记录, 比如删除重复多余的ID. 2. 缺失值的处理 缺失值是数据中因缺少信息而造成的数据聚类, 分组, 截断等 2.1 缺失值产生的原因 主要原因可以分为两种: 人为原因和机械原因. 1) 人为原因: 由于人的主观
阅读全文

浙公网安备 33010602011771号