随笔分类 - python
python学习
摘要:修改数值 在Pandas中修改数值非常简单,先筛选出需要修改的数值范围,再为这个范围重新赋值。 df.iloc[0,0] # 查询值 # 'Liver' df.iloc[0,0] = 'Lily' # 修改值 df.iloc[0,0] # 查看结果 # 'Lily' 以上修改了一个具体的数值,还可以
阅读全文
摘要:指定列df.assign() df.assign(k=v)为指定一个新列的操作,k为新列的列名,v为此列的值,v必须是一个与原数据同索引的Series。今后我们会频繁用到它,它在链式编程技术中相当重要,因此这里专门介绍一下。我们平时在做数据探索分析时会增加一些临时列,如果新列全部使用赋值的方式生成,
阅读全文
摘要:执行表达式df.eval() df.eval()与之前介绍过的df.query()一样,可以以字符的形式传入表 达式,增加列数据。下面以增加总分为例: # 传入求总分表达式 df.eval('total = Q1+Q3+Q3+Q4') ''' name team Q1 Q2 Q3 Q4 total
阅读全文
摘要:增加行 可以使用loc[]指定索引给出所有列的值来增加一行数据。目前我们的df最大索引是99,增加一条索引为100的数据: # 新增索引为100的数据 df.loc[100] = ['tom', 'A', 88, 88, 88, 88] df ''' name team Q1 Q2 Q3 Q4 0
阅读全文
摘要:追加合并 增加行数据的使用场景相对较少,一般是采用数据追加的模式。数据追加会在后续章节中介绍。 df.append()可以追加一个新行: df = pd.DataFrame([[1, 2], [3, 4]], columns=list('AB')) df2 = pd.DataFrame([[5, 6
阅读全文
摘要:删除 删除有两种方法,一种是使用pop()函数。使用pop(),Series会删除指定索引的数据同时返回这个被删除的值,DataFrame会删除指定列并返回这个被删除的列。以上操作都是实时生效的。 # 删除索引为3的数据 s.pop(3) # 93 s ''' 0 89 1 36 2 57 4 65
阅读全文
摘要:删除空值 在一些情况下会删除有空值、缺失不全的数据,df.dropna可以执行 这种操作: df.dropna() # 一行中有一个缺失值就删除 df.dropna(axis='columns') # 只保留全有值的列 df.dropna(how='all') # 行或列全没值才删除 df.drop
阅读全文
摘要:使用NumPy需要先导入,约定俗成地为它起别名np。使用np.array 可传入一个元组或列表。如果是二维数据,可以是由列表组成的列表或 由元组组成的列表等形式。 import numpy as np np.array([1, 2, 3]) np.array((1, 2, 3)) # 同上 # ar
阅读全文
摘要:可以对字符串进行切片访问(同时适用于字符、列表、元组等)。 字符串从左往右,索引从0开始;从右往左,索引从–1开始。可以取字 符串中的片段,切片索引按左闭右开原则: var = 'Hello World!' # 按索引取部分内容,索引从0开始, 左必须小于右 # 支持字符、列表、元组 var[0]
阅读全文
摘要:也可以用isinstance来判断数据是不是指定的类型: isinstance(123, int) # 123是不是整型值 # True isinstance('123', int) # False isinstance(True, bool) # True
阅读全文
摘要:Pandas利用plot()调用Matplotlib快速绘制出数据可视化图形。注 意,第一次使用plot()时可能需要执行两次才能显示图形。可以使用plot()快速绘制折线图。 df['Q1'].plot() # Q1成绩的折线分布 可以先选择要展示的数据,再绘图。 df.loc['Ben','Q1
阅读全文
摘要:df.mean() # 返回所有列的均值 df.mean(1) # 返回所有行的均值,下同 df.corr() # 返回列与列之间的相关系数 df.count() # 返回每一列中的非空值的个数 df.max() # 返回每一列的最大值 df.min() # 返回每一列的最小值 df.median(
阅读全文
摘要:增加列: df['one'] = 1 # 增加一个固定值的列 df['total'] = df.Q1 + df.Q2 + df.Q3 + df.Q4 # 增加总成绩列 # 将计算得来的结果赋值给新列 df['total'] = df.loc[:,'Q1':'Q4'].apply(lambda x:s
阅读全文
摘要:df.groupby('team').sum().T df.groupby('team').sum().stack() df.groupby('team').sum().unstack()
阅读全文
摘要:我们可以实现类似SQL的groupby那样的数据透视功能:df.groupby('team').sum() # 按团队分组对应列相加df.groupby('team').mean() # 按团队分组对应列求平均# 不同列不同的计算方法df.groupby('team').agg({'Q1': sum
阅读全文
摘要:import re text = "Hello, world! This is a \"small\" example. Can you handle it?" pattern = r'[,.!"\']' result = re.sub(pattern, ' ', text) print(resul
阅读全文
摘要:RESTART: D:/Python37/ziti1.py Traceback (most recent call last): File "D:/Python37/ziti1.py", line 1, in <module> import docxModuleNotFoundError: No m
阅读全文
摘要:python中assert用法。具体分析如下 1、assert语句用来声明某个条件是真的。 2、如果你非常确信某个你使用的列表中至少有一个元素,而你想要检验这一点,并且在它非真的时候引发一个错误, 那么assert语句是应用在这种情形下的理想语句。 3、当assert语句失败的时候,会引发一Asse
阅读全文
摘要:import cv2 #读取图像 img = cv2.imread('~/Downloads/img_test.png') #获取图像高与宽 height,width = len(img), len(img[0]) #裁剪图像,上方为y0,下方为y1,左方为x0,右方为x1,裁剪图像格式为[y0:y
阅读全文
摘要:df=df.set_axis(['A','B','C','D','E','F','G','H','I','J','K','L','M','N','O','P','Q'],axis='columns')
阅读全文

浙公网安备 33010602011771号