Pandas - 随笔分类 - 脱离低级趣味

摘要：阅读全文

posted @ 2024-06-15 23:39 脱离低级趣味阅读(14) 评论(0) 推荐(0)

摘要：今天在使用dropna函时候，感觉有点混乱，不明白为什么为何下面两个代码，how和参数选择all和选择any都是同样的结果。当时想的是对A列进行删除，如果A列全部是Na那么选择All才会生效。实际原理如下: 1：axis=0为按照行删除， axis=1为按照列删除。 2：如果不设置subset参阅读全文

posted @ 2024-06-14 19:45 脱离低级趣味阅读(269) 评论(0) 推荐(0)

Pandas的数据合并

摘要：阅读全文

posted @ 2023-11-28 14:11 脱离低级趣味阅读(22) 评论(0) 推荐(0)

记一个pandas 分组之后.head()返回的数据问题

摘要：意思是：在0.12版本中， pandas分组之后内部会按照组进行排序，取.head()即可看到，但是0.13之后不再有排序，而是按照本来的顺序进行排序的。所以在0.13之后如果要取分组之后的前N行数据，就必须要先分组之后用apply函数之后才会讲组排序，然后取.head(N)才能取到想要的数据。阅读全文

posted @ 2021-11-20 22:13 脱离低级趣味阅读(254) 评论(0) 推荐(0)

pandas 讲数据分组之后保留前N行方法

摘要：原始数据如下：（图是从 excel 截的，最左1行不是数据，是 excel 自带的行号，为了方便说明截进来的）除去首行是标题外，有效数据为 28行 x 4列目前的需求是根据 partition 分组，然后取每组的前 2 行，如果不考虑排序，代码如下：（把head()里面的数字改成 n 就可以取阅读全文

posted @ 2021-11-20 21:02 脱离低级趣味阅读(1776) 评论(0) 推荐(0)

Pandas一个需求：存在一个列表，需要在一个DataFrame中取到以该列表为索引的数据

摘要：需求：Pandas一个需求：存在一个列表，需要在一个DataFrame中取到以该列表为索引的数据这里有一个坑， In [103]: s = pd.Series([1, 2, 3]) In [104]: s Out[104]: 0 1 1 2 2 3 dtype: int64当loc[]中的列表包含阅读全文

posted @ 2021-05-24 08:39 脱离低级趣味阅读(436) 评论(0) 推荐(0)

map + apply + applymap

摘要：在日常的数据处理中，经常会对一个DataFrame进行逐行、逐列和逐元素的操作，对应这些操作，Pandas中的map、apply和applymap可以解决绝大部分这样的数据处理需求。这篇文章就以案例附带图解的方式，为大家详细介绍一下这三个方法的实现原理，相信读完本文后，不论是小白还是Pandas的进阅读全文

posted @ 2021-04-28 18:47 脱离低级趣味阅读(163) 评论(0) 推荐(0)

pandas——read_csv

摘要：pandas.read_csv 1.filepath_or_buffer：设置需要访问的文件的有效路径. 2.sep：str, default ','. 指定读取文件的分隔符.支持自定义分隔符. 3.delimiter：str, default None 定界符.备选分隔符（如果指定该参数，则sep 阅读全文

posted @ 2021-03-26 20:39 脱离低级趣味阅读(261) 评论(0) 推荐(0)

Dataframe 根据其他列的条件新增一列

摘要：如代码所示，判断如果城市名中含有ing字段且年份为2016，则新列test值赋为1，否则为0. import numpy as np import pandas as pd data = {'city': ['Beijing', 'Shanghai', 'Guangzhou', 'Shenzhen' 阅读全文

posted @ 2020-12-10 16:07 脱离低级趣味阅读(1729) 评论(0) 推荐(0)

pandas.groupby + drona

摘要：group by: 当groupby接收一个函数为参数的时候，默认会将改DataFrame的索引值作为参数传递到改函数内部，然后函数得到的结果为分组键进行分组：该分组即根据名字的长度来进行分组。其中len函数为python内置函数，也可以自己构造函数。 dropna DataFrame.dropn 阅读全文

posted @ 2020-04-26 15:00 脱离低级趣味阅读(494) 评论(0) 推荐(0)

Pandas操作excel

摘要：读取excel：Pandas库read_excel()参数详解 pandas.read_excel（io，sheet_name = 0，header = 0，names = None，index_col = None，usecols = None，squeeze = False,dtype = No 阅读全文

posted @ 2019-12-06 15:03 脱离低级趣味阅读(4672) 评论(0) 推荐(0)

脱离低级趣味

随笔分类 - Pandas