摘要: 直接上代码。 lambda x: value1 if x % 2 == 0 else value2 data['col_new'] = data['col'].apply(lambda x: '全国' if x == 1 else ('广东' if x == 2 else '其他省份')) 阅读全文
posted @ 2021-11-21 22:53 Hider1214 阅读(1582) 评论(0) 推荐(0)
摘要: 直接上代码。 df['percent'] = df['data'].astype(str) + '%' df['percent'] = df['data'].apply(lambda x: str(round(x, 2)) + '%') # apply不是矢量化的,针对大数据计算效率较低 阅读全文
posted @ 2021-11-21 22:50 Hider1214 阅读(242) 评论(0) 推荐(0)
摘要: 一、介绍 利用 transform 可以高效地汇总数据,直白的说:增加一列汇总列。 一般情况下,transform 与 groupby 组合使用。 使用语法: Series.transform(func, axis=0, **kwargs) 二、实操 基础用法 import pandas as pd 阅读全文
posted @ 2021-11-21 21:49 Hider1214 阅读(970) 评论(0) 推荐(0)
摘要: 一、背景 有这么一个原始数据,如下表: NO 日期 卡班号码 状态 使用车型 目的站 运输总重-KG 1 2020/5/1 MZZ1001 已发 2吨卡车 杭州 1500 2 2020/5/2 MZZ1001 未发 4吨卡车 杭州 3500 3 2020/5/3 MZZ1001 已到 6吨卡车 杭州 阅读全文
posted @ 2021-11-21 19:28 Hider1214 阅读(115) 评论(0) 推荐(0)
摘要: 修改 jupyter notebook 配置文件即可实现。 1.配置文件路径 在 cmd 中查看 jupyter 的配置文件路径,一般都是 .jupyter 的文件夹。 jupyter --config-dir # C:\Users\Hider\.jupyter 2.打开文件 nbconfig/no 阅读全文
posted @ 2021-11-21 01:03 Hider1214 阅读(4022) 评论(0) 推荐(0)
摘要: 1.设置类别 astype('category') 使用 pandas 可以设置和改变数据的类别。 import pandas as pd import numpy as np df = pd.DataFrame({'id':[1,2,3,4,5,6], 'grade':['a','b','b',' 阅读全文
posted @ 2021-11-21 00:54 Hider1214 阅读(2869) 评论(0) 推荐(0)
摘要: 一、透视表 Excel 中有一个强大的功能 —— 数据透视表(pivot table)。 利用数据透视表可以快速的进行分类汇总,自由组合字段快速计算,而这些只需要拖拉拽就可以实现。 典型的数据格式是扁平的,只包含行和列,不方便总结信息。 而透视表可以快速抽取有用的信息。 在 Pandas 中,可以利 阅读全文
posted @ 2021-11-21 00:20 Hider1214 阅读(4822) 评论(0) 推荐(2)