03 2022 档案

摘要:pandas速成笔记(5)-快速分析平均值、总和接上篇继续,记得小时候读书那会儿,还没有双减,每次考试完,大家最关心的就是全班的成绩分布,假如有下面一张成绩表: 老师们通常很快就会算出『平均分、总分』这些关键指标,然后各班之间,就开始攀比: 当然,这些在Excel里用SUM/AVERAGE函数,再结合自动填充很容易实现,pandas里要如何类似统 阅读全文
posted @ 2022-03-20 20:20 菩提树下的杨过 阅读(768) 评论(0) 推荐(0)
摘要:pandas速成笔记(4)-数据图表接上篇继续,做数据分析,各种数据图表是必不可少的,还是以下面这张表为例: 一、单列柱状图 假设要把9月份,A、B这2个分类的Amount提取出来画一个柱状图,可以这么做: import pandas as pd import matplotlib.pyplot as plt df = pd.read 阅读全文
posted @ 2022-03-20 18:44 菩提树下的杨过 阅读(319) 评论(0) 推荐(0)
摘要:pandas速成笔记(3)-join/groupby/sort/行列转换接上篇继续 ,这回看下一些常用的操作: 一、join 联表查询 有数据库开发经验的同学,一定对sql中的join ... on 联表查询不陌生,pandas也有类似操作 假设test.xlsx的sheet1, sheet2中分别有下面的数据(相当于2张表) 现在要以ID做为作为Key,将二张表joi 阅读全文
posted @ 2022-03-19 22:24 菩提树下的杨过 阅读(470) 评论(0) 推荐(0)
摘要:pandas速成笔记(2)-excel增删改查基本操作接上篇继续,本篇演示对excel的基本增删改查操作。 一、读取excel 1.1 常规读取 假设有以下excel文件: 002.xlsx 用pandas可以这样读取: import pandas as pd df = pd.read_excel("data/002.xlsx") print(df.s 阅读全文
posted @ 2022-03-13 22:05 菩提树下的杨过 阅读(855) 评论(0) 推荐(0)
摘要:pandas速成笔记(1)-环境搭建及excel读取工作中经常会遇到一些excel的数据分析工作,虽然本身excel本身有非常强大的功能,但如果需要将一些数据分析结果集成在自己的项目中,excel就显示有些不方便了(总不能每次在excel里做好图表,再截图贴进来吧),幸好python的生态圈足够强大,有pandas这种利器,能以编程的方式,方便快捷的 阅读全文
posted @ 2022-03-13 16:35 菩提树下的杨过 阅读(578) 评论(0) 推荐(0)