会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
千里之行,始于足下
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
30
31
32
33
34
35
36
37
38
···
67
下一页
2023年8月14日
【pandas小技巧】--日期相关处理
摘要: 日期处理相关内容之前pandas基础系列中有一篇专门介绍过,本篇补充两个常用的技巧。 1. 多列合并为日期 当收集来的数据中,年月日等信息分散在多个列时,往往需要先合并成日期类型,然后才能做分析处理。合并多列转换为日期类型,可以直接用 to_datetime函数来处理: import pandas
阅读全文
posted @ 2023-08-14 10:46 wang_yb
阅读(929)
评论(5)
推荐(0)
2023年8月10日
【pandas小技巧】--列值的映射
摘要: 映射列值是指将一个列中的某些特定值映射为另外一些值,常用于数据清洗和转换。 使用映射列值的场景有很多,以下是几种常见的场景: 将字符串类型的列中的某些值映射为数字。例如,将“男”和“女”分别映射为 0 和 1,以便进行机器学习算法的训练和预测。 将缩写替换为全称。例如,将“USA”和“UK”分别替换
阅读全文
posted @ 2023-08-10 12:22 wang_yb
阅读(1043)
评论(0)
推荐(0)
2023年8月9日
【pandas小技巧】--字符串转数值
摘要: 字符串转数字的用途和场景很多,其中主要包括以下几个方面: 数据清洗:在进行数据处理时,经常会遇到一些数据类型不匹配的问题,比如某些列中的字符串类型被误认为是数字类型,此时需要将这些字符串类型转换为数字类型,才能进行后续的数值计算或统计分析。 数据整理:有时候输入的原始数据可能存在格式问题,例如有些数
阅读全文
posted @ 2023-08-09 08:59 wang_yb
阅读(2567)
评论(2)
推荐(2)
2023年8月7日
【pandas小技巧】--缺失值的列
摘要: 在实际应用中,数据集中经常会存在缺失值,也就是某些数据项的值并未填充或者填充不完整。缺失值的存在可能会对后续的数据分析和建模产生影响,因此需要进行处理。 pandas提供了多种方法来处理缺失值,例如删除缺失值、填充缺失值等。删除缺失值可能会导致数据量减少,填充缺失值则能够尽量保留原始数据集的完整性,
阅读全文
posted @ 2023-08-07 09:37 wang_yb
阅读(903)
评论(4)
推荐(0)
2023年8月3日
【pandas小技巧】--拆分列
摘要: 拆分列是pandas中常用的一种数据操作,它可以将一个包含多个值的列按照指定的规则拆分成多个新列,方便进行后续的分析和处理。拆分列的使用场景比较广泛,以下是一些常见的应用场景: 处理日期数据:在日期数据中,经常会将年、月、日等信息合并成一列,通过拆分列可以将其拆分成多个新列,方便进行时间序列分析。
阅读全文
posted @ 2023-08-03 09:55 wang_yb
阅读(2161)
评论(0)
推荐(1)
2023年8月2日
【pandas小技巧】--反转行列顺序
摘要: 反转pandas DataFrame的行列顺序是一种非常实用的操作。在实际应用中,当我们需要对数据进行排列或者排序时,通常会使用到Pandas的行列反转功能。这个过程可以帮助我们更好地理解数据集,发现其中的规律和趋势。同时,行列反转还可以帮助我们将数据可视化,使得图表更加易于理解。 除了常规的数据分
阅读全文
posted @ 2023-08-02 16:06 wang_yb
阅读(2037)
评论(0)
推荐(1)
2023年7月31日
【pandas小技巧】--修改列的名称
摘要: 重命名 pandas 数据中列的名称是一种常见的数据预处理任务。这通常是因为原始数据中的列名称可能不够清晰或准确。例如,列名可能包含空格、大写字母、特殊字符或拼写错误。 使用 pandas 的 rename函数可以帮助我们更改列名,从而使数据更加清晰和易于理解。此外,重命名列名还可以确保您的代码在维
阅读全文
posted @ 2023-07-31 15:54 wang_yb
阅读(1521)
评论(0)
推荐(0)
2023年7月30日
【pandas小技巧】--按类型选择列
摘要: 本篇介绍的是pandas选择列数据的一个小技巧。之前已经介绍了很多选择列数据的方式,比如loc,iloc函数,按列名称选择,按条件选择等等。 这次介绍的是按照列的数据类型来选择列,按类型选择列可以帮助你快速选择正确的数据类型,提高数据分析的效率。 1. 类型种类 pandas列的数据类型主要有4大种
阅读全文
posted @ 2023-07-30 10:59 wang_yb
阅读(859)
评论(0)
推荐(1)
2023年7月26日
【pandas小技巧】--随机挑选子集
摘要: 在 pandas 中,如果遇到数据量特别大的情况,随机挑选 DataFrame 的子集可以帮助我们更深入地了解数据,从而更好地进行数据分析和决策。 随机挑选子集的用途主要有: 评估数据质量:随机挑选 DataFrame 的子集可以帮助我们检查数据集的质量,以便进一步探索和挖掘数据。例如,我们可以通过
阅读全文
posted @ 2023-07-26 10:38 wang_yb
阅读(497)
评论(4)
推荐(0)
2023年7月19日
【pandas小技巧】--读取多个文件
摘要: 日常分析数据时,只有单一数据文件的情况其实很少见,更多的情况是,我们从同一个数据来源定期或不定期的采集了很多数据文件;或者从不同的数据源采集多种不同格式的数据文件。 在这样的情况下,分析数据之前,需要将不同的数据集合并起来。合并数据一般有两个维度,一是同构的数据集合并后行数增加;一是异构的数据集合并
阅读全文
posted @ 2023-07-19 21:57 wang_yb
阅读(725)
评论(0)
推荐(0)
上一页
1
···
30
31
32
33
34
35
36
37
38
···
67
下一页
公告