摘要:
About psutil (python system and process utilities) is a cross-platform library for retrieving information on running processes and system utilization( 阅读全文
posted @ 2018-09-13 17:03
NAVYSUMMER
阅读(809)
评论(0)
推荐(0)
摘要:
警告和疑难意味着一个看不见的问题。在使用Pandas过程中,需要特别注意的地方。 与Pandas一起使用If/Truth语句 当尝试将某些东西转换成布尔值时,Pandas遵循了一个错误的惯例。 这种情况发生在使用布尔运算的。 目前还不清楚结果是什么。 如果它是真的,因为它不是zerolength? 阅读全文
posted @ 2018-09-13 16:14
NAVYSUMMER
阅读(267)
评论(0)
推荐(0)
摘要:
由于许多潜在的Pandas用户对SQL有一定的了解,因此本文章旨在提供一些如何使用Pandas执行各种SQL操作的示例。 Python Python 文件:tips.csv - Csv Csv 执行上面示例代码,得到以下结果 - Shell Shell 选择(Select) 在SQL中,选择是使用逗 阅读全文
posted @ 2018-09-13 16:14
NAVYSUMMER
阅读(505)
评论(0)
推荐(0)
摘要:
Pandas I/O API是一套像pd.read_csv()一样返回Pandas对象的顶级读取器函数。 读取文本文件(或平面文件)的两个主要功能是read_csv()和read_table()。它们都使用相同的解析代码来智能地将表格数据转换为DataFrame对象 - Python Python 阅读全文
posted @ 2018-09-13 16:12
NAVYSUMMER
阅读(447)
评论(0)
推荐(0)
摘要:
当任何匹配特定值的数据(NaN/缺失值,尽管可以选择任何值)被省略时,稀疏对象被“压缩”。 一个特殊的SparseIndex对象跟踪数据被“稀疏”的地方。 这将在一个例子中更有意义。 所有的标准Pandas数据结构都应用了to_sparse方法 - Python Python 执行上面示例代码,得到 阅读全文
posted @ 2018-09-13 16:12
NAVYSUMMER
阅读(1171)
评论(0)
推荐(0)
摘要:
基本绘图:绘图 Series和DataFrame上的这个功能只是使用matplotlib库的plot()方法的简单包装实现。参考以下示例代码 - Python Python 执行上面示例代码,得到以下结果 - 如果索引由日期组成,则调用gct().autofmt_xdate()来格式化x轴,如上图所 阅读全文
posted @ 2018-09-13 16:11
NAVYSUMMER
阅读(326)
评论(0)
推荐(0)
摘要:
通常实时的数据包括重复的文本列。例如:性别,国家和代码等特征总是重复的。这些是分类数据的例子。 分类变量只能采用有限的数量,而且通常是固定的数量。除了固定长度,分类数据可能有顺序,但不能执行数字操作。 分类是Pandas数据类型。 分类数据类型在以下情况下非常有用 - 一个字符串变量,只包含几个不同 阅读全文
posted @ 2018-09-13 16:10
NAVYSUMMER
阅读(3912)
评论(1)
推荐(0)
摘要:
时间差(Timedelta)是时间上的差异,以不同的单位来表示。例如:日,小时,分钟,秒。它们可以是正值,也可以是负值。可以使用各种参数创建Timedelta对象,如下所示 - 字符串 通过传递字符串,可以创建一个timedelta对象。参考以下示例代码 - Python Python 执行上面救命 阅读全文
posted @ 2018-09-13 16:09
NAVYSUMMER
阅读(2904)
评论(0)
推荐(0)
摘要:
日期功能扩展了时间序列,在财务数据分析中起主要作用。在处理日期数据的同时,我们经常会遇到以下情况 - 生成日期序列 将日期序列转换为不同的频率 创建一个日期范围 通过指定周期和频率,使用date.range()函数就可以创建日期序列。 默认情况下,范围的频率是天。参考以下示例代码 - Python 阅读全文
posted @ 2018-09-13 16:08
NAVYSUMMER
阅读(564)
评论(0)
推荐(0)
摘要:
Pandas提供了各种工具(功能),可以轻松地将Series,DataFrame和Panel对象组合在一起。 Python Python 其中, objs - 这是Series,DataFrame或Panel对象的序列或映射。 axis - {0,1,...},默认为0,这是连接的轴。 join - 阅读全文
posted @ 2018-09-13 16:07
NAVYSUMMER
阅读(232)
评论(0)
推荐(0)
摘要:
Pandas具有功能全面的高性能内存中连接操作,与SQL等关系数据库非常相似。Pandas提供了一个单独的merge()函数,作为DataFrame对象之间所有标准数据库连接操作的入口 - Python Python 在这里,有以下几个参数可以使用 - left - 一个DataFrame对象。 r 阅读全文
posted @ 2018-09-13 16:06
NAVYSUMMER
阅读(172)
评论(0)
推荐(0)
摘要:
任何分组(groupby)操作都涉及原始对象的以下操作之一。它们是 - 分割对象 应用一个函数 结合的结果 在许多情况下,我们将数据分成多个集合,并在每个子集上应用一些函数。在应用函数中,可以执行以下操作 - 聚合 - 计算汇总统计 转换 - 执行一些特定于组的操作 过滤 - 在某些情况下丢弃数据 阅读全文
posted @ 2018-09-13 16:05
NAVYSUMMER
阅读(863)
评论(0)
推荐(0)
摘要:
当有了滚动,扩展和ewm对象创建了以后,就有几种方法可以对数据执行聚合。 DataFrame应用聚合 让我们创建一个DataFrame并在其上应用聚合。 Python Python 执行上面示例代码,得到以下结果 - Shell Shell 可以通过向整个DataFrame传递一个函数来进行聚合,或 阅读全文
posted @ 2018-09-13 16:04
NAVYSUMMER
阅读(620)
评论(0)
推荐(0)
摘要:
数据丢失(缺失)在现实生活中总是一个问题。 机器学习和数据挖掘等领域由于数据缺失导致的数据质量差,在模型预测的准确性上面临着严重的问题。 在这些领域,缺失值处理是使模型更加准确和有效的重点。 何时以及为什么数据丢失? 想象一下有一个产品的在线调查。很多时候,人们不会分享与他们有关的所有信息。 很少有 阅读全文
posted @ 2018-09-13 16:04
NAVYSUMMER
阅读(173)
评论(0)
推荐(0)
摘要:
为了处理数字数据,Pandas提供了几个变体,如滚动,展开和指数移动窗口统计的权重。 其中包括总和,均值,中位数,方差,协方差,相关性等。 下来学习如何在DataFrame对象上应用上提及的每种方法。 .rolling()函数 这个函数可以应用于一系列数据。指定window=n参数并在其上应用适当的 阅读全文
posted @ 2018-09-13 16:03
NAVYSUMMER
阅读(428)
评论(0)
推荐(0)
摘要:
统计方法有助于理解和分析数据的行为。现在我们将学习一些统计函数,可以将这些函数应用到Pandas的对象上。 pct_change()函数 系列,DatFrames和Panel都有pct_change()函数。此函数将每个元素与其前一个元素进行比较,并计算变化百分比。 Python Python 执行 阅读全文
posted @ 2018-09-13 16:02
NAVYSUMMER
阅读(1672)
评论(0)
推荐(0)
摘要:
在本章中,我们将讨论如何切割和丢弃日期,并获取Pandas中大对象的子集。 Python和NumPy索引运算符"[]"和属性运算符"."。 可以在广泛的用例中快速轻松地访问Pandas数据结构。然而,由于要访问的数据类型不是预先知道的,所以直接使用标准运算符具有一些优化限制。对于生产环境的代码,我们 阅读全文
posted @ 2018-09-13 16:01
NAVYSUMMER
阅读(2421)
评论(0)
推荐(0)
摘要:
Pandas提供API来自定义其行为的某些方面,大多使用来显示。 API由五个相关函数组成。它们分别是 - get_option() set_option() reset_option() describe_option() option_context() 现在来了解函数是如何工作的。 get_o 阅读全文
posted @ 2018-09-13 16:00
NAVYSUMMER
阅读(317)
评论(0)
推荐(0)
摘要:
在本章中,我们将使用基本系列/索引来讨论字符串操作。在随后的章节中,将学习如何将这些字符串函数应用于数据帧(DataFrame)。 Pandas提供了一组字符串函数,可以方便地对字符串数据进行操作。 最重要的是,这些函数忽略(或排除)丢失/NaN值。 几乎这些方法都使用Python字符串函数(请参阅 阅读全文
posted @ 2018-09-13 15:58
NAVYSUMMER
阅读(2548)
评论(0)
推荐(0)
摘要:
Pandas有两种排序方式,它们分别是 - 按标签 按实际值 下面来看看一个输出的例子。 Python Python 执行上面示例代码,得到以下结果 - Shell Shell 在unsorted_df数据值中,标签和值未排序。下面来看看如何按标签来排序。 按标签排序 使用sort_index()方 阅读全文
posted @ 2018-09-13 15:57
NAVYSUMMER
阅读(554)
评论(0)
推荐(0)