pandas模块

 

pandas是一个强大的Python数据分析的工具包,它是基于Numpy构建的,正因pandas的出现,让Python语言也成为使用最广泛而且强大的数据分析环境之一。

一、安装

1、方法一、

 

 

2、方法二、直接在命令行中  pip install pandas

 

 

Pandas的主要功能:

  • 具备对其功能的数据结构DataFrame,Series
  • 集成时间序列功能
  • 提供丰富的数学运算和操作
  • 灵活处理缺失数据

 

二、使用

先导入pandas

1、Series  是一种类似于一维数组的对象,由一组数据和一组与之相关的数据标签(索引)组成

 

 

例子:

 

 

创建series的两种方法

 

 例子

 

 

 

2、缺失值处理

01、什么是缺失值?就是NaN

 

 02、处理缺失值

 

 

03、判断出数组中的缺失值 用isnull 或者 notnull

 

 04、

 

 3、DataFrame是一个表格型的 数据结构,相当于是一个二维数组,含有一组有序的列。他可以被看做是由Series组成的字典,并且共用一个索引。

01、创建一个DataFrame数组可以有多种方式,其中最为常用的方式就是

       法一:利用包含等长度列表

       法二:Numpy数组的字典来形成DataFrame:

 

 

02、直接打开 表格文件

 

 

 

 03、爬取网络表

 

 使用第一行的数据替换默认的  横向索引               columns表示 列

 

 

 

 

 

 获得各个球队获取总冠军的次数 

 

  获得各个球队获取总冠军的次数 ,并排序

 

 

posted @ 2020-04-05 10:48  薛定谔的猫66  阅读(586)  评论(0)    收藏  举报