pandas学习笔记

一.pandas有三种数据结构

  series:相当于列,一维数组,包含索引和对应的值。可以通过index和values分别获取索引和值。有两种创建方式:字典和指定索引。

  dataframe:相当于多行多列,是pandas的核心数据结构。二维索引。

      head():默认查看前5行,

      tail(3):查看后3行。

      columns:表示行索引,index:表示列索引;

二.使用技巧

  1.在Pandas中,可以使用isnull和notnull函数来检查缺失的数据,返回布尔值。

  2.pandas的索引index不可变,无法修改;但索引可以重复,索引对象是个容器。

  3.默认情况下drop方法按行删除,且不会修改原数据,但指定axis=1,则按列删除;指定 inplace=True则修改原数据。

  4.

    pandas读写函数

函数 说明
read_excel

从excel的xls或xlsx文件中读取数据

read_csv

读取默认以逗号作为分隔符的文件

read_json 从json字符串中读取数据
read_html 从html中读取所有表格数据
read_sql 将sql查询的结果读取出来
read_table             读取默认以制表符分隔的文件

   5.xlrd模块用来读取xls文件,openpyxl用来读写xlsx文件。

  6.按列读取:df[column_name] ; 按行读取df.loc[int]

posted on 2021-05-15 15:04  看不见的风  阅读(79)  评论(0)    收藏  举报

导航