pandas学习笔记
一.pandas有三种数据结构
series:相当于列,一维数组,包含索引和对应的值。可以通过index和values分别获取索引和值。有两种创建方式:字典和指定索引。
dataframe:相当于多行多列,是pandas的核心数据结构。二维索引。
head():默认查看前5行,
tail(3):查看后3行。
columns:表示行索引,index:表示列索引;
二.使用技巧
1.在Pandas中,可以使用isnull和notnull函数来检查缺失的数据,返回布尔值。
2.pandas的索引index不可变,无法修改;但索引可以重复,索引对象是个容器。
3.默认情况下drop方法按行删除,且不会修改原数据,但指定axis=1,则按列删除;指定 inplace=True则修改原数据。
4.
pandas读写函数
| 函数 | 说明 |
| read_excel |
从excel的xls或xlsx文件中读取数据 |
| read_csv |
读取默认以逗号作为分隔符的文件 |
| read_json | 从json字符串中读取数据 |
| read_html | 从html中读取所有表格数据 |
| read_sql | 将sql查询的结果读取出来 |
| read_table | 读取默认以制表符分隔的文件 |
5.xlrd模块用来读取xls文件,openpyxl用来读写xlsx文件。
6.按列读取:df[column_name] ; 按行读取df.loc[int]
浙公网安备 33010602011771号