python之使用pandas处理excel数据007

一、环境安装

 1：pandas依赖处理Excel的xlrd模块，安装命令是：pip install xlrd
 2:安装pandas模块还需要一定的编码环境，确保你的电脑有这些环境：Net.4 、VC-Compiler以及winsdk_web
 3:步骤1和2 准备好了之后，可以开始安装pandas了，安装命令是：pip install pandas

　　二、基本用法

DataFrame 按照列和按照行进行索引数据
按照列索引 df[’column_name’].values
按照行索引 df.loc[’row_key’].values 或 df.iloc[index].values

df.iloc[行标签,列标签] 是基于索引位来选取数据集，需要注意的是行、列为区间时，前闭后开集合。

import pandas as pd

# 默认读取第一个表单,前5行数据(不包含标题行，行号从0开始)
df = pd.read_excel("test_case.xlsx")
data = df.head()
print("获取到的测试数据：\n{0}".format(data))

# 指定表单名:表单名或索引，0表示第一个表单,返回嵌套列表
df_01 = pd.read_excel("test_case_futureloan.xlsx",sheet_name = "login_case")
或者使用index指定表单，从0开始
df_01 = pd.read_excel("test_case.xlsx",sheet_name = 1)
data_01 = df_01.values #获取数据，返回嵌套列表

print("获取到的测试数据：\n{0}".format(data_01))

# 读取指定行,0表示第一行，不包含表头
df = pd.read_excel("test_case_futureloan.xlsx")
！！！ pandas1.0.0.0版本后以iloc代替ix！！！！
data = df_01["case_id"].values #读取某一列的值  或者 data = df.iloc[:, [9]].values  # 读取指定列
data = df_01.iloc[1].values # 读取指定行

data = df_01.iloc[[0,1]].values # 读取多行，就要在iloc[]里面嵌套列表指定行数
data = df.iloc[:2].values # 读取前2行，index=0、1
data = df.iloc[[0,1],[1,2]] #[0,1]读取第1、2行 [1,2]分别读取第2、3列数据
data =df_01.iloc[:,[1,2,4]] #读取所有行指定列[1,2,4]数据
print("标题", df.columns[9])  # 指定列的标题
print("标题",df.columns.values) # 所有标题
print("获取到的测试数据：\n{0}".format(data))

因为data = df.iloc[i,:].values #获取数据，返回嵌套列表，不便于我们读取测试数据，所以需要将数据转换为字典格式：

data = df.iloc[i,:].to_dict()

获取表单所有测试数据：

test_data = [] #存放每行测试数据，列表嵌套字典格式

for i  in fd_01.index.values: #获取表单行号，遍历
    row_data = fd_01.iloc[i,:].to_dict() #转换为字典格式
    test_data.append(row_data)
print("获取到的测试数据：\n{0}".format(test_data))

posted @ 2020-12-06 17:30 仰望浩瀚星辰阅读(395) 评论(0) 收藏举报

刷新页面返回顶部

仰望浩瀚星辰

python之使用pandas处理excel数据007

公告