python之使用pandas处理excel数据007

       一、环境安装

 1:pandas依赖处理Excel的xlrd模块,安装命令是:pip install xlrd
 2:安装pandas模块还需要一定的编码环境,确保你的电脑有这些环境:Net.4 、VC-Compiler以及winsdk_web
 3:步骤1和2 准备好了之后,可以开始安装pandas了,安装命令是:pip install pandas

  二、基本用法

DataFrame 按照列和按照行进行索引数据
按照列索引 df[’column_name’].values
按照行索引 df.loc[’row_key’].values 或 df.iloc[index].values

df.iloc[行标签,列标签] 是基于索引位来选取数据集,需要注意的是行、列为区间时,前闭后开集合。

import pandas as pd

# 默认读取第一个表单,前5行数据(不包含标题行,行号从0开始)
df = pd.read_excel("test_case.xlsx")
data = df.head()
print("获取到的测试数据:\n{0}".format(data))

# 指定表单名:表单名或索引,0表示第一个表单,返回嵌套列表
df_01 = pd.read_excel("test_case_futureloan.xlsx",sheet_name = "login_case")
或者使用index指定表单,从0开始
df_01 = pd.read_excel("test_case.xlsx",sheet_name = 1)
data_01 = df_01.values #获取数据,返回嵌套列表

print("获取到的测试数据:\n{0}".format(data_01))
# 读取指定行,0表示第一行,不包含表头
df = pd.read_excel("test_case_futureloan.xlsx")
!!! pandas1.0.0.0版本后以iloc代替ix!!!!
data = df_01["case_id"].values #读取某一列的值  或者 data = df.iloc[:, [9]].values  # 读取指定列
data = df_01.iloc[1].values # 读取指定行

data = df_01.iloc[[0,1]].values # 读取多行,就要在iloc[]里面嵌套列表指定行数
data = df.iloc[:2].values # 读取前2行,index=0、1
data = df.iloc[[0,1],[1,2]] #[0,1]读取第1、2行 [1,2]分别读取第2、3列数据
data =df_01.iloc[:,[1,2,4]] #读取所有行指定列[1,2,4]数据
print("标题", df.columns[9])  # 指定列的标题
print("标题",df.columns.values) # 所有标题
print("获取到的测试数据:\n{0}".format(data))
因为data = df.iloc[i,:].values #获取数据,返回嵌套列表,不便于我们读取测试数据,所以需要将数据转换为字典格式:
data = df.iloc[i,:].to_dict()

获取表单所有测试数据:
test_data = [] #存放每行测试数据,列表嵌套字典格式

for i  in fd_01.index.values: #获取表单行号,遍历
    row_data = fd_01.iloc[i,:].to_dict() #转换为字典格式
    test_data.append(row_data)
print("获取到的测试数据:\n{0}".format(test_data))

 



posted @ 2020-12-06 17:30  仰望浩瀚星辰  阅读(389)  评论(0)    收藏  举报