import pandas as pd
res = pd.read_excel('xx.xls') # 默认读取第一个表单
res.head(100) # 获取前100条数据,不填默认前5条
df = pd.read_excel('原料事业部销售分析明细表-11月.xls') # 这个会直接默认读取到这个Excel的第一个表单
data = df.iloc[1].values # 0表示第一行 这里读取数据并不包含表头,要注意哦!
data = df.iloc[[1, 2]].values # 读取指定多行的话,就要在iloc[]里面嵌套列表指定行数
data = df.iloc[1, 3] # 读取指定第一行第三列的值
data = df.loc[1:3, ['业务员', '部门归属']].values # 获取'业务员','部门归属'中列下1-3行的数据
print(df.index.values) # 获取行号
print(df.columns.values) # 获取列名
print(df['单据月份'].values) # 获取指定列的值
print("读取指定行的数据:\n{0}".format(data))
print(df.values) # 获取所有数据
# 设置列对齐
pd.set_option("display.unicode.ambiguous_as_wide", True)
pd.set_option("display.unicode.east_asian_width", True)
# 读取工号姓名时段交易额,使用默认索引
dataframe = pd.read_excel('xx.xls',
usecols=['单据月份', '单据日期', '业务员', '发货单号', '本币无税金额'])
# print(dataframe) # 打印所有
# print(dataframe[:10]) # 行号筛选前10条数据
# print(dataframe[0:1]) # 拿到指定第一条的数据
# print(dataframe.iloc[0]) # 拿到指定第一条的数据,格式好看一点
# 单据月份 2020-11
# 单据日期 2020-11-02
# 业务员 谢立安
# 发货单号 FHJX20110200155
# 本币无税金额 7876.99
# Name: 0, dtype: object
print(dataframe.at[3, '业务员']) # 查看第四行中的列名为业务员的数据
print(dataframe[dataframe['本币无税金额'] < 7000]) # 获取指定字段小于7000
print(dataframe[dataframe['本币无税金额'] < 7000]['本币无税金额'].sum()) # 求和,如果是金额就相加,字符串就拼接
print(dataframe[(dataframe.单据日期 == '2020-11-16') & (dataframe.业务员 == '刘凡云')][:10]) # and