python常用处理表格参数
在Python中处理表格数据,常用的库包括pandas、openpyxl、xlrd、xlwt等。以下是一些常用的处理表格参数和方法:
使用pandas处理表格
pandas是Python中处理表格数据最强大的库之一。以下是一些常用的参数和方法:
读取表格数据
import pandas as pd
# 读取Excel文件
df = pd.read_excel('file.xlsx')
# 读取CSV文件
df = pd.read_csv('file.csv')
# 读取指定sheet的Excel文件
df = pd.read_excel('file.xlsx', sheet_name='Sheet1')
# 读取指定行和列的数据
df = pd.read_excel('file.xlsx', skiprows=5, usecols="A:C")
```
写入表格数据
# 写入Excel文件
df.to_excel('output.xlsx', index=False)
# 写入CSV文件
df.to_csv('output.csv', index=False)
# 写入指定sheet的Excel文件
with pd.ExcelWriter('output.xlsx') as writer:
df.to_excel(writer, sheet_name='Sheet1', index=False)
```
数据处理
# 查看前几行数据
print(df.head())
# 查看数据基本信息
print(df.info())
# 选择特定列
df_selected = df[['column1', 'column2']]
# 过滤数据
df_filtered = df[df['column1'] > 10]
# 添加新列
df['new_column'] = df['column1'] + df['column2']
# 删除列
df.drop('column1', axis=1, inplace=True)
# 分组和聚合
grouped = df.groupby('column1').sum()
使用openpyxl处理Excel文件
openpyxl是一个专门用于读写Excel 2010 xlsx/xlsm/xltx/xltm文件的库。
读取Excel文件
from openpyxl import load_workbook
wb = load_workbook('file.xlsx')
sheet = wb['Sheet1']
for row in sheet.iter_rows(values_only=True):
print(row)
写入Excel文件
from openpyxl import Workbook
wb = Workbook()
sheet = wb.active
sheet['A1'] = 'Hello'
sheet['B1'] = 'World'
wb.save('output.xlsx')
使用xlrd和xlwt处理Excel文件
xlrd用于读取Excel文件,xlwt用于写入Excel文件。
读取Excel文件
import xlrd
workbook = xlrd.open_workbook('file.xls')
sheet = workbook.sheet_by_name('Sheet1')
for row_idx in range(sheet.nrows):
row = sheet.row(row_idx)
print([cell.value for cell in row])
写入Excel文件
import xlwt
workbook = xlwt.Workbook()
sheet = workbook.add_sheet('Sheet1')
sheet.write(0, 0, 'Hello')
sheet.write(0, 1, 'World')
workbook.save('output.xls')
总结
pandas:适用于大多数表格数据处理需求,功能强大且易于使用。
openpyxl:适用于需要精细控制Excel文件格式和内容的场景。
xlrd/xlwt:适用于处理旧版Excel文件(xls格式)。

浙公网安备 33010602011771号