python处理excel文件(xls格式和xlsx格式)

一、背景

帮助客户处理业务员名单, 一万人的名单中处理1700人信息。。。。

二、实现流程：so easy

1、根据客户提供的待处理人员名单(excel表格)，python脚本读取excel人员信息；

2、脚本获取信息后，再连接数据库，修改这些人员的信息。

三、实现代码: [仅列出处理excel部分脚本]

1、说明

"""
Excel中有xls和xlsx两种格式，它们之间的区别是：
    1、文件格式不同。xls是一个特有的二进制格式，其核心结构是复合文档类型的结构，
　　　　而xlsx的核心结构是XML类型的结构，采用的是基于 XML的压缩方式，使其占用的空间更小。xlsx 中最后一个 x 的意义就在于此。
    2、版本不同。xls是Excel2003及以前版本生成的文件格式，而xlsx是Excel2007及以后版本生成的文件格式。
    3、兼容性不同。xlsx格式是向下兼容的，可兼容xls格式。

处理使用的依赖:
    xls :  [Python自带的模块] 中有针对xls格式的 [xlrd和xlwt] 模块，但这两个库仅仅是针对xls的操作.
    xlsx:  当我们要操作xlsx格式文件时，则需要使用到 [openpyxl] 第三方库.
"""

2、处理xls格式脚本

（1）安装xlutils依赖

pip install xlutils

（2） python处理脚本

from xlutils.copy import copy

import xlrd
import xlwt


def read_xls_excel(url, index):
    '''
    读取xls格式文件
    参数：
        url:文件路径
        index：工作表序号（第几个工作表，传入参数从1开始数）
    返回：
        data:表格中的数据
    '''
    # 打开指定的工作簿
    workbook = xlrd.open_workbook(url)
    # 获取工作簿中的所有表格
    sheets = workbook.sheet_names()
    # 获取工作簿中所有表格中的的第 index 个表格
    worksheet = workbook.sheet_by_name(sheets[index-1])
    # 定义列表存储表格数据
    data = []
    # 遍历每一行数据
    for i in range(0, worksheet.nrows):
        # 定义表格存储每一行数据
        da = []
        # 遍历每一列数据
        for j in range(0, worksheet.ncols):
            # 将行数据存储到da列表
            da.append(worksheet.cell_value(i, j))
        # 存储每一行数据
        data.append(da)
    # 返回数据
    return data


def write_xls_excel(url, sheet_name, two_dimensional_data):
    '''
    写入xls格式文件
    参数：
        url:文件路径
        sheet_name:表名
        two_dimensional_data：将要写入表格的数据（二维列表）
    '''
    # 创建工作簿对象
    workbook = xlwt.Workbook()
    # 创建工作表对象
    sheet = workbook.add_sheet(sheet_name)
    # 遍历每一行数据
    for i in range(0, len(two_dimensional_data)):
        # 遍历每一列数据
        for j in range(0, len(two_dimensional_data[i])):
            # 写入数据
            sheet.write(i, j, two_dimensional_data[i][j])
    # 保存
    workbook.save(url)
    print("写入成功")


def write_xls_excel_add(url, two_dimensional_data, index):
    '''
    追加写入xls格式文件
    参数：
        url:文件路径
        two_dimensional_data：将要写入表格的数据（二维列表）
        index：指定要追加的表的序号（第几个工作表，传入参数从1开始数）
    '''
    # 打开指定的工作簿
    workbook = xlrd.open_workbook(url)
    # 获取工作簿中的所有表格
    sheets = workbook.sheet_names()
    # 获取指定的表
    worksheet = workbook.sheet_by_name(sheets[index-1])
    # 获取表格中已存在的数据的行数
    rows_old = worksheet.nrows

    # 将xlrd对象拷贝转化为xlwt对象
    new_workbook = copy(workbook)
    # 获取转化后工作簿中的第index个表格
    new_worksheet = new_workbook.get_sheet(index-1)
    # 遍历每一行数据
    for i in range(0, len(two_dimensional_data)):
        # 遍历每一列数据
        for j in range(0, len(two_dimensional_data[i])):
            # 追加写入数据，注意是从i+rows_old行开始写入
            new_worksheet.write(i+rows_old, j, two_dimensional_data[i][j])
    # 保存工作簿
    new_workbook.save(url)
    print("追加写入成功")


if __name__ == '__main__':
    # data = read_xls_excel("/Users/linyiting/Desktop/测试excel文件xls.xls", 2)
    # print(data)

    # write_xls_excel(
    #     url="/Users/linyiting/Desktop/测试excel文件xls.xls",
    #     sheet_name="Sheet2",
    #     two_dimensional_data=[["id", "title", "type", "num"], ["1", "战争与和平33", "文学", "100"]])

    write_xls_excel_add(
        url="/Users/linyiting/Desktop/测试excel文件xls.xls",
        two_dimensional_data=[["id", "title", "type", "num"], ["1", "战争与和平", "文学", "100"]],
        index=1)
    pass

3、处理xlsx格式脚本

（1）安装依赖

pip install openpyxl

（2）python处理脚本

import openpyxl


# 2.2.1. 读取xlsx格式文件
def read_xlsx_excel(url, sheet_name):
    '''
    读取xlsx格式文件
    参数：
        url:文件路径
        sheet_name:表名
    返回：
        data:表格中的数据
    '''
    # 使用openpyxl加载指定路径的Excel文件并得到对应的workbook对象
    workbook = openpyxl.load_workbook(url)
    # 根据指定表名获取表格并得到对应的sheet对象
    sheet = workbook[sheet_name]
    # 定义列表存储表格数据
    data = []
    # 遍历表格的每一行
    for row in sheet.rows:
        # 定义表格存储每一行数据
        da = []
        # 从每一行中遍历每一个单元格
        for cell in row:
            # 将行数据存储到da列表
            da.append(cell.value)
        # 存储每一行数据
        data.append(da)
    # 返回数据
    return data


# 2.2.2. 写入xlsx格式文件
def write_xlsx_excel(url, sheet_name, two_dimensional_data):
    '''
    写入xlsx格式文件
    参数：
        url:文件路径
        sheet_name:表名
        two_dimensional_data：将要写入表格的数据（二维列表）
    '''
    # 创建工作簿对象
    workbook = openpyxl.Workbook()
    # 创建工作表对象
    sheet = workbook.active
    # 设置该工作表的名字
    sheet.title = sheet_name
    # 遍历表格的每一行
    for i in range(0, len(two_dimensional_data)):
        # 遍历表格的每一列
        for j in range(0, len(two_dimensional_data[i])):
            # 写入数据（注意openpyxl的行和列是从1开始的，和我们平时的认知是一样的）
            sheet.cell(row=i + 1, column=j + 1, value=str(two_dimensional_data[i][j]))
    # 保存到指定位置
    workbook.save(url)
    print("写入成功")


# 2.2.3. 追加写入xlsx格式文件
def write_xlsx_excel_add(url, sheet_name, two_dimensional_data):
    '''
    追加写入xlsx格式文件
    参数：
        url:文件路径
        sheet_name:表名
        two_dimensional_data：将要写入表格的数据（二维列表）
    '''
    # 使用openpyxl加载指定路径的Excel文件并得到对应的workbook对象
    workbook = openpyxl.load_workbook(url)
    # 根据指定表名获取表格并得到对应的sheet对象
    sheet = workbook[sheet_name]
    for tdd in two_dimensional_data:
        sheet.append(tdd)
    # 保存到指定位置
    workbook.save(url)
    print("追加写入成功")


if __name__ == '__main__':
    # data = read_xlsx_excel(
    #     url='/Users/linyiting/Desktop/副本提案软件需求文案0906-测试.xlsx',
    #     sheet_name='空间配置建议文案'
    # )
    # print(data)

    write_xlsx_excel_add(
        url='/Users/linyiting/Desktop/副本提案软件需求文案0906-测试.xlsx',
        sheet_name='冰山模型文案',
        two_dimensional_data=[["id", "title", "type", "num"], ["1", "战争与和平", "文学", "100"]]
    )
    pass

五、总结

也没啥可总结的, 文件的IO处理，现成可用，可直接用在项目上，提高效率

posted @ 2022-11-16 14:31 Wolf_Stark 阅读(3148) 评论(0) 收藏举报

刷新页面返回顶部

Wolf_Stark

python处理excel文件(xls格式和xlsx格式)

公告