Loading

半结构化数据表头解析vlm方案

走vlm需要将excel 转换成 pdf
存在一个问题:
当表头过长时,转换后会被分页

因此需要设置参数手动调整

解决方案:

  1. https://www.e-iceblue.com/Tutorials/Python/Spire.XLS-for-Python/Program-Guide/Conversion/Python-Convert-Excel-to-PDF.html
    但当前库没有mac版本

  2. 使用libreoffice 转换成html,再转换成pdf

posted @ 2025-10-29 10:10  踩坑大王  阅读(4)  评论(0)    收藏  举报