摘要: 一、思路 1. 入口→分发:extractFromWord 是总入口,核心是 “格式分发”,将.doc 和.docx 分流到不同处理逻辑; 2. .doc 核心:绕开路径解析,用 “逐层遍历 + 兜底读取” 确保文件能读到,再交给extractFromOLE解析; 3. .docx 核心:直接遍历 阅读全文
posted @ 2025-11-05 10:01 ChMao 阅读(51) 评论(0) 推荐(0)