MarkItDown 是一个轻量级的 Python 实用程序,用于将各种文件转换为 Markdown,以便用于 LLM 和相关的文本分析流程。
https://github.com/microsoft/markitdown
python 环境
MarkItDown 需要 Python 3.10 或更高版本。
uv venv --python=3.12 .venv
source .venv/bin/activate
# NOTE: Be sure to use 'uv pip install' rather than just 'pip install' to install packages in this virtual environment
安装
git clone git@github.com:microsoft/markitdown.git
cd markitdown
pip install -e 'packages/markitdown[all]'
依赖安装:ffmpeg
brew install ffmpeg
# 验证安装版本
ffmpeg -version
使用
markitdown "./技术事故定级规范(2025年6月修订版).docx" > 1.md