git删除历史仓库部分内容;pydantic库用途;大模型llama学习;ollama模型调用(任务配置中心扩展)

1.git删除历史仓库部分内容
👉之前需要使用orc对pdf进行文档转换文字,将mark-pdf模型下载下载到项目路径下。
👉进行git提交时,不小心将整个模型文件都提交给git,使git仓库十分臃肿,不能推送到github。
解决方法如下:
👉先在 .gitignore 中添加:
/marker_model
整个模型文件都忽略,避免以后再次提交。
接下来是模型文件提交的历史仓库问题。
👉尝试Git索引中移除

# 1. 从 Git 索引移除,但保留本地文件
git rm -r --cached marker_model
# 2. 提交更改
git commit -m "Remove marker_model from Git"
# 3. 推送到远程
git push

但这没有根本解决git历史仓库十分臃肿,不能推送到github的问题,--cached:只从 Git 跟踪中移除,不删除本地文件。

👉尝试彻底从 Git 历史中删除(减小仓库体积)

# 安装 git-filter-repo,如果没安装
pip install git-filter-repo

# 清理 marker_model 文件夹及历史记录
git filter-repo --path marker_model --invert-paths

# 然后强制推送到远程
git push origin --force

通过git-filter-repo删除marker_model,彻底解决了git历史仓库臃肿问题。

2.pydantic库
Pydantic 是一个用来「定义数据结构 + 自动校验 + 自动解析」的 Python 库,特别适合 API、配置、结构化数据、LLM 输出约束。
✅ 1️⃣ 数据校验(Validation)
✅ 2️⃣ 数据解析(Parsing)
✅ 3️⃣ Schema 定义(最关键)
Pydantic在LLM提取字段中的作用:
✔️ Schema 即 Prompt
✔️ Field.description 即抽取提示
✔️ docstring 即任务说明
✔️ 校验 LLM 输出是否合法

3.大模型llama学习
1️⃣ 纯文本输入模型(Text-only LLM)
2️⃣ 多模态输入模型(Multimodal LLM / VLM)
当你的输入已经是“干净文本”时:纯文本模型更稳、更准、更省

能力 纯文本模型 多模态模型
读文本 ⭐⭐⭐⭐ ⭐⭐⭐⭐
理解图片
OCR ⚠️(能做但不专业)
结构化抽取 ⭐⭐⭐⭐ ⭐⭐⭐
JSON 稳定性 ⭐⭐⭐⭐ ⭐⭐⭐
推理速度
显存占用
部署复杂度

目前识别PDF文档,最好的选择就是OCR👉转文字👉纯文本模型推理出结构化输出。

目前非常厉害的是llama纯文本模型,但对于中文的支持度较低,主要基于英文训练。
Meta 发布的官方版本(如 Llama 3/3.1/3.2)主要针对英语优化。

4.ollama模型调用(任务配置中心扩展)
👉之前使用的是从接口传入需要调用的模型,作为字符串输入到ollama调用。
👉但dify服务器十分卡顿,非常不方便,就写了个任务配置中心扩展。
👉将ollama的模型选择,配入任务配置中心扩展。

┌────────────┐
│   Schema   │  ← 只定义:字段 + 语义 + 约束
└────────────┘
        ↓
┌──────────────────┐
│ Schema Registry   │  ← 任务配置中心(⭐关键)
│  - 用哪个模型     │
│  - temperature   │
│  - max_tokens    │
│  - prompt策略    │
└──────────────────┘
        ↓
┌──────────────────┐
│ Prompt Builder    │  ← 统一拼 prompt
└──────────────────┘
        ↓
┌──────────────────┐
│   LLM Runner      │  ← Ollama / OpenAI
└──────────────────┘
posted @ 2026-01-23 11:55  asphyxiasea  阅读(3)  评论(0)    收藏  举报