LLM - 随笔分类 - Python喵

显卡驱动安装与内核降级

摘要：Ubuntu 24.04 安装 NVIDIA GRID 驱动完整流程（Kernel 6.5 + GRID 570）一、安装 Mainline Kernel Installer（安装 6.5 内核） 1 添加 PPA sudo add-apt-repository ppa:cappelikan/p 阅读全文

posted @ 2026-03-10 16:21 Python喵阅读(3) 评论(0) 推荐(0)

多模态识别

摘要：多模态识别的本质不是“先把字读出来”，而是：先把图像分块 → 映射成向量 → 与语言/语义空间对齐 → 判断“这张图在表达什么” 它的能力边界有限因为它根本不是在“读字” 多模态识别 = 模型不是“先读字”，而是“一边看图，一边理解这图里在说什么”。它做的不是 OCR → 文本，而是阅读全文

posted @ 2026-01-04 18:40 Python喵阅读(9) 评论(0) 推荐(0)

局部视觉语言模型（VLMs）中的结构化输出

摘要：通过使用结构化输出，你可以将提示词转化为干净、易于维护的代码，同时利用 Pydantic 强大的验证功能。这种方法为构建 RAG 应用、错误管理以及实现 LLM 优雅重试机制提供了坚实基础。 from mlx_vlm import load, apply_chat_template, generat 阅读全文

posted @ 2026-01-04 14:20 Python喵阅读(9) 评论(0) 推荐(0)

clark1990

随笔分类 - LLM

公告