会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
rolandhe
博客园
首页
新随笔
联系
订阅
管理
2026年4月22日
OCR模型在Mac Apple Silion上本地部署
摘要: Apple Silicon Mac 本地部署 OCR 模型实战笔记 适用环境:macOS + Apple Silicon(M1/M2/M3/M4) 覆盖模型:PaddleOCR-VL、GLM-OCR、DeepSeek-OCR 最后更新:基于本地实测验证 目录 0. 基础概念速查 1. PaddleO
阅读全文
posted @ 2026-04-22 19:54 RolandHe
阅读(218)
评论(0)
推荐(0)
2026年4月20日
大模型推理引擎
摘要: 先建立一个分类框架 推理工具可以按两个维度来区分: 维度 1:抽象层次(从低到高) 推理引擎(Inference Engine):直接执行模型 forward pass,管显存、KV cache、算子调度 推理服务器(Inference Server):包装引擎 + 提供 HTTP API、批处理、
阅读全文
posted @ 2026-04-20 18:09 RolandHe
阅读(84)
评论(0)
推荐(0)
2026年4月15日
OCR服务价格
摘要: 百度智能文档解析,含大模型版
阅读全文
posted @ 2026-04-15 20:34 RolandHe
阅读(3)
评论(0)
推荐(0)
2026年4月12日
Agent框架
摘要: hermes agent:最新的比较热门的Agent框架,号称Agent会随着你的使用而成长。 应该是实现了长期记忆及自动生成skill。 LangChain: 有点过时了,总更新。 LangGraph: 与langchain同源,但能实现智能体编排,目前算是比较值得学习的。 LlamaIndex:
阅读全文
posted @ 2026-04-12 22:53 RolandHe
阅读(52)
评论(0)
推荐(0)
模型服务商
摘要: 目前几大云平台都提供模型接入服务,不光是自家的模型,也提供其他厂商的模型。 AWS Bedrock: 提供Anthropic等很多模型服务API,但目前没有OpenAI模型和Gemini。 Vertex AI: 提供自家的Gemini及Anthropic模型,但没有OpenAI的模型。 Azure
阅读全文
posted @ 2026-04-12 22:32 RolandHe
阅读(59)
评论(0)
推荐(0)
2025年12月10日
多模态模型图片换算tokens规则
摘要: qwen系统vl模型换算规则: 计算公式:图像Token = h_bar * w_bar / token_pixels + 2 h_bar、w_bar:缩放后的图像长宽,模型在处理图像前会进行预处理,会将图像缩小至特定像素上限内,像素上限与max_pixels和vl_high_resolution_
阅读全文
posted @ 2025-12-10 09:52 RolandHe
阅读(599)
评论(0)
推荐(0)
2025年12月7日
pdf图片处理
摘要: 将pdf中的一页另存为图片 在使用pymupdf时,获取到page对象后,使用page.get_pixmap(dpi=500) 这个方法可以将整页保存为图像。但这里有两种方式,一种是使用dpi参数,这个是代表在一英寸里要包含多少个像素,设置越大,图像的像素就越高,相对应的文件也会越大。 而pdf文件
阅读全文
posted @ 2025-12-07 19:43 RolandHe
阅读(65)
评论(0)
推荐(0)
图像基础核心知识体系
摘要: 一、 图像基础核心知识体系 1. 像素与分辨率 像素:图像的最小单位,一个带有颜色信息的小方点。像素大小通常指图像的总像素数量(宽×高),如 1920×1080(约207万像素)。 分辨率:有两个常见但易混的概念: 图像分辨率:指图像本身包含的像素总数(如 1920×1080)。这是决定图像精细度的
阅读全文
posted @ 2025-12-07 19:33 RolandHe
阅读(136)
评论(0)
推荐(0)
2025年12月4日
开源下载工具aria2
摘要: aria2 是一款开源下载工具,具说一些商业下载工具内部也会用到它。 这款工具是命令行的,但也人基于它做了一些UI,需要开启它 rpc功能然后配合一款UI就能通过页面操作它。 可以像下面这样在命令行里直接输入命令,设置一些选项 aria2c --input-file=/Users/roland/no
阅读全文
posted @ 2025-12-04 08:36 RolandHe
阅读(48)
评论(0)
推荐(0)
2025年12月3日
homebrew运行机制
摘要: 🍺 Homebrew 的结构 = 一个“酿酒厂” 以下是核心概念的真实意义 + 隐喻意义: 1. Formula(配方) 真实意义: Homebrew 安装“源码软件”的脚本,描述软件从哪里下载、如何编译、有哪些依赖等。 隐喻: 👉 配方:告诉酿酒师(brew)如何酿酒(软件)。 2. Cask
阅读全文
posted @ 2025-12-03 22:17 RolandHe
阅读(251)
评论(0)
推荐(0)
下一页
公告