摘要:
给排版软件typst添加导出字符级标签功能.typst_plus 是基于上游 Typst 编译器的扩展分支, 新增图片导出增强和字符级标注两大功能。图片导出方面,在原有 PNG 基础上新增 JPEG 和 BMP 格式,支持通过 `--ppi`/`--dpi` 参数控制分辨率,并能根据文件扩展名自动识别输出格式。字符级标注方面,通过 `--label-json` 可生成 X-AnyLabeling 格式的 JSON 文件,包含逐字符定向边界框信息(`shape_type` 固定为 `"rotation"`,`points` 为左上→右上→右下→左下的四顶点像素坐标,`direction` 固定为 0,`imageData` 采用 Base64 内嵌光栅图片),同时 `--label-viz` 可生成带红色定向边界框叠加的可视化图片,且完整支持 Typst 帧树中的旋转、缩放等任意几何变换,适用于 OCR 训练数据合成、文档理解模型标注等场景。 阅读全文
给排版软件typst添加导出字符级标签功能.typst_plus 是基于上游 Typst 编译器的扩展分支, 新增图片导出增强和字符级标注两大功能。图片导出方面,在原有 PNG 基础上新增 JPEG 和 BMP 格式,支持通过 `--ppi`/`--dpi` 参数控制分辨率,并能根据文件扩展名自动识别输出格式。字符级标注方面,通过 `--label-json` 可生成 X-AnyLabeling 格式的 JSON 文件,包含逐字符定向边界框信息(`shape_type` 固定为 `"rotation"`,`points` 为左上→右上→右下→左下的四顶点像素坐标,`direction` 固定为 0,`imageData` 采用 Base64 内嵌光栅图片),同时 `--label-viz` 可生成带红色定向边界框叠加的可视化图片,且完整支持 Typst 帧树中的旋转、缩放等任意几何变换,适用于 OCR 训练数据合成、文档理解模型标注等场景。 阅读全文
posted @ 2026-05-21 11:41
qsBye
阅读(5)
评论(0)
推荐(0)

仅使用go语言标准库, 将xml文件转为xlsx2007格式.
使用latex(精确排版), opencv(连通域检测)和pillow(数据扰动)批量合成xanylabeling格式的字符级分割标注数据(带字符级边界框标注)的合成数据用于训练字符级分割模型.
在macOS上使用kimi-cli的plot-skill技能,通过D2和Python matplotlib创建科研/技术图表,采用统一的马卡龙配色方案和奶油色背景.
在macOS上配置kimi-cli通过matrix-cli技能发送消息和文件到Matrix聊天房间.
浙公网安备 33010602011771号