会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
wangssd
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
9
···
31
下一页
2025年9月26日
docker 镜像/容器
摘要: 根据镜像启动容器,并进入容器: docker run -it --privileged --entrypoint bash 镜像名 # 如果镜像已经存在,直接启动 docker run -d --name flask_container -p 5000:5000 flask_app:v1 flask
阅读全文
posted @ 2025-09-26 14:28 wangssd
阅读(35)
评论(0)
推荐(0)
2025年9月25日
docker 制作/运行
摘要: conda环境导出 conda env export --no-builds > environment.yml 使用 --no-builds 参数(推荐) 会忽略包的构建信息(包括平台标识),只保留包名和版本号 使用专门的包扫描工具 pipreqs(推荐):扫描指定目录下的文件都导入了哪些包,存入
阅读全文
posted @ 2025-09-25 17:40 wangssd
阅读(19)
评论(0)
推荐(0)
dockerfile 常用命令
摘要: 导出所有包到 requirements.txt # 导出当前环境的所有包(包含版本号) conda list --export > requirements.txt # 或者使用pip格式导出(推荐用于跨平台) pip list --format=freeze > requirements.txt#
阅读全文
posted @ 2025-09-25 14:23 wangssd
阅读(9)
评论(0)
推荐(0)
时序大模型/时序小模型
摘要: 时序大模型和时序小模型的核心区别在于模型复杂度、数据需求、能力范围和应用场景。 静态特征:不随时间变化而变化的特征,如店铺名称 动态特征:随时间变化而变化的特征,如天气、温度 核心区别一览表 特征维度时序大模型时序小模型 核心思想 预训练 + 微调。在海量、多领域的时序数据上训练一个通用基础模型,然
阅读全文
posted @ 2025-09-25 11:08 wangssd
阅读(207)
评论(0)
推荐(0)
docker/docker compose/k8s
摘要: Docker、Docker Compose 和 Kubernetes(K8s)是现代容器化技术的核心组成部分,但它们扮演着不同的角色。 简单来说: Docker:用来创建和运行单个容器的工具。 Docker Compose:用来定义和运行多个相互依赖的容器的工具。 Kubernetes (K8s):
阅读全文
posted @ 2025-09-25 10:37 wangssd
阅读(68)
评论(0)
推荐(0)
2025年9月24日
自动构建高质量测试集
摘要: 基于文档自动生成 QA 对(文档 - 问题 - 答案三元组)是构建高质量测试集、知识库评估或模型微调数据的核心方法,其核心流程围绕 “文档采样→内容解析→LLM 生成→质量过滤→格式输出” 展开。 一、核心目标与前置准备 在启动前需明确目标,避免后续流程偏离需求: 核心目标:生成 “高质量” QA
阅读全文
posted @ 2025-09-24 11:01 wangssd
阅读(71)
评论(0)
推荐(0)
大模型评估方法-微调模型/评估性能
摘要: 1. 检索质量评估 通常在开发/验证集上进行。 命中率:对于一个问题,系统是否至少检索到了一个相关文档?这是一个二元指标(是/否)。它衡量了检索的召回能力。 平均精度@K:这是信息检索中的核心指标。它衡量在前K个检索结果中,相关文档的比例和排名位置。例如,MRR@5 表示前5个结果中,第一个相关文档
阅读全文
posted @ 2025-09-24 10:38 wangssd
阅读(48)
评论(0)
推荐(0)
BM25 关键词检索算法
摘要: BM25 BM25,全称是 Best Matching 25,是一种用于信息检索的排名函数。它用来计算一个查询(Query)与一组文档(Documents)的相关性得分,并按照得分从高到低对文档进行排序。 简单来说,它的核心任务是:给定一个用户搜索词(如“苹果手机”),从海量文档中找出最相关的文档,
阅读全文
posted @ 2025-09-24 10:25 wangssd
阅读(321)
评论(0)
推荐(0)
2025年9月23日
paddleOCR 图片识别
摘要: PaddleOCR 中,det、rec、cls 分别代表 OCR 流水线中的三个关键模块。 1. det - 文本检测(Text Detection) 功能 定位:在图像中找出文本所在的位置 边界框:为每个文本区域生成边界框 文本行检测:检测文本行或单词的位置 from paddleocr impo
阅读全文
posted @ 2025-09-23 17:00 wangssd
阅读(226)
评论(0)
推荐(0)
2025年9月22日
docker 常用命令与端口映射
摘要: 搜索镜像:从 Docker Hub 查找镜像 docker search <镜像名称> # 例如:docker search nginx 拉取镜像:从仓库下载镜像到本地 docker pull <镜像名称:标签> # 例如:docker pull nginx:latest # 如果不写标签,默认拉取
阅读全文
posted @ 2025-09-22 17:39 wangssd
阅读(113)
评论(0)
推荐(0)
上一页
1
2
3
4
5
6
7
8
9
···
31
下一页
公告