2025年7月28日

数据分布差异鉴定指南

摘要: 分析两个数据集(如 HelpSteer2 和 StackExchange)的分布差异性,需要从多个维度系统拆解它们在数据特征、内容属性、结构模式等方面的不同。 一、基本统计特征分布 从最基础的数值特征入手,反映数据集的 “规模” 和 “形态” 差异: 样本数量与规模分布 总样本量:两个数据集的样本总 阅读全文

posted @ 2025-07-28 15:42 limingqi 阅读(107) 评论(0) 推荐(0)

模型“瘦身术”——模型量化

摘要: 一、什么是模型量化? 模型量化的核心是将模型中高精度的参数(如 32 位浮点数,FP32)转换为低精度格式(如 16 位浮点数 FP16、8 位整数 INT8,甚至 4 位 INT4、2 位 INT2 等)。 高精度参数虽能保证模型精度,但占用内存 / 显存大、计算耗时,尤其在边缘设备(如手机、嵌入 阅读全文

posted @ 2025-07-28 14:06 limingqi 阅读(162) 评论(0) 推荐(0)

3分钟看懂模型好坏,关键评估指标干货速递

摘要: 评估模型性能需要结合模型类型(如分类 / 回归模型、生成式模型、大语言模型等)和业务目标(如准确率、效率、安全性等),选择针对性的指标。以下是不同场景下的核心评估指标,涵盖主流模型类型: 一、传统机器学习模型(分类 / 回归 / 聚类) 1. 分类模型(如图像识别、垃圾邮件检测) 核心指标: 准确率 阅读全文

posted @ 2025-07-28 10:51 limingqi 阅读(356) 评论(0) 推荐(0)

导航