2025 年 7月 28 日随笔档案 - limingqi

数据分布差异鉴定指南

摘要：分析两个数据集（如 HelpSteer2 和 StackExchange）的分布差异性，需要从多个维度系统拆解它们在数据特征、内容属性、结构模式等方面的不同。一、基本统计特征分布从最基础的数值特征入手，反映数据集的 “规模” 和 “形态” 差异：样本数量与规模分布总样本量：两个数据集的样本总阅读全文

posted @ 2025-07-28 15:42 limingqi 阅读(146) 评论(0) 推荐(0)

模型“瘦身术”——模型量化

摘要：一、什么是模型量化？模型量化的核心是将模型中高精度的参数（如 32 位浮点数，FP32）转换为低精度格式（如 16 位浮点数 FP16、8 位整数 INT8，甚至 4 位 INT4、2 位 INT2 等）。高精度参数虽能保证模型精度，但占用内存 / 显存大、计算耗时，尤其在边缘设备（如手机、嵌入阅读全文

posted @ 2025-07-28 14:06 limingqi 阅读(210) 评论(0) 推荐(0)

3分钟看懂模型好坏，关键评估指标干货速递

摘要：评估模型性能需要结合模型类型（如分类 / 回归模型、生成式模型、大语言模型等）和业务目标（如准确率、效率、安全性等），选择针对性的指标。以下是不同场景下的核心评估指标，涵盖主流模型类型：一、传统机器学习模型（分类 / 回归 / 聚类） 1. 分类模型（如图像识别、垃圾邮件检测）核心指标：准确率阅读全文

posted @ 2025-07-28 10:51 limingqi 阅读(577) 评论(0) 推荐(0)

数据分布差异鉴定指南

模型“瘦身术”——模型量化

3分钟看懂模型好坏，关键评估指标干货速递

导航

公告