摘要: o小数据集(<10k样本):3-10个epocho中等数据集(10k-100k样本):2-5个epocho大数据集(>100k样本):1-3个epoch 加验证集(val_size=0.1)实时监测 3.如何评估结果?①缺乏验证集本次前期整体微调中缺乏验证集,无法生成验证集评估。这意味着:无法判断模 阅读全文
posted @ 2025-12-27 22:34 hrdom 阅读(21) 评论(0) 推荐(0)
摘要: gpt-5-mini $0.25 $0.025 $2.00 Prices per 1M tokens. siliconflow的DeepSeek-V3.2 输入:¥2/ M Tokens 输出:¥3/ M Tokens(实际上还可以打5折) 从排行榜来看,https://lmarena.ai/lea 阅读全文
posted @ 2025-12-27 06:14 hrdom 阅读(7) 评论(0) 推荐(0)