ocean1ee

导航

2025年4月30日 #

单一场景对比 Qwen2.5 / DeepSeek-R1-Distill-Qwen / Qwen3 小模型

摘要: 一、新模型探索:Qwen3 近日,Qwen家族公布Qwen 3 系列 新的模型。本文将对比“Qwen家族”的小模型,测试单一场景,初步感受一下Qwen 3 的提升。 模型 备注 Qwen 2.5 qwen2.5-0.5b-instruct-q8_0.gguf Qwen 3 Qwen_Qwen3-0. 阅读全文

posted @ 2025-04-30 00:14 ocean1ee 阅读(685) 评论(0) 推荐(0)

2025年4月26日 #

初浅感受 gemma 3 QAT / granite-3.3 / BitNet 小模型

摘要: 一、新模型探索:Gemma-3-1B-It-QAT & BitNet b1.58 2B4T & Granite 3.3 最近,Google、Microsoft 以及 IBM 都公布新的模型。本文将对这三款的小模型版本进行初步体验,并结合个人使用场景,并给出粗略的评估。 模型 备注 Google ge 阅读全文

posted @ 2025-04-26 21:06 ocean1ee 阅读(251) 评论(0) 推荐(0)