05 2025 档案

摘要:引子 前文写到RagFlow的环境搭建&推理测试,感兴趣的童鞋可以移步(https://blog.csdn.net/zzq1989_/article/details/148055465)。RagFlow相对于其他Rag开源项目,比如说MaxKB,Dify项目部署较为复杂。很多读者私信说我写了那么多环 阅读全文
posted @ 2025-05-27 13:22 要养家的程序猿 阅读(2548) 评论(0) 推荐(0)
摘要:引子 去年12月写了一篇DIfy的博客,感兴趣的童鞋可以移步(https://blog.csdn.net/zzq1989_/article/details/144657580)。Dify对企业级的应用不是太友好。最近有个RAG的项目需求,又重新好好调研了下这个问题,发现RagFlow这个项目还是很活 阅读全文
posted @ 2025-05-19 09:20 要养家的程序猿 阅读(700) 评论(0) 推荐(0)
摘要:引子 很少关注大模型压缩这个领域,碰巧碰上了,那就来吧。为了应对 LLM 不断增长的模型尺寸,通常会采用量化技术,将高精度权重转换为低位表示。这显著减少了内存占用和计算需求,有助于在资源受限的环境中实现更快的推理和部署。然而,量化本质上是一种有损压缩技术,引入了一个基本缺点:它不可避免地改变了 LL 阅读全文
posted @ 2025-05-12 09:10 要养家的程序猿 阅读(100) 评论(0) 推荐(0)
摘要:引子 2025年4月29日,阿里推出Qwen3, 模型依旧采用宽松的 Apache2.0 协议开源,全球开发者、研究机构和企业均可免费在 HuggingFace、魔搭社区等平台下载模型并商用,也可以通过阿里云百炼调用 Qwen3 的 API 服务,具体来讲,Qwen3 系列模型包含两款 MoE 模型 阅读全文
posted @ 2025-05-06 10:08 要养家的程序猿 阅读(902) 评论(0) 推荐(0)