要养家的程序猿

2025年4月14日

摘要：引子语言是离散的，所以适合用自回归模型来生成；而图像是连续的，所以适合用扩散模型来生成。在生成模型发展早期，这种刻板印象广泛存在于很多研究者的脑海中。写了那么多主流自回归的大模型部署文档，刚巧碰到这篇反其道而行的基于扩散模型的大模型。挺有意思，OK，那就让我们开始吧。一、模型介绍最近，更多的研阅读全文

posted @ 2025-04-14 09:08 要养家的程序猿阅读(187) 评论(0) 推荐(0)

2025年4月7日

阿里QWQ-32B环境搭建&推理测试

摘要：引子当政企都在热衷于本地部署满血DeepSeek-R1，阿里重磅开源了 QwQ。当大部分人玩不起 671B 的满血，32B 的 QwQ 已让全球开发者陷入狂欢。消费级显卡就能跑，堪称推理模型天花板！QwQ 的评价之所以这么高，主要基于两点：效果比肩满血DeepSeek-R1；仅用 32B 参数，阅读全文

posted @ 2025-04-07 09:55 要养家的程序猿阅读(221) 评论(0) 推荐(0)

2025年3月31日

通义万相环境搭建&推理测试

摘要：引子 2月25日，阿里云旗下视觉生成基座模型万相 2.1（Wan）重磅开源，此次开源采用最宽松的 Apache2.0 协议，14B 和 1.3B 两个参数规格的全部推理代码和权重全部开源，同时支持文生视频和图生视频任务。ds的火热，都快把这则消息掩盖了。作为长期关注大模型，多模态的blogger，我阅读全文

posted @ 2025-03-31 10:18 要养家的程序猿阅读(313) 评论(0) 推荐(0)

2025年3月25日

VLM-R1环境搭建&推理测试

摘要：引子前文也写了DeepSeek R1模型的安装测试，感兴趣的童鞋移步（https://blog.csdn.net/zzq1989_/article/details/145400876?spm=1001.2014.3001.5502）。那么在多模态方面R1方法（GRPO，Group Relative 阅读全文

posted @ 2025-03-25 15:56 要养家的程序猿阅读(535) 评论(0) 推荐(0)

2025年3月17日

Qwen2-VL华为卡300i duo环境搭建&推理测试

摘要：引子前面也写过华为300i duo DeepSeek的环境搭建&推理测试，感兴趣的同事请移步（https://blog.csdn.net/zzq1989_/article/details/146149684?spm=1001.2014.3001.5501）。多模态华为卡的适配倒是一直没有出过相关的阅读全文

posted @ 2025-03-17 11:56 要养家的程序猿阅读(1104) 评论(0) 推荐(0)

2025年3月10日

DeepSeek-R1华为卡300i Duo环境搭建&推理测试

摘要：引子前文已经写了不少DeepSeek相关的文章，感兴趣的童鞋可以移步（https://blog.csdn.net/zzq1989_/article/details/145400876?spm=1001.2014.3001.5502，https://blog.csdn.net/zzq1989_/ar 阅读全文

posted @ 2025-03-10 11:54 要养家的程序猿阅读(995) 评论(2) 推荐(0)

2025年3月3日

YOLOv12环境搭建&推理测试

摘要：引子 2025年2月18日，YOLOv 12横空出世，我记得上次YOLO发布还是上次（哈哈！）。几个月前YOLOv11发布（感兴趣的童鞋可以移步https://blog.csdn.net/zzq1989_/article/details/143104284?spm=1001.2014.3001.55 阅读全文

posted @ 2025-03-03 09:28 要养家的程序猿阅读(1036) 评论(0) 推荐(0)

2025年2月24日

Sa2VA环境搭建&推理测试

摘要：引子 Sa2VA模型通过结合SAM-2和LLaVA，将文本、图像和视频统一到共享的LLM标记空间中，能够在少量指令微调下执行多种任务，如图像/视频对话、指称分割和字幕生成。该模型在视频编辑和内容创作中展现出强大的性能，在相关基准任务中达到了SOTA水平。OK，那就让我们开始吧。一、模型介绍 Sa2 阅读全文

posted @ 2025-02-24 14:50 要养家的程序猿阅读(227) 评论(0) 推荐(0)

2025年2月17日

基于Ollama的win10环境下DeepSeek安装测试

摘要：引子之前一篇blog介绍了如何安装DeepSeek，感兴趣的童鞋请移步（https://blog.csdn.net/zzq1989_/article/details/145400876?spm=1001.2014.3001.5502）。那篇blog是根据DeepSeek官网安装步骤，只能通过API 阅读全文

posted @ 2025-02-17 09:12 要养家的程序猿阅读(377) 评论(0) 推荐(0)

2025年2月10日

DeepSeek-Janus-Pro环境搭建&推理测试

摘要：引子北京时间1月28日凌晨，近期爆红的国产大模型DeepSeek在GitHub平台发布了Janus-Pro多模态大模型，这是继Janus发布之后的一次较大幅度升级。该款大模型是2024年11月13日发布的JanusFlow大模型的高级版本。相比前一代模型，Janus-Pro优化了训练策略、扩展了训阅读全文

posted @ 2025-02-10 09:14 要养家的程序猿阅读(607) 评论(0) 推荐(0)

nick-algorithmer

公告