AI算力小知识 - 博客园

2025年12月

摘要：

使用ComfyUI的Wan2.2文生视频工作流比较A100和4090 48G两张显卡的性能，得益于两张显卡都有比较充足的显存，显存占用比4090 24G有明显提升；显卡资源占用方面，4090 48G有更富足的显存空间，平均占用在38G显存，A100平均显存占用32G，GPU利用率4090 48G也高于A100，这个场景下4090 48G的算力使用更为充沛。生成5s视频，A100平均耗时在53秒左右，4090 48G的平均耗时在50秒左右，4090 48G在文生视频场景的性能略好于是A100。阅读全文

posted @ 2025-12-02 15:04 AI算力小知识阅读(81) 评论(0) 推荐(0)

2025年11月

vLLM实测大模型多卡推理场景显卡性能表现

摘要：

使用vLLM测试下多卡推理场景下3090和4090两张显卡的性能表现，看下4090是否在多卡高并发场景下更加具备性能优势。选择 Qwen3的模型进行测试，考虑到是两张显卡，每张都是24GB的显存，选择的是FP16精度的qwen3:14B模型进行测试。3090显卡和4090显卡在多卡模型推理过程中的显存和GPU使用率都比较接近，主要看平均耗时及平均吞吐量两个指标。阅读全文

posted @ 2025-11-26 17:08 AI算力小知识阅读(161) 评论(0) 推荐(0)

模型训练场景实测5090和4090的算力比较

摘要：

测试下英伟达这款最新的消费级旗舰和上一代RTX 4090在模型训练场景下性能差异多大？5090的32G的容量比4090增加8G，显存带宽有大幅的提升，5090的算力比4090提升近30%。基于Pytorch框架来训练ResNet-50模型，使用CIFAR-10数据集进行模型训练场景的实测。阅读全文

posted @ 2025-11-18 16:37 AI算力小知识阅读(612) 评论(0) 推荐(0)

基于ComfyUI的Wan2.2文生视频显卡性能实测

摘要：

我们就基于ComfyUI的预置工作流模板来测试Wan2.2的模型在3090和4090两张显卡下文生视频的效率。我们写一个Python脚本来调用ComfyUI的API，通过工作流自动生成视频，并通过多次调用取平均的方式来统计比较3090和4090执行性能的差异，以及对显卡资源的占用情况。阅读全文

posted @ 2025-11-13 15:14 AI算力小知识阅读(494) 评论(0) 推荐(0)

使用vLLM实测3090和4090的大模型推理性能

摘要：

使用`vLLM`测试下大模型并发推理场景下3090和4090两张显卡的性能表现，看下4090是否在高并发场景下具备更高的扩展性。 3090显卡和4090显卡在模型推理过程中的显存和GPU使用率都比较接近，1～8并发度场景下，3090和4090的推理性能均保持稳定；在16并发度下3090开始遇到性能瓶颈，而4090显然较3090有更充足的剩余性能空间。阅读全文

posted @ 2025-11-06 19:23 AI算力小知识阅读(210) 评论(0) 推荐(0)

Ollama和vLLM大模型推理性能对比实测

摘要：

在部署大模型推理服务的时候，Ollama和vLLM是目前最常见的两个大模型部署工具，这里选择英伟达的RTX 3090比较Ollama和vLLM这两个工具在大语言模型推理场景下性能表现，使用Qwen3模型、控制同样的API推理参数，测试并发调用下的性能表现，来看看Ollama和vLLM分别适用于什么场景？阅读全文

posted @ 2025-11-05 11:35 AI算力小知识阅读(135) 评论(0) 推荐(0)

2025年10月

3080 20G和3090在大模型推理场景的性能比较

摘要：

使用Ollama部署Qwen3模型进行推理场景的性能实测，比较3080 20G和3090 24G的差异到底多大？ RTX 3080 20G显卡是基于3080 10G魔改的卡，目前市面比较多得被用于小规模参数的大语言模型推理场景，被认为是性价比比3090还高的推理显卡。对比显卡参数，3080 20G在核心数量、显存、带宽、算力方面基本都是3090 24G的83%左右。阅读全文

posted @ 2025-10-31 17:55 AI算力小知识阅读(307) 评论(0) 推荐(0)

Ollama大模型推理场景下3090和4090性能实测

摘要：

使用Ollama的快速模型部署，来实测英伟达的RTX 3090和RTX 4090这两张显卡，在大语言模型推理场景中的性能差异。选择 Qwen3的模型进行测试，考虑到显存都是24GB，分别选择一个FP16精度和一个Q4_K_M量化后的大模型进行测试。阅读全文

posted @ 2025-10-24 16:39 AI算力小知识阅读(197) 评论(0) 推荐(0)

基于ResNet-50模型训练场景下实测3090和4090的性能

摘要：

选择了英伟达的RTX 3090和RTX 4090两张显卡，在实际的深度学习场景进行性能实测，基于ResNet-50模型训练比较下被称为「上一代卡皇」的 3090 和「当前消费级主力」的 4090 的实际性能到底差多少？阅读全文

posted @ 2025-10-22 10:23 AI算力小知识阅读(366) 评论(0) 推荐(0)

显卡参数对算力性能的影响

摘要：

AI时代大模型的应用已经渗透到日常的角角落落，同时算力变成了普遍的需求，在购买显卡或者租用GPU云算力的时候，如何选择合适的显卡呢，需要关注哪些参数？本文以最常见的英伟达显卡为例，来说说显卡的各种参数是如何影响算力性能的。阅读全文

posted @ 2025-10-15 16:01 AI算力小知识阅读(238) 评论(0) 推荐(0)

公告