随笔档案「2025年12月」 - AI算力小知识

摘要：

很多团队在算力租赁上花了高端 GPU 的钱，却只跑出不到 30% 的利用率。问题往往不在模型，而在选型、计费方式和调度策略。本文结合真实案例，梳理了算力租赁中最常见的三个坑，并给出碎片化计费、动态扩容和任务优先级管理等实用优化方法，帮助团队显著提升 GPU 利用率并降低成本。阅读全文

posted @ 2025-12-30 11:27 AI算力小知识阅读(24) 评论(0) 推荐(0)

魔改4090 48G显卡相比A100 40G在模型训练中性能如何

摘要：

魔改4090 48G是基于原先4090 24G显卡进行增加显存之后的市面上的改装卡，面市之后热度一直挺高的。其基于4090本身强大的算力，补充24G的显存短板，使其能对参数量更大的模型进行训练、微调和推理。这里就拿4090 48G对比算力和显存都相近的A100 40G，看看模型训练场景的性能差异。模型训练样本的吞吐速度比较：单精度训练A100 40G的样本吞吐速度是4090 48G的125%，半精度训练A100 40G的样本吞吐速度是4090 48G的105%。阅读全文

posted @ 2025-12-17 16:05 AI算力小知识阅读(291) 评论(0) 推荐(0)

测试不同显卡加速GROMACS分子动力学模拟计算的性能

摘要：

GPU算力资源在科研、密集计算等专业领域也发挥着至关重要的作用，这里测试下不同显卡在分子动力学模拟计算场景下的性能表现。比较3080、3090、4090三种不同算力的GPU对Gromacs加速的效果。测试结果显示：Gromacs非常依赖CPU，优先选择高性能的CPU，同时需要结合数据集的大小，配置更好的CPU及更多的CPU核数，才能体现出高性能GPU的算力。阅读全文

posted @ 2025-12-10 17:18 AI算力小知识阅读(184) 评论(0) 推荐(0)

ComfyUI的Wan2.2文生视频A100显卡性能表现

摘要：

使用ComfyUI的Wan2.2文生视频工作流比较A100和4090 48G两张显卡的性能，得益于两张显卡都有比较充足的显存，显存占用比4090 24G有明显提升；显卡资源占用方面，4090 48G有更富足的显存空间，平均占用在38G显存，A100平均显存占用32G，GPU利用率4090 48G也高于A100，这个场景下4090 48G的算力使用更为充沛。生成5s视频，A100平均耗时在53秒左右，4090 48G的平均耗时在50秒左右，4090 48G在文生视频场景的性能略好于是A100。阅读全文

posted @ 2025-12-02 15:04 AI算力小知识阅读(81) 评论(0) 推荐(0)

12 2025 档案

公告