5090D与4090/3090在深度学习训练任务的性能对比

作者: 莫布兰

作者简介: 心有猛虎,细嗅蔷薇

描述: 5090D与4090/3090在深度学习,计算机视觉分类任务上,训练的性能对比 5090D采用pytorch2.8,4090和3090采用pytorch2.6 代码框架基于Swin Transformer,GPU利用率可以全程达到98%以上 在384分辨率下,3张卡都跑了超过30分钟以上,不存在所谓的3秒锁频纯粹谬误 至于所谓的锁多卡性能,这个从30系就一直在锁,并行训练在图像分类任务上主流采用的是DDP(Distributed Data Parallel),通过PCIE在卡间传递梯度信息,50系与前代没有差异。且因为显存带宽的提高,多卡DDP的理论效率提升会比单卡更多 最后关于语言大模型与其他CV任务,我认为本质都是矩阵计算,只要GPU利用跑满,那么与前代卡的性能对比应该和分类任务不会有显著区别 第一次录视频,没准备稿子,口误较多,希望大家多多包涵 如果有帮助,欢迎大家引用我的论文: Multi-granularity Part Sampling Attention for Fine-grained Visual Classification

5090D与4090/3090在深度学习训练任务的性能对比

推荐视频

显卡AI算力排行 2025.02

显卡AI算力排行 2025.02

上传者: 扣肉1tothree

【极客湾云飞】5090和5090d区别不大

【极客湾云飞】5090和5090d区别不大

上传者: 就不能一起摸鱼吗

4090逆天的ai画图速度

4090逆天的ai画图速度

上传者: 古怪兽人