当前位置:首页 > 每日看点 > 正文内容

如何评价RTX2080Ti 22G魔改版?

卡卷网8个月前 (03-03)每日看点127

省流,买,推荐,无他。


2080Ti~22g:目前(2024年12月底),可以找到2400-2500店保一年的,尽量选口碑好的。

这张卡能力均衡,是平民/垃圾佬的Ai神器,同样也是来路不明nv骑士的典范,生产力老手。

大显存,高算力,高带宽,功耗合理,噪音散热可接受,还支持nvlink扩展。在我看来,它的唯一缺点就是Turing架构有一丢丢老了,但比volta又要好一丢丢。至于矿不矿反而不重要。

到手验证,一般是压测,比如甜甜圈、gpu-burn,备选cuda-samples、mlperf,以及跑你的目标任务,验证工况下功耗散热稳定性,以及噪音容忍度。


2500附近的同一价位,能买到:

V100-sxm2-16g~PCIe(转接卡,训练向)

V100-pcie-16g-定制(核心搬板,训练向)

2080Ti~22g(显存扩容,训练推理兼顾)

3070~16g(显存扩容,推理日常兼顾)

4060ti-8g(16g要捡漏,推理日常环保)

性能参考:

如何评价RTX2080Ti  22G魔改版? 第1张

深度学习我觉得关注这么些参数就足够了。但要说性价比大多数新卡(主要是专业卡和数据中心卡)费拉不堪。


我认为,深度学习的生产力提升关键在于混合精度训练(mixed-precision-training)和低精度推理。放弃pascal及以前任何没有tensor core的加速卡。除非你有非常明确的目标,比如依赖显存大小的传统单精度计算,并且有严格的预算,才考虑p100/p40。

V100可以提供超越3090/4080的混合精度算力,适合深度学习训练,但因为volta作为最初代tensor core,不支持int8/int4加速,量化推理没有优势。

⚠️从CUDA 12.8开始,英伟达官方不再对maxwell(cc 5.2/5.3)、pascal(cc 6.0/6.1)、volta(cc 7.0) 提供更新,它们被标记为过时架构,选择时需要评估。

2080Ti~22g,特点如前,推荐。精度不支持tf32/bf16/fp8/fp4,库不支持flash-attn:2+,影响需要根据实际研判。

T10-16g x2,小众思路,T4平替。单宽全高全长,150w供电,被动散热,TU102支持nvlink,纸面算力和2080类似,没具体接触,不详评。(添加于25年2月初,感觉deepseek-r1使这块卡价格探底回升)

3070~16g或者择机捡漏上4060ti-16g,更适合入门选手,什么都想试试,推荐新架构。这个价位上目前还能买到A2,但只有3050的性能明显不太够看。

Ampere和Ada架构相比Turing的优势,一是工艺改进带来的能耗优化,二是支持更多的数据类型在tensor加速,比如bf16甚至fp8,附带就是flash-attention(2+)依赖硬件架构,这些改进都足够面向未来。


25年初,补充一点关于Blackwell架构50系消费级显卡的信息,新架构进一步支持更低精度的FP4加速,新的架构/技术对游戏友好,可以关注16G入门卡,比如还没发布的5060Ti,但提升可能极其有限。

下表的图是1月初根据发布会推测,白皮书来了(nvidia-rtx-blackwell-gpu-architecture),看了一下,基本正确,不改了。

如何评价RTX2080Ti  22G魔改版? 第2张



算力跃升的直接原因是工艺的进步,带来更多的单元和更高的频率,架构的改良更多是在功能特性上反映。

纸面算力:PeakPerf = cuda_FP32 = CUDAs x BoostClock x 2 / 1M(将单位转为Tflops)

Tensor算力可以笼统理解为纸面算力乘上一个系数,这个系数不同系列产品线略有区别。

AI算力是老黄ppt的话术,怎么大怎么来,只要言之成理即可。稀疏的INT4/FP4算力可以是单精度(FP32)纸面算力的32倍,从ampere就开始支持,白皮书里也有,但老黄只是按需往ppt上写。

如何评价RTX2080Ti  22G魔改版? 第3张

实际算力测试显示,优化较好的gemm可以跑到纸面算力的8-9成,而一般我们的任务不可能只跑gemm,所以能跑到5-6成的算力已经很不错了。

如何去测量本地矩阵乘算力,可以直接在知乎搜「cuda矩阵乘优化」或者「cuda矩阵乘测量」关键字。


关于功耗,TDP可以理解为加速卡满负载稳定运行的平均功耗,而不是尖峰功耗,尖峰功耗可能是TDP的150%,所以要注意电源的选择。

限制功耗也是一种方案,从实测中看到,各代高端消费卡在限制10%功耗时,实际性能(非纸面算力)损失不到5%,限制20%功耗时,实际性能损失不到10%,再限制功耗就会有大于线性性能下降的损失。

如何评价RTX2080Ti  22G魔改版? 第4张


如何评价RTX2080Ti  22G魔改版? 第5张

具体可以参考以下文章,方法里边有描述。

RTX3090-GPU-Wattage-Limited-MaxQ-TensorFlow-Performance



深入研究GPU选型及参数影响,可以参考这篇文章,知乎里边也有翻译版本。

The Best GPUs for Deep Learning in 2023 — An In-depth Analysis

要是还想进一步探索关于整机的思路,可以看我之前夏天写的一篇,那个时候刚给朋友装了服务器。

配深度学习主机,预算1.8W,请问各位大佬这个配置如何?

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/03/11511.html

分享给朋友:

相关文章

有什么音乐软件可以全部免费下载歌曲?

有什么音乐软件可以全部免费下载歌曲?

作为音乐发烧友,我几乎把市面上所有的发烧碟、试音碟,全都给收藏,下载下来了!音质都是无损的,品质特别高,有5.1环绕的、有DTS的、有中文的、有英文的。大家可以看看这个音乐目录,大概有30万张专辑。有需要下载软件的朋友,可以双击屏幕,然后搓...

4499 元起的荣耀Magic7 系列实际使用体验怎么样,值得入手吗?

全是软文。。。。。。不过我买了,标准版。为什么买荣耀:屏幕看着舒服,玩游戏选择大屏,超声波指纹解锁。其它,系统、续航、充电、拍照,不是最强,但均衡下来短板都不是很短。其它米OV,IQ、一加,都看了,预算有限,米OV的小屏不感兴趣,OPPO硬...

你是如何在不依靠工资收入的情况下赚到一万元的?

你是如何在不依靠工资收入的情况下赚到一万元的?

分享几个路子稳,门槛低,变现快,适合年轻人的靠谱的副业。绝对不是送外卖、滴滴、搬砖等等的苦力活,这几个副业都是能是性价比极高,还能让你快速成长的工作。想通过副业实现暴富、立马月入过万的同学,建议速速划走。今天撇哥就给大家分享100+个靠谱赚...

腾讯文档回收站彻底删除文件真的找不回来了吗?

趁早打电话联系腾讯文档的人可能还有救,一般这种都是数据库里标记为删除,文件还没有实际删除,然后经过一段时间后程序统一进行真删除。这个“一段时间”可长可短,可能是一小时也可能是几天几个月甚至几年,要看腾讯服务器的程序是怎么写的。不过你联系腾讯...

台积电通知其中国客户,从下周开始,所有 7nm 及以下芯片出货将停止。如何看待这一行为?

台积电通知其中国客户,从下周开始,所有 7nm 及以下芯片出货将停止。如何看待这一行为?

我说美国快要没招了,你信么?这次台积电宣布停止向中国大陆客户供应7纳米及更先进AI芯片,再加上前段时间台积电对华为的制裁,我们基本可以认为,台积电在高端芯片领域,已经彻底把大陆给拉黑了,这也意味着中美芯片战已经到了最关键的时刻,一旦我们克服...

如何看待台积电,三星相继停供大陆7nm及更先进芯片?

在这个事出来之前,我就看到过一个说法,两家Foundry可以在中东建厂,让中东的Fab去干“脏活”。本质上是国内企业搞几个中东的代理人,装作是中东的初创Fabless企业去下单,人家Foundry大概率睁一只眼闭一只眼,只管数钱。然而,紧接...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。