当前位置:首页 > 每日看点 > 正文内容

什么配置能本地部署并运行满血671B的DeepSeek-R1?

卡卷网12个月前 (02-18)每日看点248

请理解“满血”的含义:在8位精度下运行6710亿参数量的大模型。

有一个最保守的公式来计算内存用量:

M = (P x 4) / (32 / Q) x 1.2

M是所需内存(GiB),P是模型参数量(1B计量),Q是精度位数。算上模型副本、上下文等额外开销,再粗略地乘1.2考虑进去。

则,在Q8下需要805.2 GiB内存;

在Q4下需要402.6 GiB内存

若你使用GPU推理:

80G显存单卡(A100/A800/H100/H800/…)对应服务器台数48G显存单卡(L40/6000 Ada/A6000/…)对应服务器台数24G显存单卡(4090/5090/…)对应服务器台数
Q8精度(冗余考虑)2台8卡服务器3台8卡服务器5台8卡服务器
Q8精度1台8卡服务器+1台4卡服务器2台8卡服务器+1台4卡服务器4台8卡服务器+1台4卡服务器
Q4精度1台6卡服务器1台8卡服务器+1台2卡服务器3台8卡服务器

若你使用CPU推理:

跑Q8至少需要双路EPYC 9004/9005+1T内存的服务器1台。

Q4同理,改变内存即可。

由于内存带宽瓶颈或CPU并行算力弱,跑这个量级的LLM不会有任何冗余算力空间,推理速度也慢,而且你如果敢用CPU搞微调和训练……基本无法使用。

你要认真的话,我稍微查了下价格,最划算的当属8卡L40服务器,在某东一台仅需35万~40万,单卡算力比肩4090,性价比远高于8卡A100/A800(150万+)。当然,你如果需要全流程的预训练+迭代+调优+……,这种L40/A6000大规模训练会受通信带宽影响,你要来真的,还得是A100/H100。

至于微调需求(我理解的题干所描述“专项训练”),使用LoRA微调方法的显存需求量和推理差不多,全参数微调则需6~10倍的推理显存需量。


紧急补充:

评论区又有老哥指出:

刚刚诞生的开源项目Ktransformer可以提供非常低的推理成本,链接:github.com/kvcache-ai/k

我在b站找到了一个教程视频:b23.tv/Eq30UrG

简单来讲,利用deepseek的多专家机制,把回答问题刚需的专家拽到GPU里,别的专家缓存在内存里代替巨量显存占用。如此就能用一块GPU+大容量RAM+CPU混动实现超低成本推理。

如果题主只有推理部署需求,不搞微调,强烈建议此全新方案。届时可以用双路9005/5代铂金+1T内存+一块专业显卡来完成推理任务。


我的最新文章整合了各种预算方案,各位可以看看,字数虽少但看点丰富:

YangWannaSleep:盘点本地部署满血deepseek-r1的各种硬件配置方案 #1

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/02/10754.html

分享给朋友:

相关文章

创业容易吗?

创业容易吗?创建企业不一定是困难或令人生畏的。它可以从一个简单但有力的想法开始,比如小强意识到,如果洗手液能杀死真菌,尤其是拳击台上的真菌,就会更加有用。创业确实需要奉献精神、努力工作和仔细规划——这是没有办法的。虽然这本身可能并不容易,但...

支付宝碰一碰市场如何?

支付宝碰一碰市场如何?

今年,支付宝又整了新的大活,即无须扫码即能完成支付操作的“支付宝碰一碰”正式登场。下面就来给大家分析分析,这是个什么情况,为什么都在说能赚钱。支付宝碰一下怎么赚钱的?都有谁能赚到这份钱?1.支付宝碰一下原理支付宝碰一下的本质依旧是“条码支付...

提升自己最快的方式是什么?

提升自己最快的方式是什么?

1.稻盛和夫说过:“改变自己最快的方法就是做自己害怕的事,不敢做的事,认为自己做不到,觉得不可能的事。如果在自己的舒适区待久了,就会丧失斗志,如果想快速的改变,可以坚持去做一些对自己有益的事。2.早睡早起,坚持运动保持旺盛的精力,人生拼到最...

腾讯云为何在云服务市场败给了阿里云?

IDC领域,2010年以前,万网、新网互联、新网,三家公司瓜分天下,其中万网市场份额最高,排名第一。当时,万网的域名是http://www.net.cn,通过该域名就可以判断万网的地位。2010年阿里云成立,直接收购了万网,大量用户直接流向...

为什么雷军身上没有酒色财气?

武大建校130周年时,雷军向母校个人捐款13亿。在2023年8月14日晚上七点,雷总在国家会议中心举行的进行第四次年度演讲「成长」:全篇都在谈成长、梦想,这么多年了,始终做到了知行合一,我相信酒色财气可能真不是他所追求的,一直追求的就像他演...

为什么神经网络可以解偏微分方程,是什么原理?

为什么神经网络可以解偏微分方程,是什么原理?

题主一直比较关心神经网络在其他科学领域的应用,比如数学、物理学还有生物学,比如AlphaFold。本次带来的这篇文章傅里叶神经网络算子解偏微分方程就是一个很有意思的方向,其实我自己去年在给美国一个客户做兼职预测数字货币期权价格的时候就用到过...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。