当前位置:首页 > 每日看点 > 正文内容

什么配置能本地部署并运行满血671B的DeepSeek-R1?

卡卷网9个月前 (02-18)每日看点189

请理解“满血”的含义:在8位精度下运行6710亿参数量的大模型。

有一个最保守的公式来计算内存用量:

M = (P x 4) / (32 / Q) x 1.2

M是所需内存(GiB),P是模型参数量(1B计量),Q是精度位数。算上模型副本、上下文等额外开销,再粗略地乘1.2考虑进去。

则,在Q8下需要805.2 GiB内存;

在Q4下需要402.6 GiB内存

若你使用GPU推理:

80G显存单卡(A100/A800/H100/H800/…)对应服务器台数48G显存单卡(L40/6000 Ada/A6000/…)对应服务器台数24G显存单卡(4090/5090/…)对应服务器台数
Q8精度(冗余考虑)2台8卡服务器3台8卡服务器5台8卡服务器
Q8精度1台8卡服务器+1台4卡服务器2台8卡服务器+1台4卡服务器4台8卡服务器+1台4卡服务器
Q4精度1台6卡服务器1台8卡服务器+1台2卡服务器3台8卡服务器

若你使用CPU推理:

跑Q8至少需要双路EPYC 9004/9005+1T内存的服务器1台。

Q4同理,改变内存即可。

由于内存带宽瓶颈或CPU并行算力弱,跑这个量级的LLM不会有任何冗余算力空间,推理速度也慢,而且你如果敢用CPU搞微调和训练……基本无法使用。

你要认真的话,我稍微查了下价格,最划算的当属8卡L40服务器,在某东一台仅需35万~40万,单卡算力比肩4090,性价比远高于8卡A100/A800(150万+)。当然,你如果需要全流程的预训练+迭代+调优+……,这种L40/A6000大规模训练会受通信带宽影响,你要来真的,还得是A100/H100。

至于微调需求(我理解的题干所描述“专项训练”),使用LoRA微调方法的显存需求量和推理差不多,全参数微调则需6~10倍的推理显存需量。


紧急补充:

评论区又有老哥指出:

刚刚诞生的开源项目Ktransformer可以提供非常低的推理成本,链接:github.com/kvcache-ai/k

我在b站找到了一个教程视频:b23.tv/Eq30UrG

简单来讲,利用deepseek的多专家机制,把回答问题刚需的专家拽到GPU里,别的专家缓存在内存里代替巨量显存占用。如此就能用一块GPU+大容量RAM+CPU混动实现超低成本推理。

如果题主只有推理部署需求,不搞微调,强烈建议此全新方案。届时可以用双路9005/5代铂金+1T内存+一块专业显卡来完成推理任务。


我的最新文章整合了各种预算方案,各位可以看看,字数虽少但看点丰富:

YangWannaSleep:盘点本地部署满血deepseek-r1的各种硬件配置方案 #1

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/02/10754.html

分享给朋友:

相关文章

为什么程序员不自己开发微信小程序这类似的东西赚钱?

为什么程序员不自己开发微信小程序这类似的东西赚钱?

你如果有好的想法是可以挣钱的首先大家说的个人资质限制确实多,也不建议直接拿个人资质去用小程序盈利,因为很麻烦我说一下我的大体操作:1.首先去申请个体户,这个可以用住宅来注册申请,而且速度很快就几天就下来了,经营类目主要是互联网销售这些,不过...

有没有推荐什么手游搬砖,或者是用手机就能做的工作能日入100左右就好了?

有没有推荐什么手游搬砖,或者是用手机就能做的工作能日入100左右就好了?

大家好,我是思聪。思聪游戏搬砖社每天分享真实靠谱的游戏赚钱的方法。整个游戏的攻略用一句话概括就是:打元宝兑换平台物品,xx元宝兑换一个分红物品。你把你打游戏得来的元宝去兑换平台的分红物品,就能每天领取xx元的分红。(具体看是哪个分红物品,比...

Photoshop 有哪些使用技巧?

Photoshop 有哪些使用技巧?

不看后悔系列!本篇分享25个PS实用的技巧!不能保证每个都能让你惊艳,但是却是我用心写出来的,希望对你有帮助。另外我的知乎也写了接近200篇PS的技巧,超级合集分享!分享25个关于PS的技巧一、快速制作文字倒影1、新建文档,1500×100...

抖音和快手最大的区别是什么?

1、目标人群定位不同抖音:一二线城市,占比52%,大专学历以上,女性偏多。抖音以年轻群体居多。快手:三四线城市,占比64%,高中学历以下,男女更均衡。快手所覆盖的年龄段范围更广。2、内容创作的形式和深度不同抖音:偏深层,内容的装饰及表达更高...

你每天用来涨知识的手机应用程序有哪些?

你每天用来涨知识的手机应用程序有哪些?

经过深度使用和测评,从100个APP中选出的这35个超实用的app,每一个都是最硬核最有料的涨知识神器!每天打开看看,能让你提神醒脑,眼界大开,成为朋友聚会上的话题王者!双击屏幕取走哦~先放上全部APP目录,有新闻资讯类、英语学习类、读书类...

如何看待 Luv Letter 表示影视飓风专业性实在是让人失望?

一点儿新进展,另外以下有部分需要关注对于统一变量的问题。这个我在对比上面有写小字解释,我在一开始使用ffmpeg来控制变量。但是发现了不少问题,比如因为遗留bug,会强制将非整数帧的素材转码为VFR导致无法正确帧间对比,因此不考虑,同时尽量...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。