当前位置:首页 > 每日看点 > 正文内容

如何在本地部署DeepSeek-R1模型?

卡卷网11个月前 (01-31)每日看点190

注意,ollama上的版本7b 14b的什么的不是原版R1,原版R1没有这么小的版本,这几个都是对应的Qwen和llama的蒸馏版本,不算是正经R1。


个人用户本地部署原版R1不太可能。这玩意光模型688G,没有GPU集群根本不用想。

huggingface.co/deepseek

即使是量化版本,最极端的Q1量化,也要94G:

huggingface.co/bartowsk

也不是普通玩家能玩的东西,但是如果你有两张A100 80G,可以试试。

但是Q1应该已经劣化成傻子了,比较能接受的是Q4的版本,大概360G:

huggingface.co/bartowsk

如果你有5张 A100 80G应该可以试试。这个效果估计跟Deepseek网站上的就类似了。

所以普通用户,只能试试蒸馏的量化版本,感受下意思得了,比如这个R1蒸馏Qwen 2.5 14b的IQ4_NL版本:

huggingface.co/bartowsk

10G显存就能跑跑。

如果你有16G显存,可以试试蒸馏的Qwen 2.5 32b的版本,IQ3_M量化,实测损失有点严重,Q4以下量化其实都不太推荐:

huggingface.co/bartowsk

32B的蒸馏版本还是推荐至少有24G显存,上至少Q4的量化版本:

huggingface.co/bartowsk

注意,ollama上的版本7b 14b的什么的不是原版R1,原版R1没有这么小的版本,这几个都是对应的Qwen的蒸馏版本,不算是正经R1。

当然,蒸馏版本也挺能打的:

如何在本地部署DeepSeek-R1模型?  第1张

没有o1和R1那么强,但是比个gpt4o还是绰绰有余。尤其蒸馏的7B现在已经可以在手机上跑了。

一个比gpt4o还强的模型,能在手机上本地跑,都不说一年前,放一个月前,你敢想么?

其实,这个也不太意外,Cot模型的发展速度真挺快,其实之前就有Open O1这个项目,项目目的就是要复现OpenAI的o1。他选择的微软的rStar算法,这就是一个Cot模式蒸馏小模型的方法,蒸馏的llama7b就有很高的能力了。

Mutual Reasoning Makes Smaller LLMs Stronger Problem-Solvers

Deepseek直接开大,R1蒸馏Qwen,干的gpt4o跟SZ一样。Deepseek太TM给力,请继续。

另,个人小白安装步骤,用的R1蒸馏Qwen 14b,不是正经R1,10G显存,感受一下吧:

ollama标配前端是open-webui,装个python 12.8,记得勾上pip工具,把path加好。

打开一个cmd命令行,然后直接:

pip install open-webui

安装好后直接:

open-webui serve

ollama自己装吧,下一步点点就可以了。

装好后,命令行输入:

ollama run deepseek-r1:14b-qwen-distill-q4_K_M

等着,网络不好下载要很久(这是一个R1蒸馏Qwen 14b的q4版本,大概需要至少10G显存),出现>>>代表下载完成了,这时候你可以问他几个问题。然后ctrl-d退出。

确认open-webui在命令行里面运行着,ollama小山羊图标也在系统右下角。

打开浏览器,输入127.0.0.1:8080,第一次需要注册管理员用户,注册好后登录,你就能看到类似chatGPT的界面了,还有刚才你下载的deepseek-r1:14b-qwen-distill-q4_K_M,可以开始对话了。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/01/10382.html

分享给朋友:

相关文章

你有突破100个粉丝了吗?

你有突破100个粉丝了吗?

100粉已经过啦!说说怎么过的吧,最开始疯狂的写回答,写想法,关注人数在50几以下持续有两周多,每天都关注变化,都是个位数增长,后来干脆不看了。到第三周时突然一周增长了100多人,一天十几人,想想应该归功于多互动,给他人点赞评论,让自己曝光...

短视频如何快速变现?

短视频如何快速变现?

单人日产200条视频,一晚狂赚上千元,过程却简单到荒唐。只要你像这只猥琐的海鸥一样,做到这3点就行↓↓点开有惊喜速度快、不讲武德、不被发现那做短视频如何做到这3点?答案是养一只会叼视频的海鸥不是让你养真的海鸥而是用 ai 运营方法,类似于“...

PS有哪些实用小技巧,小白也能一学就会?

PS有哪些实用小技巧,小白也能一学就会?

不看后悔系列!本篇分享25个PS实用的技巧!不能保证每个都能让你惊艳,但是却是我用心写出来的,希望对你有帮助。另外我的知乎也写了接近200篇PS的技巧,超级合集分享!我目前正在带一个PS/Ai的软件训练营,两个多月搞定两大软件的学习详细的内...

为什么大家不再提 5G 了?

现在看来,只有美国那种5g的思路是对的。美国的运营商一开始就发现5g和4g并没有质的飞跃,无非就是提升频率/降低穿透力/提升带宽的故事。而美国运营商又是自负盈亏,因此一开始就仅在人口高密度地区或富裕地区布置5g。虽然说人家4g也菜,但是人家...

网易云音乐里有哪些打动你的评论?

1.“如果我被强奸了,有人说我会失去贞操。”“我怎么失去贞操了呢?” “我的贞操不在我的阴道里。”“失去贞操的是强奸犯,而不是被强奸的人。”2.但要记得那年海边的烟火,我们不拘一格 ,嘲笑过生活。………网易云热评《这样就很好》3.“ 我们在...

台积电通知其中国客户,从下周开始,所有 7nm 及以下芯片出货将停止。如何看待这一行为?

台积电通知其中国客户,从下周开始,所有 7nm 及以下芯片出货将停止。如何看待这一行为?

我说美国快要没招了,你信么?这次台积电宣布停止向中国大陆客户供应7纳米及更先进AI芯片,再加上前段时间台积电对华为的制裁,我们基本可以认为,台积电在高端芯片领域,已经彻底把大陆给拉黑了,这也意味着中美芯片战已经到了最关键的时刻,一旦我们克服...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。