当前位置:首页 > 每日看点 > 正文内容

如何在本地部署DeepSeek-R1模型?

卡卷网9个月前 (01-31)每日看点163

注意,ollama上的版本7b 14b的什么的不是原版R1,原版R1没有这么小的版本,这几个都是对应的Qwen和llama的蒸馏版本,不算是正经R1。


个人用户本地部署原版R1不太可能。这玩意光模型688G,没有GPU集群根本不用想。

huggingface.co/deepseek

即使是量化版本,最极端的Q1量化,也要94G:

huggingface.co/bartowsk

也不是普通玩家能玩的东西,但是如果你有两张A100 80G,可以试试。

但是Q1应该已经劣化成傻子了,比较能接受的是Q4的版本,大概360G:

huggingface.co/bartowsk

如果你有5张 A100 80G应该可以试试。这个效果估计跟Deepseek网站上的就类似了。

所以普通用户,只能试试蒸馏的量化版本,感受下意思得了,比如这个R1蒸馏Qwen 2.5 14b的IQ4_NL版本:

huggingface.co/bartowsk

10G显存就能跑跑。

如果你有16G显存,可以试试蒸馏的Qwen 2.5 32b的版本,IQ3_M量化,实测损失有点严重,Q4以下量化其实都不太推荐:

huggingface.co/bartowsk

32B的蒸馏版本还是推荐至少有24G显存,上至少Q4的量化版本:

huggingface.co/bartowsk

注意,ollama上的版本7b 14b的什么的不是原版R1,原版R1没有这么小的版本,这几个都是对应的Qwen的蒸馏版本,不算是正经R1。

当然,蒸馏版本也挺能打的:

如何在本地部署DeepSeek-R1模型?  第1张

没有o1和R1那么强,但是比个gpt4o还是绰绰有余。尤其蒸馏的7B现在已经可以在手机上跑了。

一个比gpt4o还强的模型,能在手机上本地跑,都不说一年前,放一个月前,你敢想么?

其实,这个也不太意外,Cot模型的发展速度真挺快,其实之前就有Open O1这个项目,项目目的就是要复现OpenAI的o1。他选择的微软的rStar算法,这就是一个Cot模式蒸馏小模型的方法,蒸馏的llama7b就有很高的能力了。

Mutual Reasoning Makes Smaller LLMs Stronger Problem-Solvers

Deepseek直接开大,R1蒸馏Qwen,干的gpt4o跟SZ一样。Deepseek太TM给力,请继续。

另,个人小白安装步骤,用的R1蒸馏Qwen 14b,不是正经R1,10G显存,感受一下吧:

ollama标配前端是open-webui,装个python 12.8,记得勾上pip工具,把path加好。

打开一个cmd命令行,然后直接:

pip install open-webui

安装好后直接:

open-webui serve

ollama自己装吧,下一步点点就可以了。

装好后,命令行输入:

ollama run deepseek-r1:14b-qwen-distill-q4_K_M

等着,网络不好下载要很久(这是一个R1蒸馏Qwen 14b的q4版本,大概需要至少10G显存),出现>>>代表下载完成了,这时候你可以问他几个问题。然后ctrl-d退出。

确认open-webui在命令行里面运行着,ollama小山羊图标也在系统右下角。

打开浏览器,输入127.0.0.1:8080,第一次需要注册管理员用户,注册好后登录,你就能看到类似chatGPT的界面了,还有刚才你下载的deepseek-r1:14b-qwen-distill-q4_K_M,可以开始对话了。

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/01/10382.html

分享给朋友:

相关文章

百度收录又开始“作”了,用“快速抓取”替代“快速收录”

百度收录又开始“作”了,用“快速抓取”替代“快速收录”

作为国内不得不用的知名搜索引擎“百度”,对于网站收录的规则,又有新的升级。以前有个快速收录,我们可以通过WordPress插件,免费快速提交给百度。但是现在这个功能没了,取而代之的是“快速抓取”,如下图想要使用此功能,需要加入“VIP俱乐部...

请问什么软件支持看电视直播?

请问什么软件支持看电视直播?

2024年9月6日最新更新:本文列举的所有看电视直播、或流媒体影视资源点播的软件,我这两天又重新梳理成最新版本,最大程度保证可用性。获取方式见文末图片,或见评论。后续我也将持续更新,文章是旧的软件也会是新的,保证你拿到的都是最新可用版本。作...

大量刷短视频,会让大脑变笨拙吗?

会。我曾经是一名高三学生,亲身实践过。当时集中突破语文,每天都在刷语文卷。然后有一天想躺一下刷手机,结果短视频刷完了,我再去看哪些文章,只觉头晕眼花,难以理解文字。不过好在这种情况是短时间的,过了一天我的能力又恢复了。在我看来,长期刷短视频...

在 Istio、Linkerd 和 Cilium 之间,哪种服务网格在性能上表现最佳?

在 Istio、Linkerd 和 Cilium 之间,哪种服务网格在性能上表现最佳?

在讨论服务网格之前,先理解一下为什么我们需要它。现代微服务架构意味着将应用拆分为多个小型、独立的服务,这些服务可以独立开发、部署和扩展。然而,服务之间的通信和管理成了巨大的挑战,例如如何保证安全的通信、负载均衡、监控与可观测性等。服务网格...

都是前端框架,为什么用 React 的人会有优越感?

都是前端框架,为什么用 React 的人会有优越感?

上家公司一直搞react,最近第一次写个vue3项目。老板朋友来了看了下页面说:这用vue写的吧。我:是...老板朋友:一看就知道是vue做的。这tm你看一眼页面就知道用的啥框架?这感觉就是,我一直用苹果,偶尔用了下华为打电话,有个人离老远...

夸克浏览器受欢迎的原因是什么?

夸克浏览器受欢迎的原因是什么?

这是可以说的嘛~哈哈,它比较吸引我的几点是:安全无广、页面简洁、功能丰富、反应速度快......首页页面支持自定义,喜欢什么样子都可以自己调整,没有花里胡哨的各种资讯推送,热搜日报整理归纳好,想看再点开查看,看着舒适度直接拉满!实用日常工具...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。