当前位置:首页 > 每日看点 > 正文内容

搭建DeepSeek本地知识库的意义是?

卡卷网12个月前 (02-17)每日看点182

一直想把Obsidian变成本地知识库,但是OpenAI太贵了,而且国内用太不方便,去年用4060单机跑了一些本地大模型,降智太严重。直到DeepSeek出现了,这些问题都解决了!终于可以让我的笔记走上AI之路了!

为什么要把笔记做成本地知识库呢,我觉得至少有以下几方面的助益:

  • 智能化的知识提取:快速总结、对比和回顾笔记内容,让知识不再是孤立的片段,而是有机的整体。
  • 高效的写作辅助:从错别字、语法检查到内容扩写改写,写作可以变得更加流畅和高效。
  • 深度的知识关联:基于全库内容的问答和检索,突破对话框的局限,让知识之间的联系更加紧密。

本文分两部分,第一部分介绍知识库的需求和应用场景。可以根据第一部分内容判断是否有必要搭建你的个人知识库。第二部分是详细的设置步骤和方法教学。只需要方法的,直接跳到第二部分即可。

需求和场景描述

我的方案是使用DeepSeek的API,而不是本地模型。这个方案比较适合对于个人数据隐私不那么介意,电脑性能一般,但同时希望得到较好的问答体验的人。如果非常介意数据隐私和安全性,也不差钱的话,当然部署本地模型更方便,也不存在卡顿问题。但本地模型,至少需要1张4090才能得到比较满意的效果吧,而且跟满血应该还是有差距的。API能获得满血的推理能力,价格也很低,我觉得是性价比最高的方案了。唯一不足的太卡了,现阶段DeepSeek太火爆,官方和甚至硅基流动流量都很大,问答等待时间超长,体验没那么好,但可预见后续会改善。这里列个表格对比一下两种方案,可以根据需求选择使用API还是本地部署。

对比维度API本地模型
性能取决于硬件
隐私
成本
易用性

至于为什么需要LM Studio,是因为大模型本身只提供了问答的接口。必须对笔记内容进行向量化处理才能跟大模型进行知识库的交互。我没试过Embedding模型是否也可以用API接口,因为我的笔记库本身很大,上千条笔记,内容太多了,感觉用API会很慢。Embedding模型本身不大,一般电脑都能跑起来,也没有显卡限制,用起来还是很方便的。第一次用Embedding模型建索引会有些慢,但是索引结果会存在Copilot插件的缓存文件里,后续每次只会对有变化的笔记重新索引,系统资源占用也很小。对我个人来说是最优方案。

集成AI以后,Prompt里可以直接引用笔记链接,甚至根据全库内容进行检索回答,超越了用网页版或者APP对话框的上下文的限制,绝对是个人知识管理质的飞跃。不过目前基于库的问答,结果只能说还行,回答内容常常是不太完整的,具体原因还待探索。另外免费版好像对时间不敏感,不能根据时间段对笔记进行总结,貌似插件作者搞了一个收费的Beta版,可以比较好的识别时间。但总的来说,基于库和笔记的AI助理,有网页和APP所不能替代的优势。

库问答(vault AQ)范例:关于PKM(个人知识管理)我做了哪些笔记?帮我写个2句话的摘要,并推荐这个主题相关的笔记给我。(只推了2篇笔记给我,实际当然不止,但至少推的都是对的)

搭建DeepSeek本地知识库的意义是?  第1张

设置方法和详细步骤

必要的工具&软件:

  1. Obsidian Copilot插件:在Obsidian中提供与AI交互的接口和界面
  2. LM Studio:使用本地Embedding模型对笔记进行索引(Embedding模型:大模型的一种,可以将文本转换为数值向量的技术,使得计算机能够更好地理解和处理文本内容。)

LM Studio安装(略)

Copilot插件安装(略)

步骤1:在Obsidian设置栏左侧第三方插件设置中选择Copilot,然后在上方标签找到Model

搭建DeepSeek本地知识库的意义是?  第2张

步骤2:在Chat Models右下角,点击Add Custom Model

搭建DeepSeek本地知识库的意义是?  第3张

步骤3:填写模型名称、Provider(选OpenAI格式)、Base URL(官网填api.deepseek.com;硅基流动填api.siliconflow.com/v1),把API从平台复制粘贴过来(API申请方法见下方步骤3补充)。

搭建DeepSeek本地知识库的意义是?  第4张

步骤3补充:API的申请方法

硅基流动:也卡,但比官网强点。新注册送14,够用很久。

cloud.siliconflow.cn/i/

在主页模型广场找到DeepSeek模型,第一个就是。复制模型名称到剪贴板待用。

搭建DeepSeek本地知识库的意义是?  第5张

模型广场下方有个API密钥,点击后选择右侧的新建API密钥,给密钥起个名字(防止自己忘记这个是干啥的密钥了),然后复制粘贴到Copilot设置的API Key里。

搭建DeepSeek本地知识库的意义是?  第6张

官网API申请流程基本相同,找到DeepSeek开放平台:platform.deepseek.com/

登录申请API即可。

信息填写完记得点一下右下角的Verify,看看是否能跑通。然后点击Add Model。自定义模型就添加好了。

步骤4:添加Embedding模型

打开LM Studio,左侧边栏选择第二个图标。然后点击上方加载模型,加载好的Embedding模型,然后点击Status,运行模型。

搭建DeepSeek本地知识库的意义是?  第7张

Embedding模型会影响全库搜索的准确性和效果,建议用snowflake-arctic-embed-l-v2.0.F16.gguf,效果还可以,需要自行下载(魔搭或者hugging face镜像)。不推荐用安装LM Studio时自带的Nomic Embed Text v1.5

搭建DeepSeek本地知识库的意义是?  第8张

复制加载的模型名称到剪贴板备用。

搭建DeepSeek本地知识库的意义是?  第9张

回到Copilot设置,点击Model标签,往下翻到Embedding Models,点击Add Custom Model

搭建DeepSeek本地知识库的意义是?  第10张

填写模型名称,点击Verify测试是否正常运行,点击Add Model添加模型。使用期间LM Studio要一直开着,不能关闭。

搭建DeepSeek本地知识库的意义是?  第11张

步骤5:回到基础设置,Default Chat Model选刚刚添加的DeepSeek模型,Embedding Model选LM Studio上运行的模型。

搭建DeepSeek本地知识库的意义是?  第12张

最后,打开Copilot chat window就可以开始用啦,左下角点击vault QA,第一次使用时会要求建立索引。笔记多的话会要花点时间,索引建好就快啦。如果是基于单一笔记的问答,用chat就可以啦。

搭建DeepSeek本地知识库的意义是?  第13张

希望这篇笔记能帮到有相同需求的伙伴。预祝使用愉快~

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/02/10738.html

分享给朋友:

相关文章

需要做一个微信小程序项目,大公司价格太高怎么办?

需要做一个微信小程序项目,大公司价格太高怎么办?

一个小程序制作开发多少钱构建一个微信小程序大概需要花费多少资金? 一、自主开发如果选择自主开发,这里面门道可不少。微信小程序认证费用: 300 /年域名费用: 30 - 80 /年服务器费用: 600 - 3000 /年这么一算,扣除人力成...

用红米手机会很丢人吗?

前些日子遇到了一位快递小哥,京东的,签收小哥年纪不算大,目测二十多岁他的手机上全是一道道极严重的划痕,有点卡,他开热点了,热点名就是手机型号,红米9a,我父母的同款现在他那边操作了一会,然后又是我这边操作了一会小哥看着我手机刷刷的,颇有些好...

MacOS真的比Windows流畅吗?

我现在公司配的机器,配置是绝对的大古董了惠普z230sff薄塔cpu只是个4770,没错不是4790k,4770全核睿频只有3.8g显卡更是古董,k600,已经结束驱动更新支持了,显存仅1g,跑分跑不过13代uhd核显内存是加到16g得,但...

为什么神经网络可以解偏微分方程,是什么原理?

为什么神经网络可以解偏微分方程,是什么原理?

题主一直比较关心神经网络在其他科学领域的应用,比如数学、物理学还有生物学,比如AlphaFold。本次带来的这篇文章傅里叶神经网络算子解偏微分方程就是一个很有意思的方向,其实我自己去年在给美国一个客户做兼职预测数字货币期权价格的时候就用到过...

是不是从Java培训班出来的人都被淘汰了?

真实个人经历。我就是从培训班出来的,但没有学完就跑出来了。当我明白什么人不管什么基础都能进培训班进行培训,学到什么程度都能保证他们包就业,我就知道不正常。我自己是大三下的时候去的,考研考到一半感觉无望,想抓紧时间学习技术,利用应届生身份准备...

被网络诈骗了,钱还能追得回来吗?

我刷单被骗,当时不知道怎么办在百度上找个律师说他们能追回,还说不用报警,我傻的就信了,支付了费用签合同,我还是不信他们,报警了,报警没几天警官就连系我追回一笔钱让我注意银行卡到账通知,又过几天我第二笔钱到账了,律师说是他们追回的,要我支付后...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。