当前位置:首页 >> 每日看点 >> 搭建DeepSeek本地知识库的意义是?

搭建DeepSeek本地知识库的意义是?

卡卷网 每日看点 94

一直想把Obsidian变成本地知识库,但是OpenAI太贵了,而且国内用太不方便,去年用4060单机跑了一些本地大模型,降智太严重。直到DeepSeek出现了,这些问题都解决了!终于可以让我的笔记走上AI之路了!

为什么要把笔记做成本地知识库呢,我觉得至少有以下几方面的助益:

  • 智能化的知识提取:快速总结、对比和回顾笔记内容,让知识不再是孤立的片段,而是有机的整体。
  • 高效的写作辅助:从错别字、语法检查到内容扩写改写,写作可以变得更加流畅和高效。
  • 深度的知识关联:基于全库内容的问答和检索,突破对话框的局限,让知识之间的联系更加紧密。

本文分两部分,第一部分介绍知识库的需求和应用场景。可以根据第一部分内容判断是否有必要搭建你的个人知识库。第二部分是详细的设置步骤和方法教学。只需要方法的,直接跳到第二部分即可。

需求和场景描述

我的方案是使用DeepSeek的API,而不是本地模型。这个方案比较适合对于个人数据隐私不那么介意,电脑性能一般,但同时希望得到较好的问答体验的人。如果非常介意数据隐私和安全性,也不差钱的话,当然部署本地模型更方便,也不存在卡顿问题。但本地模型,至少需要1张4090才能得到比较满意的效果吧,而且跟满血应该还是有差距的。API能获得满血的推理能力,价格也很低,我觉得是性价比最高的方案了。唯一不足的太卡了,现阶段DeepSeek太火爆,官方和甚至硅基流动流量都很大,问答等待时间超长,体验没那么好,但可预见后续会改善。这里列个表格对比一下两种方案,可以根据需求选择使用API还是本地部署。

对比维度API本地模型
性能取决于硬件
隐私
成本
易用性

至于为什么需要LM Studio,是因为大模型本身只提供了问答的接口。必须对笔记内容进行向量化处理才能跟大模型进行知识库的交互。我没试过Embedding模型是否也可以用API接口,因为我的笔记库本身很大,上千条笔记,内容太多了,感觉用API会很慢。Embedding模型本身不大,一般电脑都能跑起来,也没有显卡限制,用起来还是很方便的。第一次用Embedding模型建索引会有些慢,但是索引结果会存在Copilot插件的缓存文件里,后续每次只会对有变化的笔记重新索引,系统资源占用也很小。对我个人来说是最优方案。

集成AI以后,Prompt里可以直接引用笔记链接,甚至根据全库内容进行检索回答,超越了用网页版或者APP对话框的上下文的限制,绝对是个人知识管理质的飞跃。不过目前基于库的问答,结果只能说还行,回答内容常常是不太完整的,具体原因还待探索。另外免费版好像对时间不敏感,不能根据时间段对笔记进行总结,貌似插件作者搞了一个收费的Beta版,可以比较好的识别时间。但总的来说,基于库和笔记的AI助理,有网页和APP所不能替代的优势。

库问答(vault AQ)范例:关于PKM(个人知识管理)我做了哪些笔记?帮我写个2句话的摘要,并推荐这个主题相关的笔记给我。(只推了2篇笔记给我,实际当然不止,但至少推的都是对的)

搭建DeepSeek本地知识库的意义是?  第1张

设置方法和详细步骤

必要的工具&软件:

  1. Obsidian Copilot插件:在Obsidian中提供与AI交互的接口和界面
  2. LM Studio:使用本地Embedding模型对笔记进行索引(Embedding模型:大模型的一种,可以将文本转换为数值向量的技术,使得计算机能够更好地理解和处理文本内容。)

LM Studio安装(略)

Copilot插件安装(略)

步骤1:在Obsidian设置栏左侧第三方插件设置中选择Copilot,然后在上方标签找到Model

搭建DeepSeek本地知识库的意义是?  第2张

步骤2:在Chat Models右下角,点击Add Custom Model

搭建DeepSeek本地知识库的意义是?  第3张

步骤3:填写模型名称、Provider(选OpenAI格式)、Base URL(官网填api.deepseek.com;硅基流动填api.siliconflow.com/v1),把API从平台复制粘贴过来(API申请方法见下方步骤3补充)。

搭建DeepSeek本地知识库的意义是?  第4张

步骤3补充:API的申请方法

硅基流动:也卡,但比官网强点。新注册送14,够用很久。

cloud.siliconflow.cn/i/

在主页模型广场找到DeepSeek模型,第一个就是。复制模型名称到剪贴板待用。

搭建DeepSeek本地知识库的意义是?  第5张

模型广场下方有个API密钥,点击后选择右侧的新建API密钥,给密钥起个名字(防止自己忘记这个是干啥的密钥了),然后复制粘贴到Copilot设置的API Key里。

搭建DeepSeek本地知识库的意义是?  第6张

官网API申请流程基本相同,找到DeepSeek开放平台:platform.deepseek.com/

登录申请API即可。

信息填写完记得点一下右下角的Verify,看看是否能跑通。然后点击Add Model。自定义模型就添加好了。

步骤4:添加Embedding模型

打开LM Studio,左侧边栏选择第二个图标。然后点击上方加载模型,加载好的Embedding模型,然后点击Status,运行模型。

搭建DeepSeek本地知识库的意义是?  第7张

Embedding模型会影响全库搜索的准确性和效果,建议用snowflake-arctic-embed-l-v2.0.F16.gguf,效果还可以,需要自行下载(魔搭或者hugging face镜像)。不推荐用安装LM Studio时自带的Nomic Embed Text v1.5

搭建DeepSeek本地知识库的意义是?  第8张

复制加载的模型名称到剪贴板备用。

搭建DeepSeek本地知识库的意义是?  第9张

回到Copilot设置,点击Model标签,往下翻到Embedding Models,点击Add Custom Model

搭建DeepSeek本地知识库的意义是?  第10张

填写模型名称,点击Verify测试是否正常运行,点击Add Model添加模型。使用期间LM Studio要一直开着,不能关闭。

搭建DeepSeek本地知识库的意义是?  第11张

步骤5:回到基础设置,Default Chat Model选刚刚添加的DeepSeek模型,Embedding Model选LM Studio上运行的模型。

搭建DeepSeek本地知识库的意义是?  第12张

最后,打开Copilot chat window就可以开始用啦,左下角点击vault QA,第一次使用时会要求建立索引。笔记多的话会要花点时间,索引建好就快啦。如果是基于单一笔记的问答,用chat就可以啦。

搭建DeepSeek本地知识库的意义是?  第13张

希望这篇笔记能帮到有相同需求的伙伴。预祝使用愉快~

协助本站SEO优化一下,谢谢!
关键词不能为空
同类推荐

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。
最新文章
热门文章
随机文章