当前位置：首页 > 每日看点

搭建DeepSeek本地知识库的意义是？

卡卷网1年前 (2025-02-17)每日看点259

一直想把Obsidian变成本地知识库，但是OpenAI太贵了，而且国内用太不方便，去年用4060单机跑了一些本地大模型，降智太严重。直到DeepSeek出现了，这些问题都解决了！终于可以让我的笔记走上AI之路了！

为什么要把笔记做成本地知识库呢，我觉得至少有以下几方面的助益：

智能化的知识提取：快速总结、对比和回顾笔记内容，让知识不再是孤立的片段，而是有机的整体。
高效的写作辅助：从错别字、语法检查到内容扩写改写，写作可以变得更加流畅和高效。
深度的知识关联：基于全库内容的问答和检索，突破对话框的局限，让知识之间的联系更加紧密。

本文分两部分，第一部分介绍知识库的需求和应用场景。可以根据第一部分内容判断是否有必要搭建你的个人知识库。第二部分是详细的设置步骤和方法教学。只需要方法的，直接跳到第二部分即可。

需求和场景描述

我的方案是使用DeepSeek的API，而不是本地模型。这个方案比较适合对于个人数据隐私不那么介意，电脑性能一般，但同时希望得到较好的问答体验的人。如果非常介意数据隐私和安全性，也不差钱的话，当然部署本地模型更方便，也不存在卡顿问题。但本地模型，至少需要1张4090才能得到比较满意的效果吧，而且跟满血应该还是有差距的。API能获得满血的推理能力，价格也很低，我觉得是性价比最高的方案了。唯一不足的太卡了，现阶段DeepSeek太火爆，官方和甚至硅基流动流量都很大，问答等待时间超长，体验没那么好，但可预见后续会改善。这里列个表格对比一下两种方案，可以根据需求选择使用API还是本地部署。

对比维度	API	本地模型
性能	高	取决于硬件
隐私	低	高
成本	低	高
易用性	高	中

至于为什么需要LM Studio，是因为大模型本身只提供了问答的接口。必须对笔记内容进行向量化处理才能跟大模型进行知识库的交互。我没试过Embedding模型是否也可以用API接口，因为我的笔记库本身很大，上千条笔记，内容太多了，感觉用API会很慢。Embedding模型本身不大，一般电脑都能跑起来，也没有显卡限制，用起来还是很方便的。第一次用Embedding模型建索引会有些慢，但是索引结果会存在Copilot插件的缓存文件里，后续每次只会对有变化的笔记重新索引，系统资源占用也很小。对我个人来说是最优方案。

集成AI以后，Prompt里可以直接引用笔记链接，甚至根据全库内容进行检索回答，超越了用网页版或者APP对话框的上下文的限制，绝对是个人知识管理质的飞跃。不过目前基于库的问答，结果只能说还行，回答内容常常是不太完整的，具体原因还待探索。另外免费版好像对时间不敏感，不能根据时间段对笔记进行总结，貌似插件作者搞了一个收费的Beta版，可以比较好的识别时间。但总的来说，基于库和笔记的AI助理，有网页和APP所不能替代的优势。

库问答（vault AQ）范例：关于PKM（个人知识管理）我做了哪些笔记？帮我写个2句话的摘要，并推荐这个主题相关的笔记给我。（只推了2篇笔记给我，实际当然不止，但至少推的都是对的）