当前位置:首页 > 每日看点 > 正文内容

Ai搜索引擎是怎么实现的?为什么速度很快?

卡卷网12个月前 (11-29)每日看点183

其实各家的AI搜索引擎的主流做法都比较类似,基本都是RAG的这个套路框架,然后加一些细节方面的优化和迭代。整个界面也脱离不开搜索框的形式,还是用户主动输入问题,AI给出回答。

Ai搜索引擎是怎么实现的?为什么速度很快?  第1张

我们先介绍下RAG相关的原理,然后再说下搜索引擎的优化策略。

整个RAG的流程用文字表述如下:加载文件 -> 读取文本 ->文本分割-> 文本向量化 -> 问句向量化 -> 在文本向量中匹配出与问句向量最相似的top k个 -> 匹配出的文本作为上下文和问题一起添加到prompt中 -> 提交给LLM生成回答。

在AI搜索引擎里,加载的文本,就换成了调用 web 检索获取的文本。同样的,有很多web的检索API,包括谷歌、bing、duckduckgo等。

Ai搜索引擎是怎么实现的?为什么速度很快?  第2张

Ai搜索引擎是怎么实现的?为什么速度很快?  第3张

AI在搜索的时候,不是简单的和我们想的一个个去搜索关键词,而是会用到并发搜索的技术,一次性去检索多个关键词,多个网页,这样整体耗时就可以控制在毫秒级别了

检索到相关信息之后,一般有两种方式去处理召回的内容。

1、如果召回的内容,过多,超过了大模型的token上限,或者超过了设定的阈值(假设为80%)。就首先对召回的内容进行简单的总结,这个时候可以并发调用一些小模型去总结。因为文本总结是一个很简单的任务,BERT类的模型都可以做到,所以用小模型完全没问题。

2、如果召回的内容,没有超过大模型的token上限,可以根据一些过滤条件,过滤掉一些相关性差的内容,做一个逻辑判断就可以,速度非常快。

在这之后,就可以保证输入给大模型的内容不会超过token的上限,直接输入给大模型就可以了。整体算下来可能RAG的流程在1-10s之内。

比如,知乎的直答,先检索网页,然后总结输出,就需要至少1s以上的时间,要知道传统的检索基本都是50ms以内的,实际上AI搜索要比传统搜索慢很多。

Ai搜索引擎是怎么实现的?为什么速度很快?  第4张

之所以感知不太明显,可能因为现在的AI搜索都是打字机的显示,一点点展示内容,降低了用户对时间的感知。如果是一直等待的话,你会发现耗时还是很长的。

雨飞:基于知识库和 LLM 的问答系统经验分享雨飞:5分钟打造基于 LangChain+Gradio 的个人知识助理雨飞:从零开始学 langchain 之搭建最小的 RAG 系统

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2024/11/2080.html

分享给朋友:

相关文章

200+ 工具,这个网站堪称最强

200+ 工具,这个网站堪称最强

作为一个乱七八糟什么都懂一点的电脑小白,日常经常被别人增加些临时任务,比如PDF转Word,提取视频里的音频,图片加个边框。之前,电脑里安装了不少这类的软件,虽然能满足要求,但装的多了,总感觉电脑卡卡的。最近发现了一个超强的在线工具网站,首...

如何进行 Elasticsearch 调优实践?

如何进行 Elasticsearch 调优实践?

面试官心理分析这个问题是肯定要问的,说白了,就是看你有没有实际干过 es,因为啥?其实 es 性能并没有你想象中那么好的。很多时候数据量大了,特别是有几亿条数据的时候,可能你会懵逼的发现,跑个搜索怎么一下 5~10s ,坑爹了。第一次搜索的...

无意中发现技术主管写的代码,大家帮忙看看什么水平?

无意中发现技术主管写的代码,大家帮忙看看什么水平?

虽然很多答主用了诸如“典范级”、“心旷神怡” 的形容, 赞美这段代码, 但这里, 出于技术讨论的动机, 我说说不同看法.栈, 如果善于利用栈来处理树结构, 那么可以写出更简洁的代码, 根本不需要 recuresiveFn 这种方法. 泛型,...

有没有高手指点一下Google做SEO现在的技巧啊?心好累。

有没有高手指点一下Google做SEO现在的技巧啊?心好累。

搜索引擎优化 (SEO) 的目标是让 Google 在用户输入相关搜索查询时提供您的网页链接。虽然没有固定的蓝图可以保证您获得最高排名,但有几种 SEO 最佳实践(您可以将其视为 SEO 规则)可以增加您在非付费结果中获得良好排名的机会。谷...

想入个键盘,想买机械的但是太贵,求知友推荐一款手感比较好的薄膜键盘?

想入个键盘,想买机械的但是太贵,求知友推荐一款手感比较好的薄膜键盘?

相信很多接触过286的90后朋友都和我有一样的体会,以前的机械键盘真的是让人头皮发麻,不仅敲击要非常用力,而且很吵。所以后面随着大家的生活消费水平的上升,家家户户都有电脑了,自然也不想再用打字来宣扬自己有电脑的优越感,基本上大家都换成了又轻...

什么时候你意识到做技术永无出路?

什么时候你意识到做技术永无出路?

2016年,帮一个朋友的忙,写了个软件给他的工作室用, 象征性的收了5000块钱。大概过了三四年吧,他酒后吐真言,这个软件在他这个细分行业,很有用,他这几年把我写的这个软件卖了很多份出去,收益远超30万。因为是离线软件,给他的就是一个exe...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。