当前位置:首页 > 每日看点

有哪些常用的源代码搜索引擎?

卡卷网11个月前 (05-07)每日看点367

项目简介

一款无需代理、支持多搜索引擎的 LLM 网络检索工具正式开源。 —— proxyless-llm-websearch 该工具集成了多搜索引擎支持、网页解析+爬取能力,结合 LangGraph 构建模块化智能体链路,让大模型拥有“读网页”、“找资料”的能力。
项目地址 GitHub · itshyao/proxyless-llm-websearch

作者:AI前沿搬运工

公众号:【AI前沿搬运工】

有哪些常用的源代码搜索引擎?  第1张


✨ 功能亮点

无需代理

采用 Playwright 本地浏览器模拟,配置支持国内搜索引擎(Bing、夸克、百度、搜狗),无需翻墙也能联网搜!

多引擎搜索

多路并发搜索,自动去重融合,最大化信息多样性。

自动判断意图

支持自然语言 URL 与问句识别,智能区分“搜索”与“网页解析”任务。

查询分解机制

搜索意图自动拆解为多个子任务,显著提升结果的完整性上下文相关性

LangGraph智能体链路

模块化工具链 web_search + link_parser,低耦合高扩展。

高性能异步爬取

Playwright 与 Crawl4AI 支持网页加载、异步并发爬取、抗封封锁机制。

✂️ 内容重构

  • 网页切片:长网页分段处理;
  • 内容重排:提升信息密度与相关性

浏览器插件支持

支持智能 URL 内容解析的浏览器插件,帮助大模型快速获取网页信息。

  • 当前页面解析:一键提取当前访问页面的结构化内容
  • 多标签页解析:批量提取多个标签页中的网页信息
  • ✏️ 自定义 URL 解析:支持输入多个链接进行内容提取

有哪些常用的源代码搜索引擎?  第2张


有哪些常用的源代码搜索引擎?  第3张


快速部署

git clone https://github.com/itshyao/proxyless-llm-websearch.git cd proxyless-llm-websearch pip install -r requirements.txt python -m playwright install

配置环境变量后:

python demo.py

或运行 FastAPI 接口:

python api_serve.py

或者可视化 Web UI:

python gradio_demo.py

有哪些常用的源代码搜索引擎?  第4张

有哪些常用的源代码搜索引擎?  第5张

有哪些常用的源代码搜索引擎?  第6张


或者使用插件:

有哪些常用的源代码搜索引擎?  第7张


效果测试:
基于阿里的 WebWalkerQA 高难度问答数据集,对比火山方舟、百炼等知名在线检索接口,我们取得了最高的正确率和最低的错误率:

搜索系统✅ 正确率❌ 错误率⚠️ 部分正确
火山方舟5.00%72.21%22.79%
百炼9.85%62.79%27.35%
Our19.85%47.94%32.06%


Call for Action
开源不易,欢迎大家 ⭐Star!!
GitHub 项目地址: github.com/itshyao/prox

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/05/12939.html

分享给朋友:

相关文章

天涯论坛关闭后,除了知乎,大家都在逛什么?

天涯论坛关闭后,除了知乎,大家都在逛什么?

天涯神贴合集完整版,给大家整理好了! 那年大学,打开天涯,感觉打开了一片新天地,里面什么样的人都有,有大神也有蛇神,比某乎好太多了,可惜后面关了很多年前,天涯社区曾出现了不少深受欢迎的帖子,成功地预言了许多形势和事件。这些帖子因此被冠以“天…

我爸讽刺我,写个破代码一年才十几万,他在工地带50个人,让我回去跟他干,写代码没出路,我该怎么选择?

我跟你一样的情况,本人现身说法,千万不要跟你爸干,我就是反面教材,现在想回去都回不去了,快十年没写代码了,再就是岁数大了,38岁了,35岁以上的码农根本就没公司愿意要,而且会受歧视。 工程不好干,首先就是不合法,在法律层面,根本就没有包工头…

下一个风口最可能是什么?

下一个风口最可能是什么?

肯定是一带一路了,国内没什么卷的空间了,现在国家正在给一带一路的第三世界国家建设基础设施,等交通打通之后,就是通信打通,通信打通就是贸易打通,未来我建议大家重仓小语种,阿拉伯语最值得学(也有其他小语种自己去查一带一路国家),将来去其他国家随…

鸿蒙到底是不是安卓套壳?

鸿蒙到底是不是安卓套壳?

把它是不是套壳先放在一边吧。我讲一个事情,大家自己判断。 华为有一个应用,叫手机管家。这个手机管家对一些 系统底层设置有影响:比如华为从 EMUI 9 开始不允许将第三方启动器设置为默认启动器,依靠的就是这个手机管家。为什么这么说呢?在网上…

如何做电商行业?

如何做电商行业?

“如何做电商*开网店”跟“如何找老婆”一样,没概况条件、没明确标准,就是扯犊子。 我把话题具体一点说: 具备“两三万”启动资金、掌握“选品+上架优化”基础技能,小则月入三五千、多则上万。跟摆地摊一样,有进货的钱、也不怕苦不怕累、稍微有点生意…

抖音上有一些账号搬运别人的视频,几乎一模一样,也没判搬运,他们是怎么做到的??

对于任何短视频平台来说,如何用最低的成本快速实现伪原创搬运都是需要解决的问题。 所有的短视频平台,包括抖音、快手、tiktok、视频号、小红书、B站,甚至是FB、推特、INS、YouTube,它们的查重技术都是类似的,只要你在网络环境设置得…

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。