当前位置:首页 > 每日看点

有哪些常用的源代码搜索引擎?

卡卷网11个月前 (05-07)每日看点371

项目简介

一款无需代理、支持多搜索引擎的 LLM 网络检索工具正式开源。 —— proxyless-llm-websearch 该工具集成了多搜索引擎支持、网页解析+爬取能力,结合 LangGraph 构建模块化智能体链路,让大模型拥有“读网页”、“找资料”的能力。
项目地址 GitHub · itshyao/proxyless-llm-websearch

作者:AI前沿搬运工

公众号:【AI前沿搬运工】

有哪些常用的源代码搜索引擎?  第1张


✨ 功能亮点

无需代理

采用 Playwright 本地浏览器模拟,配置支持国内搜索引擎(Bing、夸克、百度、搜狗),无需翻墙也能联网搜!

多引擎搜索

多路并发搜索,自动去重融合,最大化信息多样性。

自动判断意图

支持自然语言 URL 与问句识别,智能区分“搜索”与“网页解析”任务。

查询分解机制

搜索意图自动拆解为多个子任务,显著提升结果的完整性上下文相关性

LangGraph智能体链路

模块化工具链 web_search + link_parser,低耦合高扩展。

高性能异步爬取

Playwright 与 Crawl4AI 支持网页加载、异步并发爬取、抗封封锁机制。

✂️ 内容重构

  • 网页切片:长网页分段处理;
  • 内容重排:提升信息密度与相关性

浏览器插件支持

支持智能 URL 内容解析的浏览器插件,帮助大模型快速获取网页信息。

  • 当前页面解析:一键提取当前访问页面的结构化内容
  • 多标签页解析:批量提取多个标签页中的网页信息
  • ✏️ 自定义 URL 解析:支持输入多个链接进行内容提取

有哪些常用的源代码搜索引擎?  第2张


有哪些常用的源代码搜索引擎?  第3张


快速部署

git clone https://github.com/itshyao/proxyless-llm-websearch.git cd proxyless-llm-websearch pip install -r requirements.txt python -m playwright install

配置环境变量后:

python demo.py

或运行 FastAPI 接口:

python api_serve.py

或者可视化 Web UI:

python gradio_demo.py

有哪些常用的源代码搜索引擎?  第4张

有哪些常用的源代码搜索引擎?  第5张

有哪些常用的源代码搜索引擎?  第6张


或者使用插件:

有哪些常用的源代码搜索引擎?  第7张


效果测试:
基于阿里的 WebWalkerQA 高难度问答数据集,对比火山方舟、百炼等知名在线检索接口,我们取得了最高的正确率和最低的错误率:

搜索系统✅ 正确率❌ 错误率⚠️ 部分正确
火山方舟5.00%72.21%22.79%
百炼9.85%62.79%27.35%
Our19.85%47.94%32.06%


Call for Action
开源不易,欢迎大家 ⭐Star!!
GitHub 项目地址: github.com/itshyao/prox

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/05/12939.html

分享给朋友:

相关文章

如何看待台积电,三星相继停供大陆7nm及更先进芯片?

在这个事出来之前,我就看到过一个说法,两家Foundry可以在中东建厂,让中东的Fab去干“脏活”。本质上是国内企业搞几个中东的代理人,装作是中东的初创Fabless企业去下单,人家Foundry大概率睁一只眼闭一只眼,只管数钱。然而,紧接…

有哪些让你目瞪口呆的 Bug ?

有哪些让你目瞪口呆的 Bug ?

成都有个监狱情况比较特殊,关押的基本全是重犯,而且还都是经济犯和政治犯, 他们以前都是一方大佬,在自己的一亩三分地翻手为云覆手为雨,无非是不小心中箭落马或帮老大顶锅才进监狱, 所以即使进来了,他们依然保持着体面和骄傲,依从性差,虽然不至于和…

抖音有3,4万粉丝能挣多少钱?

抖音有3,4万粉丝能挣多少钱?

如果在抖音有100万粉丝,一个月能赚多少钱你知道吗?直接说答案: 抖音有100万粉丝,可能1分钱也赚不到...那视频有100万点赞,能赚多少钱?可能也是1分钱都赚不到... 新手需要通过抖音变现 [文章: 做为新手玩抖音要注意什么?怎样才能…

为什么 lnx 求导是 1/x?

为什么 lnx 求导是 1/x?

其实,我想对题主说,你提的问题一点都不弱智。恰恰相反,这是个非常有意义的问题。我们学习一门知识,尤其是数学知识,要知其然,更要知其所以然。今天,我尝试从 “如何去定义“的角度出发来解释这个问题,不玩公式推导的符号游戏。希望能带来新的启发。为…

我怎么也无法理解网络游戏为什么会有外挂?

我怎么也无法理解网络游戏为什么会有外挂?

因为你把服务器想象成了无所不能的上帝;但在我们程序猿眼里,服务器不过是一个黑大傻粗的计算器。 比如说,我们在某个位置打开一个宝箱: 那么,你觉得,程序背后应该做了些什么呢? 一、天真的玩法天真的程序猿会觉得,啊,这事简单!我就告诉服…

苏宁是怎么堕落的?

苏宁是怎么堕落的?

张近东终究还是要为自己得鲁莽买单,如今的苏宁大不如前,甚至是大势已去。记得刘强东曾经说过:一成不变的人很难有出路,更何况做企业的老板。别看如今传统行业表面风光无限,背地里早已经千疮百孔! 任何一家民营企业如果不做出改变,依旧在原地踏步,…

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。