有哪些常用的源代码搜索引擎?
作者:卡卷网发布时间:2025-05-07 22:54浏览数量:7次评论数量:0次
项目简介
一款无需代理、支持多搜索引擎的 LLM 网络检索工具正式开源。 —— proxyless-llm-websearch
该工具集成了多搜索引擎支持、网页解析+爬取能力,结合 LangGraph 构建模块化智能体链路,让大模型拥有“读网页”、“找资料”的能力。
项目地址 GitHub · itshyao/proxyless-llm-websearch
作者:AI前沿搬运工
公众号:【AI前沿搬运工】
✨ 功能亮点
无需代理
采用 Playwright 本地浏览器模拟,配置支持国内搜索引擎(Bing、夸克、百度、搜狗),无需翻墙也能联网搜!
多引擎搜索
多路并发搜索,自动去重融合,最大化信息多样性。
自动判断意图
支持自然语言 URL 与问句识别,智能区分“搜索”与“网页解析”任务。
查询分解机制
搜索意图自动拆解为多个子任务,显著提升结果的完整性与上下文相关性。
LangGraph智能体链路
模块化工具链 web_search
+ link_parser
,低耦合高扩展。
高性能异步爬取
Playwright 与 Crawl4AI 支持网页加载、异步并发爬取、抗封封锁机制。
✂️ 内容重构
- 网页切片:长网页分段处理;
- 内容重排:提升信息密度与相关性
浏览器插件支持
支持智能 URL 内容解析的浏览器插件,帮助大模型快速获取网页信息。
- 当前页面解析:一键提取当前访问页面的结构化内容
- 多标签页解析:批量提取多个标签页中的网页信息
- ✏️ 自定义 URL 解析:支持输入多个链接进行内容提取
快速部署
git clone https://github.com/itshyao/proxyless-llm-websearch.git
cd proxyless-llm-websearch
pip install -r requirements.txt
python -m playwright install
配置环境变量后:
python demo.py
或运行 FastAPI 接口:
python api_serve.py
或者可视化 Web UI:
python gradio_demo.py
或者使用插件:
效果测试:
基于阿里的 WebWalkerQA 高难度问答数据集,对比火山方舟、百炼等知名在线检索接口,我们取得了最高的正确率和最低的错误率:
搜索系统 | ✅ 正确率 | ❌ 错误率 | ⚠️ 部分正确 |
火山方舟 | 5.00% | 72.21% | 22.79% |
百炼 | 9.85% | 62.79% | 27.35% |
Our | 19.85% | 47.94% | 32.06% |
Call for Action
开源不易,欢迎大家 ⭐Star!!
GitHub 项目地址: https://github.com/itshyao/proxyless-llm-websearch
免责声明:本文由卡卷网编辑并发布,但不代表本站的观点和立场,只提供分享给大家。
- 上一篇:新手小白如何用微信视频号如何赚钱?
- 下一篇:知乎上日入10元,是不是很容易?
相关推荐

你 发表评论:
欢迎