目 录CONTENT

文章目录

OpenClaw一款内容提取与搜索技能jina.ai

过客
2026-03-02 / 0 评论 / 0 点赞 / 4 阅读 / 0 字

最近上网闲逛时,又发现了一个好玩的网站https://jina.ai

一、介绍

Jina AI 是一家总部位于德国柏林的人工智能公司,最出圈的“杀手级”应用就是Jina Reader,提供HTML转Markdown网页内容提取接口和搜索功能。能自动去除广告、导航栏、脚本,只保留正文、标题和图片描述,是AI获取网页去噪可选工具之一。

1. 抓去功能

  • 极简 API​:只需在网址前加上 https://r.jina.ai/ 即可使用,,无API Key限制 20 RPM,免费APIkey时500 RPM。
    如抓去当前博客主页内容https://r.jina.ai/https://zengwu.com.cn

如果OpenClaw获取网页的内容的时候,加一个https://r.jina.ai/获取,内容更容易让大模型分析。

2. 搜索功能

搜索功能需要APIKey,免费API Key也可以使用。支持中文搜索,一个免费API Key可以搜索1千次左右,用完访问官网主页又能免费获取一个。

如搜“时实新闻”,这里如果要用curl需要url编码

curl "https://s.jina.ai/?q=%E6%97%B6%E4%BA%8B%E6%96%B0%E9%97%BB" \
  -H "Authorization: Bearer jina_dd0f0aab752b4e44a0a1a41497422c73h0cqUGQLEoCCkMPa50uNGqeT2DIz" \
  -H "X-Respond-With: no-content"

3. 使用抓取功能间接搜索

我们可以抓去google搜索的内容来达到间接搜索的目的(无需科学上网),如中文搜索“时事新闻”(依然要URL转码)

https://r.jina.ai/https://www.google.com/search?hl=zh-CN&q=%E6%97%B6%E4%BA%8B%E6%96%B0%E9%97%BB

二、OpenClaw中安装jina技能

  • 本想让OpenClaw根据jina检索规则自己写一个技能的,结果用clawhub搜一下发现上面已经有二个技能了。于是查看了一下技能详情

  • 我这里安装了第一个jina-reader技能

  • 安装后有一个提示,说被 VirusTotal标志为可疑技能,直接安OpenClaw审查一下代码

  • 审查完,再看一下技能文档,看看有什么功能

  • 看功能基本满足需求,去https://jina.ai获取一个API Key,让OpenClaw自己配置一下,再去测试一下搜索功能

  • 到此jina.ai技能基本搞定,也能使用了。

三、Jina 与 Tavily 对比

特性 Tavily Jina AI (Reader/Search)
核心定位 专为 LLM 优化的搜索引擎 API​。旨在直接给 Agent 提供经过筛选、去重、摘要的高质量搜索结果,减少幻觉。 网页内容提取与转换工具​。旨在将任意 URL 转换为 LLM 易读的纯净文本(Markdown),同时也提供基础搜索功能。
输出 直接返回 JSON 格式,包含标题、摘要、得分、URL 等字段,无需 Agent 再次清洗数据即可输入给 LLM 支持返回 Markdown、纯文本、HTML 甚至截图,灵活适配不同多模态模型的需求
成本 ​作为商业闭源服务,高级功能(如深度研究、高频调用)费用相对较高,免费额度有限1000次/月 ​非常慷慨的免费额度,且定价策略通常比专用搜索引擎更具吸引力,特别是对于大量读取内容的场景。
是否支持中文

二者也也可以一起结合使用。

  1. Agent 首先调用 Tavily 进行广度搜索,获取 top 5 相关链接和简要背景。
  2. 如果任务需要深入细节,Agent 自动将这 5 个链接发给 Jina Reader 获取全文。
  3. LLM 基于全文进行最终的综合推理和回答。

这种“Tavily 发现 + Jina 阅读”的组合拳,能最大程度发挥两者的优势。

相关阅读:
OpenClaw 用 Tavily Skill 检索网页信息

0
  1. 支付宝打赏

    qrcode alipay
  2. 微信打赏

    qrcode weixin

评论区