优米格
分享有营养的

ScrapeGraphAI - v1.6.0 基于AI的Python抓取工具

BraUndress.png

基于AI的爬虫工具,项目开源。

一、介绍

一个开源的网络搜刮 python 库,通过整合 LLM 和直接图逻辑,可自动创建网站和各种本地文档(XML、HTML、JSON 等)的搜刮管道。

只需说出您要提取的信息,即可自动提取,可通过接口(OpenAI、Groq、Azure、Gemini)或使用 Ollama 的本地模型来使用不同的 LLM。

抓取通道有三种:

  • SmartScraperGraph :只需要用户提示和输入源的单页抓取工具;
  • SearchGraph :从搜索引擎的前 n 个搜索结果中提取信息的多页抓取工具;
  • SpeechGraph :从网站中提取信息并生成音频文件的单页抓取工具。

二、快速安装

pip install scrapegraphai

playwright install

使用文档: https://scrapegraph-doc.onrender.com/

三、预览

2024-05-17_120733.jpeg

四、地址

项目地址: https://github.com/VinciGit00/Scrapegraph-ai
在线试用: Google Colab

赞(0)
未经允许禁止转载:优米格 » ScrapeGraphAI - v1.6.0 基于AI的Python抓取工具

评论 抢沙发

合作&反馈&投稿

商务合作、问题反馈、投稿,欢迎联系

广告合作侵权联系