
crawl4ai
unclecode
🚀🤖 Crawl4AI: Open-source LLM Friendly Web Crawler & Scraper. Don't be shy, join here: https://discord.gg/jP8KfhDhyN
AI 简介
Crawl4AI 是一个开源的、对大语言模型友好的网页爬虫和数据抓取工具。它能够将网页内容转换为干净的Markdown格式,适用于检索增强生成(RAG)、代理及数据流水线等场景。该项目采用Python编写,具备快速可控、支持反爬虫检测与Shadow DOM处理等功能,并且经过了超过5万星标社区的实战检验。Crawl4AI特别适合需要从网络上大规模提取信息并将其结构化以供进一步分析或使用的开发者和研究人员。
Python
Apache License 2.068.3k
Stars
7k
Forks
374
Watchers
21
Issues
Star 增长
今日+70
近 7 天+504
近 30 天+2936
综合评分120
默认分支main