NanmiCoder

MediaCrawler

NanmiCoder

小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫、百度贴吧帖子 | 百度贴吧评论回复爬虫 | 知乎问答文章|评论爬虫

AI 简介

MediaCrawler 是一个用于从多个主流自媒体平台抓取公开信息的多平台数据采集工具。它支持小红书、抖音、快手、B站、微博、贴吧和知乎等平台的数据抓取,包括笔记、视频、帖子及其评论。该项目基于 Playwright 浏览器自动化框架实现登录态保存,无需复杂的JavaScript逆向工程,从而降低了使用门槛。此外,MediaCrawler 还提供了关键词搜索、指定ID爬取、二级评论获取等功能,并支持IP代理池及生成词云图,适用于社交媒体分析、市场研究以及内容监控等多种场景。请注意,项目仅供学习与参考,禁止用于商业或非法目的。

Python
Other
51k
Stars
10.7k
Forks
220
Watchers
153
Issues

Star 增长

今日+65
近 7 天+392
近 30 天+1821
综合评分120
默认分支main