jhy

jsoup

jhy

jsoup: the Java HTML parser, built for HTML editing, cleaning, scraping, and XSS safety.

AI 简介

jsoup 是一个用于处理真实世界 HTML 和 XML 的 Java 库。它提供了易于使用的 API,支持 URL 获取、数据解析、提取和使用 DOM API 方法、CSS 以及 XPath 选择器进行操作。该项目遵循 WHATWG HTML5 规范,并且能够像现代浏览器一样解析 HTML。核心功能包括从 URL、文件或字符串中抓取和解析 HTML,通过 DOM 遍历或 CSS 选择器查找并提取数据,修改 HTML 元素、属性和文本内容,以及通过安全列表清理用户提交的内容以防止 XSS 攻击。jsoup 适用于需要对网页进行爬虫抓取、内容清洗及安全性处理的场景,如 Web 开发、数据分析等。

Java
MIT License
11.4k
Stars
2.3k
Forks
391
Watchers
3
Issues

Star 增长

今日+1
近 7 天+4
近 30 天+14
综合评分75.4
默认分支master