当前位置: 首页 > 文档资料 > JSoup 中文教程 >

概述

优质
小牛编辑
133浏览
2023-12-01

jsoup是一个基于Java的库,用于处理基于HTML的内容。 它提供了一个非常方便的API来提取和操作数据,使用最好的DOM,CSS和类似jquery的方法。 它实现了WHATWG HTML5规范,并将HTML解析为与现代浏览器相同的DOM。

jsoup libary实现了WHATWG HTML5规范,并根据现代浏览器将HTML内容解析到相同的DOM。

jsonp库提供以下功能。

  • Multiple Read Support - 它使用URL,文件或字符串读取和解析HTML。

  • CSS Selectors - 它可以使用DOM遍历或CSS选择器查找和提取数据。

  • DOM Manipulation - 它可以操作HTML元素,属性和文本。

  • Prevent XSS attacks - 它可以针对给定的安全白名单清除用户提交的内容,以防止XSS攻击。

  • Tidy - 它输出整洁的HTML。

  • Handles invalid data - jsoup可以处理未关闭的标记,隐式标记并可以可靠地创建文档结构。