分享web开发知识

注册/登录|最近发布|今日推荐

主页 IT知识网页技术软件开发前端开发代码编程运营维护技术分享教程案例
当前位置:首页 > 教程案例

Jsoup 配置和使用

发布时间:2023-09-06 02:15责任编辑:林大明关键词:配置

基于Java的html解析器Jsoup的简单介绍

Jsoup 下载

Jsoup是一个基于Java的HTML解析器,可直接解析某个URL地址、HTML文本内容。

  • 使用Maven下载:
    (Maven使用可以参照以往的博客)
 ???????<!-- https://mvnrepository.com/artifact/org.jsoup/jsoup --> ???????<dependency> ???????????<groupId>org.jsoup</groupId> ???????????<artifactId>jsoup</artifactId> ???????????<version>1.9.2</version> ???????</dependency>
  • 官网Jsoup

Jsoup 使用

特点:

  • 没有关闭的标签 (比如:

    Lorem

    Ipsum parses to

    Lorem

    Ipsum

    )
  • 隐式标签 (比如. 它可以自动将 Table data包装成
    ?)
  • 创建可靠的文档结构(html标签包含head 和 body,在head只出现恰当的元素)
  1. 1 Jsoup.parse(String html)和Jsoup.parse(String html, String baseUri); // 解析一个HTMl字符串
  2. 2 Jsoup.parseBodyFragment(String html); // 解析一个body片断
  3. 3 Jsoup.connect(String url); //从一个URL解析一个Document 可以通过选择器来查找元素
  4. 4 Jsoup.parse(File in, String charsetName, String baseUri); //从本地加载一个文档

  • 解析一个HTMl字符串
 ????????String html = "<html><head><meta charset=‘UTF-8‘><title>three.js</title></head><body>"+ ???????????????????????"<script type=‘text/javascript‘ src=‘js/Three/three.js‘></script>"+ ????????????????????????"<script></script></body></html>"; ?????????Document doc = Jsoup.parse(html); ?????????System.out.println(doc); ????????

output:

 ???????<html> ????????<head> ?????????<meta charset="UTF-8" /> ?????????<title>three.js</title> ????????</head> ????????<body> ?????????<script type="text/javascript" src="js/Three/three.js"></script> ?????????<script></script> ????????</body> ???????</html>
  • 解析一个URL,这里我们解析的是Google的首页的登陆按钮(按钮id:gb_70)然后回去按钮的文本。
 ????????Document google = Jsoup.connect("https://www.google.com.hk/").get(); ??????????????????Element login = google.getElementById("gb_70"); ?????????????????System.out.println(login.text()); ????????

output:登入

Jsoup 配置和使用

原文地址:https://www.cnblogs.com/chenjy1225/p/9661350.html

知识推荐

我的编程学习网——分享web前端后端开发技术知识。 垃圾信息处理邮箱 tousu563@163.com 网站地图
icp备案号 闽ICP备2023006418号-8 不良信息举报平台 互联网安全管理备案 Copyright 2023 www.wodecom.cn All Rights Reserved