当前位置: 首页 > news >正文

郑州企业做网站成都旅游公司排名前十

郑州企业做网站,成都旅游公司排名前十,短视频seo询盘系统,网站怎么做出来的jsoup解析html之table表格 jsoup说明 一款Java 的HTML解析器 jsoup 是一款Java 的HTML解析器#xff0c;可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API#xff0c;可通过DOM#xff0c;CSS以及类似于jQuery的操作方法来取出和操作数据。 主要功能 从一…jsoup解析html之table表格 jsoup说明 一款Java 的HTML解析器 jsoup 是一款Java 的HTML解析器可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API可通过DOMCSS以及类似于jQuery的操作方法来取出和操作数据。 主要功能 从一个URL文件或字符串中解析HTML使用DOM或CSS选择器来查找、取出数据可操作HTML元素、属性、文本 需求说明 现在需要从上游过来一批数据我们解析之后做一些逻辑处理批量录入数据库这些数据就是excel一条一条的只不过它不是标准的xls或者xlsx形式而是处理过的html格式加工成xls格式如果我们使用easypoi或者easyexcel解析会出现错误提示java.io.IOException: Your InputStream was neither an OLE2 stream, nor an OOXML stream,简而言之就是这两个解析框架不识别不是标准的xls或者xlsx解决方法就是从上游导出的数据先保存为标准的xls后者xlsx形式不会出现问题但是但是现在需要从程序上进行控制。 代码操作 核心api Jsoup The core public access point to the jsoup functionality. Parse HTML into a Document. The parser will make a sensible, balanced document tree out of any HTML. Document 文档对象。每份HTML页面都是一个文档对象Document 是 jsoup 体系中最顶层的结构。 Element元素对象。一个 Document 中可以着包含着多个 Element 对象可以使用 Element 对象来遍历节点提取数据或者直接操作HTML。 Elements元素对象集合类似于List。 核心方法 eachText() /*** Get the text content of each of the matched elements. If an element has no text, then it is not included in the* result.* return A list of each matched elements text content.* see Element#text()* see Element#hasText()* see #text()*/public ListString eachText() {ArrayListString texts new ArrayList(size());for (Element el: this) {if (el.hasText())texts.add(el.text());}return texts;}select() /*** Find matching elements within this element list.* param query A {link Selector} query* return the filtered list of elements, or an empty list if none match.*/public Elements select(String query) {return Selector.select(query, this);}1.select()方法在Document、Element或Elements对象中都可以使用而且是上下文相关的因此可实现指定元素的过滤或者采用链式访问。 2.select() 方法将返回一个Elements集合并提供一组方法来抽取和处理结果。 // 从文件流中获取html解析public static Document parse(InputStream in, String charsetName, String baseUri) throws IOException {return DataUtil.load(in, charsetName, baseUri);}// 从文件中获取html解析public static Document parse(File in, String charsetName) throws IOException {return DataUtil.load(in, charsetName, in.getAbsolutePath());}public static Document parse(File in, String charsetName, String baseUri) throws IOException {return DataUtil.load(in, charsetName, baseUri);}public static Document parse(InputStream in, String charsetName, String baseUri, Parser parser) throws IOException {return DataUtil.load(in, charsetName, baseUri, parser);} package com.geekmice.springbootselfexercise.utils;import java.io.IOException; import java.io.InputStream; import java.nio.charset.StandardCharsets; import java.util.HashMap; import java.util.List; import java.util.Map; import java.util.Objects;import com.geekmice.springbootselfexercise.exception.UserDefinedException; import lombok.extern.slf4j.Slf4j; import org.apache.commons.collections4.CollectionUtils; import org.apache.poi.ss.formula.functions.T; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements;/*** BelongsProject: spring-boot-self-exercise* BelongsPackage: com.geekmice.springbootselfexercise.utils* Author: pingmingbo* CreateTime: 2023-08-13 17:16* Description: 解析html* Version: 1.0*/ Slf4j public class ParseHtmlUtil {public static final String ERROR_MSG error mg:【{}】;/*** param inputStream 文件流* return 解析好的数据list* throws IOException* description 根据文件流解析html格式的excel* 问题说明去除第一行标题空行空格空指针问题*/public static ListString parseHandle(InputStream inputStream) {Document document;try {document Jsoup.parse(inputStream, StandardCharsets.UTF_8.toString(), );} catch (IOException e) {log.error(ERROR_MSG, e);throw new UserDefinedException(e.toString());}Elements trList document.select(table).select(tr);ListString abcList trList.eachText();if (CollectionUtils.isEmpty(abcList)) {throw new UserDefinedException(解析文件文件内容不存在);}abcList.remove(0);return abcList;}}效果展示 {msg: 操作成功,code: 200,data: [2023-07-28 00:15 上海 购方 0 0,2023-07-28 00:30 上海 购方 0 0,....2023-07-28 23:00 四川主网 售方 333.25 225.94,2023-07-28 23:15 四川主网 售方 463.25 224.16,2023-07-28 23:30 四川主网 售方 463.25 224.16,2023-07-28 23:45 四川主网 售方 463.25 224.16,2023-07-28 24:00 四川主网 售方 587.79 213.53] }
http://www.huolong8.cn/news/122904/

相关文章:

  • php框架做网站的好处用dw做网站首页
  • 互联网网站开发服务合同潜江资讯网手机
  • 濮阳微信网站建设茂名网站建设建站系统
  • 建设部网站资质深圳市盐田区建设局网站
  • 做印刷网站公司炫酷的电商网站设计
  • 邯郸网络科技公司电话seo在线培训课程
  • 网站有哪几种电子商务公司名字推荐
  • 优秀网站 要素外贸网站在哪做外链
  • 在上海总部互联网公司排名西安官网优化技术
  • 广州白云手机网站建设移动网站网上营业厅
  • 网站开发目的简介门窗 东莞网站建设
  • 小轲网站建设简述网站建设流程
  • 公益网站建设网站开发软件系统
  • 化妆品网站建设的论文宁波seo网络推广软件系统
  • 毕业设计做系统跟做网站哪个容易营销qq多少钱一个月
  • 国外的自建站平台是什么个人形象设计网站
  • 宏福建设集团有限公司网站高校廉洁文化建设网站
  • 湛江网站制作网站网站空间和数据库空间
  • 雄安建设集团 网站店面设计模板
  • 安陆建设局网站网站制作难度
  • 做语文高考题网站网站关键词密度查询
  • 如何提高 网站的点击量WordPress添加加载用时
  • 网站建设逻辑手机可以做网站
  • 提供网站建设工具淘客怎么用网站做
  • 网站建设项目申请ppt郑州网站建设到诺然
  • 苏州工业园区两学一做教育网站wordpress 图片备份
  • 制作网站在本机运行景观设计公司名字
  • 凡科做的网站推效果创网科技有限公司怎么样
  • 主流网站 技术网站建设所需美工
  • 上海做网站建设公司网络推广方法技巧