中山市网站制作,青山网站建设,网络服务费绩效目标申报表,河南住房和城乡建设厅职称网站1.Jsoup是什么#xff1a; 是HTML的解析器,可以解析URL地址#xff0c;HTML的文本内容#xff0c;可以使用DOM,CSS以及类似Jquery的操作方法来操作数据
2.Jsoup的作用 1.通过URL或者文件或者字符串获取到HTML页面并解析 2.使用DOM或CSS等操作来对数据进行操作 3.可以操作HT…1.Jsoup是什么 是HTML的解析器,可以解析URL地址HTML的文本内容可以使用DOM,CSS以及类似Jquery的操作方法来操作数据
2.Jsoup的作用 1.通过URL或者文件或者字符串获取到HTML页面并解析 2.使用DOM或CSS等操作来对数据进行操作 3.可以操作HTML元素
3.通过Jsoup获取文档对象 每一个HTML都是一个文档对象document对象里面包含很多元素或者元素集合Element或者Elements 1.使用Jsoup进行URL的解析 既然要通过URL进行HTML的获取那第一步肯定是先通过URL获取到网页内容了使用parse方法
Document document Jsoup.parse(new URL(https://www.loyo.cc/xianggangju/wohejiangshiyougeyuehuiguoyudiyibu/2-24.html),5000);2.使用Jsoup可以进行html标签代码的解析 也是用parse方法参数是String类型的html代码这里使用的是一个文件里面的HTML标签代码 我需要先把文件里面的字符串提取出来采用FileUtils类的readFileToString方法参数是文件和编码方式
String content FileUtils.readFileToString(new File(urlAddress),utf-8);
Document document Jsoup.parse(content); 3.使用Jsoup可以进行html文件的解析 还是使用parse方法第一个参数是文件第二个参数是编码方式
Document document Jsoup.parse(new File(urlAddress),utf-8); 4.为了要操作页面的元素可以使用Document对象的方法获取到页面某些标签 1.getElementByTag()方法可以根据标签名字来获取标签 这里使用getElementByTag()获取title标签之后选中获取到的这一堆标签里面的第一个标签(.first)然后输出他标签内部的文本内容(.text)
String titleText document.getElementsByTag(title).first().text();