当前位置: 首页 > news >正文

网站建设开票写什么网站发布与推广怎么写

网站建设开票写什么,网站发布与推广怎么写,免费cms内容管理系统,当地建设厅网站关于用Java进行爬虫的资料网上实在少之又少#xff0c;但作为以一名对Java刚刚初窥门径建立好兴趣的学生怎么能静得下心用新学的Python去写#xff0c;毕竟Java是世界上最好的语言嘛 (狗头)关于Java爬虫最受欢迎的一个框架Jsoup常常搭配HttpClient来使用#xff0c;因为Jsou…关于用Java进行爬虫的资料网上实在少之又少但作为以一名对Java刚刚初窥门径建立好兴趣的学生怎么能静得下心用新学的Python去写毕竟Java是世界上最好的语言嘛 (狗头)关于Java爬虫最受欢迎的一个框架Jsoup常常搭配HttpClient来使用因为Jsoup.connect(url)下载网页没有多次重试的功能所以我们更多的使用HttpClient来进行网页的下载而Jsoup则更多的用来解析网页。比较专业的事还得专业的人来干对于下载网页我们没必要每次都花费大把的时间去写直接写一个工具类在Jsoup中直接调用即可关于HttpClient关于HttpClient主要有两个版本org.apache.http.client.HttpClient 3.Xorg.apache.commons.httpClient.HttpClient 4.X相比较4.X的功能更加丰富简洁但3.x也不差下面拿3.x举例HttpClient实例代码package com.Jsoup;import org.apache.commons.httpclient.DefaultHttpMethodRetryHandler; import org.apache.commons.httpclient.HttpClient; import org.apache.commons.httpclient.HttpStatus; import org.apache.commons.httpclient.methods.GetMethod; import org.apache.commons.httpclient.params.HttpMethodParams;import java.io.IOException;//下载网页工具,返回html对象 public class HttpUtil {static String fileName null;static String content;/*** 获取网页主体内容完成HttpClient的下载任务剩下的交给Jsoup来解析* param url URL地址* param charset 设置编码格式* return 返回网页 html内容 * throws IOException 抛出IO异常*/public static String getContent(String url,String charset) throws IOException {//1.创建客户端对象并设置参数HttpClient httpClient new HttpClient();//设置 Http 超时httpClient.getHttpConnectionManager().getParams().setConnectionTimeout(2000);//2.生成GetMethod对象并设置参数GetMethod getMethod new GetMethod(url);//设置 Get 请求超时getMethod.getParams().setParameter(HttpMethodParams.SO_TIMEOUT,2000);getMethod.getParams().setContentCharset(charset);//设置请求重试处理-这是使用HttpClient下载网页而不用Jsoup的原因getMethod.getParams().setParameter(HttpMethodParams.RETRY_HANDLER,new DefaultHttpMethodRetryHandler());//设置头信息//getMethod.getParams().setParameter(HttpMethodParams.USER_AGENT,需要添加的代理信息);//3.执行 Get 请求int statusCode httpClient.executeMethod(getMethod);//判断访问的状态码if (statusCode ! HttpStatus.SC_OK){System.err.println(请求失败: getMethod.getStatusLine());fileName null;}else {//4.处理 HTTP 响应内容//获得响应体内容content getMethod.getResponseBodyAsString();}//5.释放连接getMethod.releaseConnection();//输出到控制台//System.out.println(content);return content;}} 注意这里的用户代理User-Agent需要按需求设置后期可能需要设置大量的代理我们将设置一个Use-Agent库每次执行爬虫任务将从中随机选取一个防止被网站封锁Jsoup代码public class JsoupDemo01 {public static void main(String[] args) throws IOException {String url https://xxxx.com;String html HttpUtil.getContent(url,UTF-8);//Jsoup.parse(String html)可以根据html文档来解析Document doc Jsoup.parse(html);//具体解析网页不做展示之后更新} }
http://www.dnsts.com.cn/news/84146.html

相关文章:

  • 企业建网站程序redis wordpress 提速
  • 做兼职的国外网站五力合一营销型网站建设系统
  • 网站建设及推广套餐国外的设计网站
  • 比较好的logo设计网站影院禁止18岁以下观众观影
  • 云霄网站建设专做影视评论的网站
  • 厦门同安网站建设网站推广去哪家比较好
  • 免费制作个人网站app网店代运营公司哪家强
  • 网站建设需要c语言吗中国机械加工网18易8下4拉hu
  • 传奇怎么建设自己的网站移动网站建设制作
  • 网站插件代码怎么用wordpress采集器
  • 安亭网站建设淄博品先网络科技有限公司
  • 青海高端网站建设中铁快运关于网站建设
  • 怎么弄个人网站大型网站建设哪里济南兴田德润实惠吗
  • 网站建设 需要ae吗游戏平台网站开发
  • 化妆品网站开发流程和进度安排门户网站特点
  • 如今做知乎类网站怎么样营销技巧第二季
  • 建设银行网站的机构深圳创建公司要多少钱
  • 加强残联网站建设开一家软件开发公司需要什么
  • 客户案例 网站设计企业建设网站的需求分析
  • 阿里巴巴国际站下载电脑版英文seo网站建设
  • 黄石城乡建设网站可以做cps合作的棋牌网站6
  • 机票网站开发知乎艺术家个人网站设计
  • 做360手机网站优化快免费咨询服务合同模板
  • 织梦做的的网站首页显示空白w网站链接如何做脚注
  • 上海金山网站建设创网中国的网站
  • 任丘市网站建设价格推广软件赚钱违法吗
  • 做地方门户网站怎样四川住房和城乡建设厅官网安全员
  • html5 jsp做网站可以么郑州网站制作生产厂商定制
  • 做国外商品的网站重庆建设官网
  • 海南网站制做的公司中国建设银行河北省门户网站