当前位置: 首页 > news >正文

网站备案 前置审批文件wordpress 查询条件

网站备案 前置审批文件,wordpress 查询条件,网站模板文件扫描,新乡做网站推广的前言 爬虫需要基础知识#xff0c;HTTP协议只是个开始#xff0c;除此之外还有很多#xff0c;我们慢慢来记录。 今天的HTTP协议#xff0c;会有助于我们更好的了解网络。 一、什么是HTTP协议 #xff08;1#xff09;定义 HTTP#xff08;超文本传输协议#xff…前言 爬虫需要基础知识HTTP协议只是个开始除此之外还有很多我们慢慢来记录。 今天的HTTP协议会有助于我们更好的了解网络。 一、什么是HTTP协议 1定义 HTTP超文本传输协议HyperText Transfer Protocol是用于在网络上进行数据通信的协议尤其是用于网页的传输。 简单来说就是专门把超文本数据从网络上传输到本地浏览器上的一个协议 我们也经常见它比如网站前面的前缀 当然上图有些不太正确但 HTTPS 其实是HTTP的升级版二者其实差不太多。 2HTTPS 那么HTTPS到底有什么不同呢 HTTPS的全称是Hypertext Transfer Protocol Secure。相较于HTTP多了一个Secure 所以我们应该知道哪里升级了。 简单来说就是在HTTP的基础上通过传输加密和身份认证保证了传输过程的安全性 TipsHTTPS 主要由两部分组成HTTP SSL / TLS也就是在 HTTP 上又加了一层处理加密信息的模块。服务端和客户端的信息传输都会通过 TLS 进行加密所以传输的数据都是加密后的数据。了解即可 3URI和URL 还有些专业术语诸如URI和URL  URI统一资源标识符用于标识资源的字符串。URL统一资源定位符一种特定类型的URI用于定位资源并提供如何访问这些资源的信息。URN统一资源名称 顾名思义URI让我们可以唯一标识一个资源。URL则让我们可以去定位一个资源。 比如一个网址https://www.example.com 我们可以把这整个链接叫做URI因为这个网址标识了一个资源。 而这个链接也叫做URL因为这个网址的链接也同样定位了一个资源。 那他们怎么区分呢  URI包括了URL因为URIURL和URN。 比如一本书的编号111这个编号就是URN。 所以该编号也可以叫做URI因为它同样标识了一个资源但是它不能叫做URL了因为该编号并没有定位这个资源我们只知道它叫什么却不知道去哪里可以找到他。 二、HTTP请求过程 1请求过程 我们在网页最上面的导航栏上输入网址按下回车然后出现一个新网页。 这个过程就是浏览器向某网站发送了一个请求然后网站进行处理最后网站回馈一个响应浏览器解析后展现出来。 2相关名词介绍 注以下名词了解即可  为了更好的说明该过程我们可以鼠标右键用检查功能来具体显示一下请求和响应 然后切换到Network面板再刷新一下网页 即可看到很多行的东西每一行就代表一次  请求-响应  过程 我们仔细观察这个界面的各列 其中各列含义如下 Name请求界面的名称Status响应状态码通过状态码显示可以判定响应是否正常。Type请求文档的类型。Initiator请求源用来标记是哪个对象或进程发起的请求。Size请求资源大小如果是缓存中提取的资源该列显示from cacheTime从发起请求到获得响应所花总时间。Waterfall网络请求可视化瀑布流。有时会有Protocol请求协议类型http1.1代表HTTP1.1版本h2代表HTTP2.0版本 若单击某列则会显示更详细的信息 在General部分 Request URL 请求的URLRequest Method请求方法Status Code响应状态码Remote Address远程服务器的地址和端口Referre Policy为判别策略Response Headers响应头Request Headers请求头 以上名词可能有些说的不太清楚现在我们具体来看一看各部分到底是干什么的 三、请求部分 请求即Request。 由用户发往服务器的信息。包括四大部分请求方法、请求网址、请求头、请求体。  1请求方法 请求方法客户端请求服务器时的方式 常见的有两种GET请求、POST请求 比如 GET请求 请求获取指定资源如请求页面返回内容 当我们在浏览器最上面输入网址并按下回车这就是发起了GET请求。 POST请求 向指定资源提交数据通常用于表单提交或者上传文件。 当我们登陆网站输入账号密码后点击提交后这就是发起了POST请求。 那么二者有什么具体区别呢 GET请求的参数包括在URLPOST请求的数据包括在请求体中。 所以如果打开某网站某板块某界面的某图片后这时我们会在上面的网址中看到该图片的路径这就是GET请求该图片的参数GET请求提交数据最大1024字节POST请求没有限制。 所以综上当我们提交账号密码时最好选择POST否则GET会将密码显示在网址中暴露哦~ 当然除此之外还有很多请求不过并不常用汇总如下 GET请求获取指定资源。GET 请求不应包含请求体且一般用于获取数据。POST向指定资源提交数据通常用于表单提交或者上传文件。POST 请求可以包含请求体用于传送数据。PUT向指定资源上传数据通常用于更新资源的状态。PUT 请求一般是幂等的即多次相同的请求会得到相同的结果。DELETE请求删除指定资源。PATCH部分更新指定资源的数据。与 PUT 的区别是PATCH 只更新资源的一部分而 PUT 会替换整个资源。HEAD类似 GET 请求但只获取响应的头部信息不返回实际的资源数据。OPTIONS请求服务器询问支持哪些 HTTP 方法。常用于跨域请求中的预检请求。 2请求网址 网址格式如下 协议://主机名:端口号/路径?查询字符串#片段标识符 说明 协议Scheme指定访问资源所使用的协议。常见的协议包括 http 或 https超文本传输协议、 ftp文件传输协议、 mailto用于电子邮件地址、 file本地文件主机名Host指定资源所在的服务器的域名或 IP 地址。 通常为一个域名如 www.example.com 或者是 IP 地址如 192.168.1.1。端口号Port可写可不写指定服务器的端口通常省略。 默认情况下http 默认端口为 80、https 默认端口为 443。 如果指定了非默认端口则需要在主机名后加上端口号用冒号分隔如 www.example.com:8080。路径Path指定请求资源在服务器上的位置。 例如/products/123 表示访问 /products/123 这个路径的资源。查询字符串Query可写可不写以 ? 开头包含一个或多个键值对用于传递参数。 例如?id123nameabc查询字符串由参数名和值组成多个参数用  分隔。片段标识符Fragment可写可不写以 # 开头指向文档中的一个特定位置。 用于指定页面内的某个部分。例如#section2 指向页面的第二个部分。 举个例子 https://www.example.com:8080/products/123?id456colorred#review 解释  协议https主机名www.example.com端口号8080路径/products/123查询字符串?id456colorred片段标识符#review 3请求头 请求头是 HTTP 请求中的一部分它包含了关于客户端、请求以及数据的附加信息。 客户端通过它向服务器传递元数据帮助服务器理解请求的内容、用户的偏好、客户端环境等。 举个例子 请求头就像你在向别人请求东西时提供的一些附加信息。 假设你在网上买东西除了告诉商家你想买的产品还会提供一些其他信息比如 你用的是什么设备是手机还是电脑 你能接受的商品类型比如希望商品图片清晰或者只想看某种品牌的商品 这些附加信息就像是请求头里的内容它们帮助商家服务器了解你具体的需求确保你能收到最合适的产品。 所以你要访问一个网页你的请求头可能包含以下信息 注了解即可  1. Host 指定请求的服务器域名或 IP 地址。从 HTTP/1.1 版本开始这是必需的头部字段。 示例Host: www.example.com 2. User-Agent 简称UA。表示发送请求的客户端软件类型如浏览器、操作系统等。爬虫时加上此部分可以伪装成浏览器。 示例User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 3. Accept 指定客户端能够处理的响应内容类型。通常用于指定请求的数据格式 示例Accept: text/html, application/xhtmlxml, application/xml;q0.9, image/webp,*/*;q0.8 4. Accept-Language 告诉服务器客户端能够理解的语言。例如可以告诉服务器希望获取中文或英文的内容。 示例Accept-Language: en-US,en;q0.5 5. Content-Type 仅在请求体中有数据时使用指定请求体的媒体类型。例如表单提交时数据的格式是 application/x-www-form-urlencoded上传文件时是 multipart/form-data。 示例Content-Type: application/json 6. Authorization 用于身份验证携带认证信息如令牌或基本认证信息。常用于需要用户验证的资源。 示例Authorization: Bearer token 7. Cookie 客户端向服务器发送的 Cookie 信息服务器根据该信息识别用户状态如登录状态。 示例Cookie: sessionidabc123; userJohnDoe 8. Accept-Encoding 告诉服务器客户端支持的编码方式通常用于压缩响应体。 示例Accept-Encoding: gzip, deflate, br 9. Connection 表示是否保持持久连接决定在请求完成后是否保持与服务器的连接。 示例Connection: keep-alive 10. Referer 表示来自哪个 URL 的请求通常用于了解用户访问的来源页面。 示例Referer: https://www.example.com/previous-page 4请求体 请求体是 HTTP 请求中的一部分主要用于携带客户端发送给服务器的实际数据内容。 可以理解为你在向服务器请求某项服务时所附带的具体信息或者数据。 举个例子 如果你填写了一个网上表单提交了你的个人信息比如名字、地址、电子邮件等这些信息就是通过请求体发送到服务器的。 Tips对于请求体来说一般是POST请求的表单数据对于GET请求请求体为空 对于请求头和请求体的区别 请求头 包含一些附加信息比如浏览器类型、请求语言、是否有登录状态等 帮助服务器理解如何处理请求。请求体 包含实际的数据内容是请求的核心部分 比如你提交的表单数据、上传的文件等。 四、响应部分 响应即Response。 由服务器给用户的信息。包括三部分响应状态码、响应头、响应体。 1响应状态码 就像前文所说这就是根据给出的数字来判定响应是否正常。 比如200表示正常、404表示找不到等都是常见状态码。 下面汇总了常见的状态码及错误原因 1. 1xx信息性状态码 这些状态码表示请求已被接收正在继续处理。 100 Continue表示客户端可以继续发送请求的其余部分通常用于大文件上传时客户端先发送请求头服务器返回 100 状态码客户端再发送请求体。 2. 2xx成功状态码 这些状态码表示请求已成功被处理。 200 OK请求成功服务器返回请求的资源。 201 Created请求成功服务器创建了新的资源通常用于 POST 请求。 204 No Content请求成功但服务器没有返回任何内容常见于删除操作。 3. 3xx重定向状态码 这些状态码表示请求需要进一步的操作才能完成通常是页面重定向。 301 Moved Permanently请求的资源已被永久移到新的位置响应中会带有新的 URL。 302 Found请求的资源临时移动到其他位置客户端会按照新 URL 继续请求。 304 Not Modified资源未修改客户端可以使用缓存的副本。 4. 4xx客户端错误状态码 这些状态码表示请求有错误客户端需要修正请求后再试。 400 Bad Request请求无效服务器无法理解请求。 401 Unauthorized请求未授权通常需要提供身份验证如登录。 403 Forbidden服务器拒绝请求即使用户已认证。 404 Not Found请求的资源不存在或无法找到。 405 Method Not Allowed请求方法不被允许例如服务器只允许 GET 请求但客户端使用了 POST 请求。 5. 5xx服务器错误状态码 这些状态码表示服务器未能完成有效请求通常是服务器本身的问题。 500 Internal Server Error服务器遇到错误无法完成请求。 502 Bad Gateway服务器作为网关或代理时收到来自上游服务器的无效响应。 503 Service Unavailable服务器暂时无法处理请求通常是因为服务器超负荷或正在维护。 504 Gateway Timeout服务器作为网关或代理时未能在规定时间内从上游服务器获取响应。 2响应头 响应头是服务器在响应客户端请求时附加在响应消息中的一些信息。 这些信息主要用于描述服务器的处理结果、返回的数据类型、缓存策略等。 可以理解为服务器对客户端请求的“回馈”信息告诉客户端服务器的状态、资源类型等。 下面为常用响应头 Content-Type指定响应体的内容类型即数据的格式。例如 Content-Type: text/html返回的是 HTML 内容。Content-Type: application/json返回的是 JSON 格式数据。Content-Type: image/png返回的是 PNG 图片。 Content-Length表示响应体的大小以字节为单位 Date返回响应的时间戳表示服务器响应的日期和时间 Server表示服务器的类型和版本 Set-Cookie服务器向客户端发送的 cookie用于保存客户端的状态信息。 3响应体 响应体是服务器在响应客户端请求时返回给客户端的实际数据内容。 举个例子 比如你请求一个网页时响应体就是返回的 HTML 内容你请求某个数据接口时响应体就是返回的 JSON 数据。 如下图所示 当我们打开Preview中看到的蓝框内的内容就是响应体。 在爬虫时我们要做的就是解析它 它的常见内容有 HTML 页面如果你请求一个网页响应体通常是该网页的 HTML 内容。 例如浏览器向服务器请求 https://example.com服务器返回一个 HTML 页面响应体就是网页的 HTML 代码。 JSON 数据在许多现代 Web 应用中通常使用 JSON 格式。 例如发送一个 GET 请求到一个数据接口返回的响应体是 JSON 数据 { name: John Doe, age: 30 } 图片或文件如果请求的是一个文件如图片、视频等响应体包含文件的内容。 例如浏览器请求一个 PNG 图片服务器返回响应体其中包含该图片的二进制数据。 文本内容如果请求的是纯文本数据响应体可能直接是一些文本内容。
http://www.dnsts.com.cn/news/274027.html

相关文章:

  • 网站备案要多久唐山建网站的公司
  • 北京市建设教育协会网站网站建设域名跳转博客
  • 做网站销售的网络营销专员岗位职责
  • 做图片推广的网站获取网站缩略图
  • 网站域名想更换要怎么做不需要网站备案的空间
  • 网站推广员怎么做山西网站建设方案
  • 苏州网站关键词优化wordpress 连接qq视频
  • 专业做网站建设的公司常州网站制作培训
  • 长沙网站建设大全青岛做网站的公司
  • 大网站用wordpress吗网站品牌推广公司
  • 坂田网站建设公司桂林分销网站开发
  • 来推网站网站建设方案书内容管理制度
  • 懒人手机网站模板网站开发有几种
  • 门户网站 特点百度只收录wordpress
  • 188自助建站系统定制柜子多少钱一平方
  • 图片演示dw做网站商业网站建设案例课程
  • 吉林省四平市网站建设嘉兴市建设监理协会网站
  • 在韶关做网站建设官方网站企业登录
  • 网站建设工作总结范文邢台网络问政
  • 电商网站开发报价单网站用什么系统好用
  • 网站背景音乐怎么做汕头老城图片
  • 赤峰做网站多少钱做论文常用网站
  • 甘肃省级建设主管部门网站网络游戏的特点
  • 不同代码做的网站后期维护情况网站竞价推广
  • app关键词排名优化徐州seo企业
  • 企业建站哪个好优化游戏的软件
  • 观山湖制作网站wordpress胖子马
  • 网站建设中管理员登录的代码怎么写本地电脑如何做网站服务器
  • 随州网站建设优化推广渠道企业网站建设方案流程
  • vue 做自适应网站收录查询工具