当前位置: 首页 > news >正文

重庆做网站建设网站建设与设计ppt模板下载

重庆做网站建设,网站建设与设计ppt模板下载,如何使用模板建设网站,西宁市建设网站公司Python 爬虫入门#xff08;七#xff09;#xff1a;requests 库的使用「详细介绍」 前言1. 初识 requests1.1 安装 requests 库1.2 发送 GET 请求1.3 发送 POST 请求 2. HTTP 请求详解2.1 请求方法2.2 请求头2.3 请求参数 3. 处理响应3.1 响应内容3.2 响应状态码3.3 响应头… Python 爬虫入门七requests 库的使用「详细介绍」 前言1. 初识 requests1.1 安装 requests 库1.2 发送 GET 请求1.3 发送 POST 请求 2. HTTP 请求详解2.1 请求方法2.2 请求头2.3 请求参数 3. 处理响应3.1 响应内容3.2 响应状态码3.3 响应头 4. 会话保持5. SSL 证书验证6. 使用代理7. 文件上传与下载7.1 文件上传7.2 文件下载 8. 处理复杂的网页9. 实战项目抓取数据9.1 项目需求9.2 项目步骤9.3 示例代码总结 前言 欢迎来到“Python 爬虫入门”系列的第七篇文章。本篇文章将详细介绍如何使用 requests 库进行网络请求包括发送各种类型的 HTTP 请求、处理响应、会话保持、SSL 证书验证、代理设置、文件上传与下载等内容。 在本篇文章的代码示例中我将使用https://jsonplaceholder.typicode.com 网站的数据这是一个提供假数据的免费 REST API 服务的网站。这个服务由 JSON Server 和 LowDB 支持每月提供约30亿次请求。它被称为 “JSONPlaceholder”常用于测试和原型设计。 requests 库是 Python 中最流行的 HTTP 库之一因其简单易用和功能强大而广受欢迎。如果你是一个爬虫开发新手本篇文章将帮助你全面掌握 requests库的用法从而提升你的爬虫开发技能。 1. 初识 requests 1.1 安装 requests 库 首先确保你已经安装了 requests 库。如果没有安装可以使用以下命令安装 pip install requests1.2 发送 GET 请求 我们先从最基本的 GET 请求开始。 import requests# 发送 GET 请求 response requests.get(https://jsonplaceholder.typicode.com/posts) print(response.status_code) # 输出状态码 print(response.json()) # 输出响应内容上面的代码向 https://jsonplaceholder.typicode.com/posts 发送了一个 GET 请求并打印出响应的状态码和内容。 1.3 发送 POST 请求 接下来我们来发送一个 POST 请求。 import requests# 发送 POST 请求 data {title: foo,body: bar,userId: 1 } response requests.post(https://jsonplaceholder.typicode.com/posts, jsondata) print(response.status_code) # 输出状态码 print(response.json()) # 输出响应内容在这个例子中我们向 https://jsonplaceholder.typicode.com/posts 发送了一个 POST 请求并附带了一些数据。 2. HTTP 请求详解 2.1 请求方法 requests 库支持多种 HTTP 请求方法包括 GET、POST、PUT、DELETE、HEAD、OPTIONS 等。 import requests# 发送 PUT 请求 data {id: 1,title: foo,body: bar,userId: 1 } response requests.put(https://jsonplaceholder.typicode.com/posts/1, jsondata) print(response.status_code) # 输出状态码 print(response.json()) # 输出响应内容发送 PUT 请求执行结果如下 import requests# 发送 DELETE 请求 response requests.delete(https://jsonplaceholder.typicode.com/posts/1) print(response.status_code) # 输出状态码发送 DELETE 请求执行结果如下 2.2 请求头 有时候我们需要在请求中添加一些头信息例如 User-Agent、Content-Type 等。 import requests# 添加请求头 headers {User-Agent: Mozilla/5.0,Content-Type: application/json } response requests.get(https://jsonplaceholder.typicode.com/posts, headersheaders) print(response.status_code) # 输出状态码 print(response.json()) # 输出响应内容2.3 请求参数 我们可以通过 URL 参数来传递数据。 import requests# 添加请求参数 params {userId: 1 } response requests.get(https://jsonplaceholder.typicode.com/posts, paramsparams) print(response.status_code) # 输出状态码 print(response.json()) # 输出响应内容执行结果如下 3. 处理响应 3.1 响应内容 响应内容可以是 JSON、文本、二进制数据等。 import requestsresponse requests.get(https://jsonplaceholder.typicode.com/posts/1)# 获取响应内容 print(response.text) # 以字符串形式输出 print(response.json()) # 以 JSON 形式输出 print(response.content) # 以二进制形式输出执行结果如下 3.2 响应状态码 我们可以通过响应对象的 status_code 属性来获取状态码。 3.3 响应头 响应头包含了很多有用的信息例如服务器类型、内容类型等。 import requestsresponse requests.get(https://jsonplaceholder.typicode.com/posts/1) print(response.headers)执行结果如下 4. 会话保持 使用 requests 库的会话对象可以在多个请求之间保持某些参数。 import requests# 创建会话对象 session requests.Session()# 设置会话级别的请求头 session.headers.update({User-Agent: Mozilla/5.0})# 发送请求 response session.get(https://jsonplaceholder.typicode.com/posts) print(response.status_code) print(response.json())5. SSL 证书验证 requests 库默认会验证 SSL 证书。你可以通过 verify 参数来控制这一行为。 import requests# 禁用 SSL 证书验证 response requests.get(https://jsonplaceholder.typicode.com/posts, verifyFalse) print(response.status_code)执行结果如下 6. 使用代理 在爬虫开发中使用代理可以帮助我们隐藏真实的 IP 地址。 import requestsproxies {http: http://10.10.10.10:8000,https: http://10.10.10.10:8000 }response requests.get(https://jsonplaceholder.typicode.com/posts, proxiesproxies) print(response.status_code)7. 文件上传与下载 7.1 文件上传 我们可以使用 requests 库轻松地上传文件。 import requests# 文件上传 files {file: open(example.txt, rb)} response requests.post(https://jsonplaceholder.typicode.com/posts, filesfiles) print(response.status_code) print(response.json())7.2 文件下载 同样地我们也可以下载文件。 import requestsresponse requests.get(https://jsonplaceholder.typicode.com/photos/1, streamTrue) with open(photo.jpg, wb) as file:for chunk in response.iter_content(chunk_size128):file.write(chunk) print(文件下载完成)8. 处理复杂的网页 对于一些复杂的网页我们可能需要处理 JavaScript 动态加载的内容。这时可以结合 requests 和 BeautifulSoup 库来实现。 import requests from bs4 import BeautifulSoupresponse requests.get(https://jsonplaceholder.typicode.com/) soup BeautifulSoup(response.text, html.parser)# 提取标题 titles soup.find_all(title) for title in titles:print(title.text)执行结果如下 9. 实战项目抓取数据 接下来我们将结合前面所学的内容编写一个完整的爬虫项目从网站中抓取数据并保存到 CSV 文件中。 9.1 项目需求 从 https://jsonplaceholder.typicode.com/posts 提取标题和链接。将数据保存到 CSV 文件中。 9.2 项目步骤 发送请求并获取响应。解析响应内容。保存数据到 CSV 文件。 9.3 示例代码 import requests import csvdef fetch(url):response requests.get(url)if response.status_code 200:data []posts response.json()for post in posts:title post[title]link fhttps://jsonplaceholder.typicode.com/posts/{post[id]}data.append([title, link])return dataelse:print(请求失败状态码, response.status_code)return []def save_to_csv(data, filename):with open(filename, w, newline, encodingutf-8) as file:writer csv.writer(file)writer.writerow([Title, Link])writer.writerows(data)if __name__ __main__:url https://jsonplaceholder.typicode.com/postsdata fetch(url)if data:save_to_csv(data, datas.csv)print(数据已保存到 datas.csv)总结 通过本篇文章的学习相信小伙伴们已经掌握了 requests 库的基本用法涵盖了发送各种请求、处理响应、会话保持、SSL 证书验证、代理设置、文件上传与下载等内容。
http://www.dnsts.com.cn/news/116689.html

相关文章:

  • 公司网站备案必须是企业信息么撰写网站建设策划书范文
  • 网站开发 写文档安装wordpress+000
  • 网站设计用什么字体好网站分哪些种类
  • 开发工程师网站开发工程师做业务不花钱的网站有哪些
  • 桂林公司做网站怎么做游戏代理
  • 哪些网站是用php编写的怎么在服务器里面建设网站
  • 中信建设有限责任公司项目人员配置百度seo网站优化怎么做
  • 建设一个会员积分网站建设网站费用如何入账
  • 做水果网站行阜阳讯拓网站建设
  • 全国建设部网站网站建设推广销售人员
  • 引导企业做网站建设通查询设通网站
  • 建设厅质监总站网站做网站推广一般多少钱
  • 哪里网站书最全如何做正规电影网站
  • 成都网站建设外包页面设计代码怎么写
  • 网站电脑速成培训班中国最好的工业设计公司
  • 厦门网页建站申请费用个人做网站能赚钱吗
  • 广州建设交易中心网站首页网上推广产品哪个网好
  • 棋盘游戏类网站开发北京工商注册代理公司
  • 如何搭建一个购物网站青岛网站设计哪家好
  • 网站建设安全协议有可以做国外支付系统的网站吗
  • 网络购物网站大全网站建设公司哪里好
  • 承接各类网站建设网站seo心态
  • 网站怎么做下拉刷新logoko
  • microsoft免费网站百度推广登录平台网址
  • 森东网站建设全网seo
  • 免费企业网站怎么做ui网页设计实训报告
  • 凡科网 免费网站移动端网站开发项目
  • 上海网站开发与设计网站建设策划结束语
  • 怎么做网站邮箱中国电子商务研究中心官网
  • 爱网站在线观看免费第二季企业网站开发