当前位置: 首页 > news >正文

哪些网站是专做合租的惠州网站建设 翻译6

哪些网站是专做合租的,惠州网站建设 翻译6,微信做模板下载网站有哪些,上门做美容的网站文章目录 爬虫URL发送请求UA伪装requests 获取想要的数据打开网页 总结完整代码 爬虫 Python 爬虫是一种自动化工具#xff0c;用于从互联网上抓取网页数据并提取有用的信息。Python 因其简洁的语法和丰富的库支持#xff08;如 requests、BeautifulSoup、Scrapy 等#xf… 文章目录 爬虫URL发送请求UA伪装requests 获取想要的数据打开网页 总结完整代码 爬虫 Python 爬虫是一种自动化工具用于从互联网上抓取网页数据并提取有用的信息。Python 因其简洁的语法和丰富的库支持如 requests、BeautifulSoup、Scrapy 等而成为实现爬虫的首选语言之一。 Python爬虫获取浏览器中的信息实际上是模仿浏览器上网的行为。完成获取信息需要完成三步 指定url发送请求获取你想要的数据 比如我们爬取一个网站的页面 https://www.sogou.com/URL URLUniform Resource Locator统一资源定位符是互联网上用来标识资源的字符串它告诉Web浏览器或其他网络程序如何访问特定的文件或网页。简单来说URL就是网页的地址。 那我们怎么寻找网页的url呢 浏览器中找到网页页面点击按钮F12进入开发者控制台Developer Console。 第一步点击Network,第二步刷新页面第三步滚动滚轮找到最上面的一项打开 我们可以看到网页的url地址、以及它的请求方式是get请求、Status Code在200和300是属于正常的、类型是text/html形式的。 好那我们先指定url地址 url https://www.sogou.com/发送请求 找到网址之后我们当然得要获取它这样我们就需要申请访问它的网址。 访问别人当然自己得有个身份怎么为自己伪装一个身份呢 UA伪装 在python内下载fake_useragent包这里面是别人以及写好的UA使用这个包会为我们随机提供一个身份。 pip install fake_useragent下载好之后导入包 import fake_useragent接下来运用这个包来进行UA伪装 head {User-Agent:fake_useragent.UserAgent().random #User-Agent固定写法哦 }这样我们就有身份来发生请求啦 requests 在Python中发生请求使用requests方法。使用这个方阿飞之前呢我们也还需要安装一个requests包 pip install requests下载好之后导入包 import requests接下来我们来使用这个包来发送请求 response requests.get(url,headershead) #以head的伪装身份访问url将返回的数据放在response对象内这样我们就请求完成了。 获取想要的数据 之前我们在开发者控制台中看到网页的类型是text/html形式的。 请求完成之后我们将请求到的内容接收一下 res_text response.text print(res_text) -------------------- print(response.status_code) #可以加上这个代码验证请求是否成功 200请求成功。通常表示服务器成功返回了请求的网页。 404未找到。通常表示服务器无法找到请求的资源网页。 500内部服务器错误。通常表示服务器遇到了一个意外情况导致其无法完成对请求的处理。将接收到的内容打印出来。 打开网页 在PyCharm中建立一个HTML文本将接收打印出来的数据内容复制进HTML文本中 进入HTML文本右上角会有浏览器浮现选择你要使用的浏览器打开就会进去获取的网页中。 总结 本篇介绍了如何爬取网页的一个页面。 指定url发送请求requests请求方法 UA伪装使用fake_useragent包为自己提供身份 获取想要的数据将数据接收处理 完整代码 import fake_useragent import requests if __name__ __main__:#UA伪装 让你认为我是一个浏览器head {User-Agent:fake_useragent.UserAgent().random}# 1、指定urlurl https://www.sogou.com/# 2、发送请求 返回的数据在response对象内response requests.get(url,headershead)#3、获取想要的数据res_text response.textprint(res_text)
http://www.dnsts.com.cn/news/178991.html

相关文章:

  • 网站建设服务公盐山做网站的
  • 高端商城网站建设广州企业网站排名
  • 淘宝建设网站的意义数字营销公司排行榜
  • 保定网站建设方法百度快照怎么用
  • 海口市做网站的公司厦门网站设计公司找哪家厦门小程序建设
  • 青岛关键词排名推广从零开始做网站seo
  • 免费商城自助建站wordpress虚拟商品销售
  • 中航建设集团有限公司网站太仓市质监站网址
  • 可以做流程图的网站设计工作室注册流程
  • 聊城网站优化信息易捷网
  • 网站制作费用入什么科目wordpress用户中心页面
  • 娄底网站建设设计自己做网站做那种类型
  • 网站开发公司臻动建筑木模板厂家
  • 网站设计外文文献logo设计软件手机版
  • 门户网站建设开发wordpress 改cms
  • 安徽专业做网站的大公司手机网站开发 手机模拟器
  • 重庆网站建设培训机构商标logo设计公司
  • 应用商店怎么下载长沙百度快速排名优化
  • 网站建设的合同书昆明有多少做网站的公司
  • 泉州手机端建站模板做网站的虚拟机怎么用
  • 做网站ssl证书必须要吗保亭县住房城市建设局网站
  • 做国际网站的上海高端网站公司网站建设php教程视频
  • 网站显示危险网站怎么让别人访问自己做的的网站
  • 3 如何进行网站优化设计域名注册网站建设
  • 阿克苏网站建设优化自学建网站做网站优化
  • 如果网站没有做icp备案吗网站维护是谁做的
  • 网站开发策划方案知乎如何将软件上传到公开网站
  • 哪个网站有手工活做兰州seo快速排名
  • 关于电子商务网站建设的现状国内wordpress例子
  • 做飞象金服的网站wordpress如何撤销301