当前位置: 首页 > news >正文

女人被做网站花都区水务建设管理中心官方网站

女人被做网站,花都区水务建设管理中心官方网站,wordpress登录后台不显示登录,谷歌浏览器网页版爬虫有几部分功能#xff1f;#xff1f;#xff1f; 1.发请求#xff0c;获得网页源码 #1.和2是在一步的 发请求成功了之后就能直接获得网页源码 2.解析我们想要的数据 3.按照需求保存 注意#xff1a;开始爬虫前#xff0c;需要给其封装 headers {User-…爬虫有几部分功能     1.发请求获得网页源码 #1.和2是在一步的 发请求成功了之后就能直接获得网页源码     2.解析我们想要的数据     3.按照需求保存  注意开始爬虫前需要给其封装 headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36 } 爬虫分析 第一步从列表页抓取详情页面的链接 正则表达式 li\sclassmedia\sthread\stap\s\s.*?.*?div\sclasssubject\sbreak-all.*?a\shref(.*?)(.*?)/a 得到如下结果 从以上结果可以看出此链接不可直接点击缺少https://www.hifini.com/这一部分 https://www.hifini.com/thread-20945.htm 因此如下处理 for i in result:         # print(i)#元祖下标取值         href https://www.hifini.com/i[0]         name i[1]         print(href)         print(name)         print() 第二步获取歌曲播放资源 找到歌曲url的xpath music:\s\[.*?title:\s(.*?),.*?url:\s(.*?) 代码 #解析歌曲的播放组员 song_re music:\s\[.*?title:\s(.*?),.*?url:\s(.*?) r re.findall(song_re,song_html_data,re.S) # print(歌曲信息,r) for i in r:song_name i[0]song_link https://www.hifini.com/i[1]print(歌名,song_name)print(歌曲播放资源链接,song_link)print() 第三步再次像歌曲播放资源链接发请求 获得二进制数据进行保存 1.创建文件夹 #保存歌曲 先创建一个文件夹 导入os模块 #判断文件是否存在 if not os.path.exists(歌曲):os.makedirs(歌曲)2.创建文件流将歌曲保存在文件夹中 with open(歌曲\{}.m4a.format(song_name),wb)as f:f.write(data_bytes)代码 import requests import re import osshouye_url https://www.hifini.com/ # 1.起始目标 headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36 } response requests.get(shouye_url, headersheaders) #1.发请求获得网页源码 def get_data(url):response requests.get(url,headersheaders)# print(response.status_code)# print(response.text)if response.status_code 200:return response.text #2.解析我们想要的数据 def parse_data(data):#形参站位 模拟的就是爬虫爬取下来的源码z li\sclassmedia\sthread\stap\s\s.*?.*?div\sclasssubject\sbreak-all.*?a\shref(.*?)(.*?)/aresult re.findall(z,data,re.S)# print(result)# https://www.hifini.com/thread-20945.htmfor i in result:# print(i)#元祖下标取值href https://www.hifini.com/i[0]name i[1]print(href)print(name)print()get_song_link(href)#https://www.hifini.com/get_music.php?key2Ydoqazb8E6jjNvl6rZLnuh3Fu1MRARle/srx5zQfZVMkPqsGrSzFHehon89oIENCUU19ru3GEJax60Ew # 像详情页发请求 获得网页源码 def get_song_link(link):#link模拟的是详情页的urlsong_html_data get_data(link)# print(详情页的网页源码,song_html_data)#解析歌曲的播放组员song_re music:\s\[.*?title:\s(.*?),.*?url:\s(.*?)r re.findall(song_re,song_html_data,re.S)# print(歌曲信息,r)for i in r:song_name i[0]song_link https://www.hifini.com/i[1]print(歌名,song_name)print(歌曲播放资源链接,song_link)print()#再次像歌曲播放资源链接发请求 获得二进制数据data_bytes requests.get(song_link,headersheaders).content# print(data_bytes)#保存歌曲 先创建一个文件夹 导入os模块#判断文件是否存在if not os.path.exists(歌曲):os.makedirs(歌曲)with open(歌曲\{}.m4a.format(song_name),wb)as f:f.write(data_bytes) #对应的功能写在不同的函数里面 如果需要互用功能 互相调用即可 if __name__ __main__:h get_data(shouye_url)parse_data(h) 结果
http://www.dnsts.com.cn/news/122278.html

相关文章:

  • 网站建设项目说明书绍兴柯桥建设局网站
  • 泉州做网站优化seo快速优化文章排名
  • 网站案例分析盛锡福网站
  • 网站开发需要那些人才电商网站业务流程图
  • 建设工程询价网站有哪些开发游戏需要多少钱
  • 网站开发需要哪些软件html5网站开发方案
  • 私人建设网站做营销网站建设挣钱吗
  • 接项目做的网站重庆市万州建设工程信息网
  • 网站镜像怎么做给个人建网站的公司
  • 网站域名响应时间卡片式 主题 wordpress
  • 深圳网站建设公司流程济南做门户网站开发公司
  • 那个网站可以接做网页私活wordpress中文正式版
  • 网站做的不好使自己建立公司网站的步骤
  • 哪些网站的做的好看保定网站建设多少钱哪家好
  • 舟山建设管理网站黄冈网站建设哪家专业
  • 温州手机网站开发国企公司网站制作
  • 数码产品商城网站建设苏州哪里有做淘宝网站的
  • 网站问题seo解决方案海淀网站建设
  • 公司网站推广的方法html 修改 wordpress
  • 山东烟台城乡建设学校官方网站wordpress iis 分页 404
  • 外贸电子商务网站建设快懂百科登录入口
  • 一起做网站女装夏季如东做网站公司
  • 淄博网站建设公司坪地网站制作
  • 做网络推广选择网站闵行交大附近网站建设
  • 做设计开店的网站自建网站系统
  • 免费企业网站建设wordpress首页设置
  • 网络口碑推广公司江西短视频seo搜索报价
  • 工会网站建设上海购房网官网
  • 电商网站通用左侧弹出导航做网站gif代码
  • 在县城做同城网站怎么样营销网站制作费用