当前位置：首页 > news >正文

深圳市住房和建设局网站住房广告网站

news 2026/1/12 14:17:09

深圳市住房和建设局网站住房,广告网站,ps做网站视图大小,旅行社路漫漫其修远兮#xff0c;吾将上下而求索这次写一个最简单的python爬虫代码#xff0c;也是大多教程第一次爬取的#xff0c;代码里面有个别的简单介绍#xff0c;希望能加深您对python爬虫的理解。本次爬取两个网页数据一爬取的网站豆瓣电影爬取网页中的#…路漫漫其修远兮吾将上下而求索这次写一个最简单的python爬虫代码也是大多教程第一次爬取的代码里面有个别的简单介绍希望能加深您对python爬虫的理解。本次爬取两个网页数据一爬取的网站豆瓣电影爬取网页中的肖申克的救赎 1994 评分是 9.7 共 911165人评价电影名年份评分评价人数代码 import csv import re,requests #拿到源代码 requests通过re获取想要的数据csv写入操作 urlhttps://movie.douban.com/top250 h{User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.110 Safari/537.36 Edg/96.0.1054.62 } rrequests.get(url,headersh);r.encodingutf-8yuanmar.text# 拿到网页源代码 #解析数据 objre.compile(rli.*?div classitem.*?span classtitle(?Pname.*?)/spanr.*?p class.*?br(?Pyear.*?)nbsp.*?propertyv:average.(?Ppf.*?)/spanr.*?span.(?Ppl.*?)/span,re.S) #开始匹配 robj.finditer(yuanma) fopen(shuju.csv,modew)#打开一个文件 csvscsv.writer(f) for i in r:print(i.group(name),i.group(year).strip(),评分是,i.group(pf),共,i.group(pl))#strip()去掉空白 print(完成) 实验效果二爬取保定学院官网网页的href链接代码 #爬取保定学院官网网页的href链接 import re,requests from bs4 import BeautifulSoup #拿到源代码 requests通过re获取想要的数据csv写入操作 urlhttps://www.bdu.edu.cn/ rrequests.get(url);r.encodingutf-8 yuanmar.text# 拿到网页源代码 bsBeautifulSoup(yuanma) chabs.findAll(a) for i in cha:if href in i.attrs:#print(i)print(i.attrs[href],-,i.text) r.close() 实验效果本文章只是单纯的从技术角度介绍使用python代码搜索网页数据读者要正常使用技术。希望对您有所帮助。最后谢谢您的观看

查看全文

http://www.dnsts.com.cn/news/119125.html