当前位置: 首页 > news >正文

望城区住房和城乡建设局门户网站wordpress图片自动居中

望城区住房和城乡建设局门户网站,wordpress图片自动居中,苏州网站设计公司官网,优化百度seo技术搜索引擎对58同城二手平板电脑的爬虫 一、先爬取内容中的一项先爬取一项的代码爬去一项的结果 二、爬取一整页一整页代码一整页的全部信息结果 有网友留言说#xff0c;这个代码已经不能爬取了#xff0c;我2018.11.9号查看了一下#xff0c;加了一个异常处理try#xff0c;现在可以… 对58同城二手平板电脑的爬虫 一、先爬取内容中的一项先爬取一项的代码爬去一项的结果 二、爬取一整页一整页代码一整页的全部信息结果 有网友留言说这个代码已经不能爬取了我2018.11.9号查看了一下加了一个异常处理try现在可以用了原因是有的信息里面的标签由于促销价格被修改为别的了所以爬取不到就会出错。现在 我将修改后的代码替换掉原有的爬取一整页的代码 以及 错误的图片比较 。 一、先爬取内容中的一项 网址如下 URL ‘https://bj.58.com/pingbandiannao/35923077687887x.shtml?psid157596847202024134799949907entinfo35923077687887_pslot-1iuTypep_1PGTID0d305a36-0000-19ea-0c77-0ae8025ace4fClickID2’ 先爬取一项的代码 代码中soup.select()不明白的地方我后续将详细解释爬出来是空列表的情况。 import requests from bs4 import BeautifulSoupURL https://bj.58.com/pingbandiannao/35923077687887x.shtml?psid157596847202024134799949907entinfo35923077687887_pslot-1iuTypep_1PGTID0d305a36-0000-19ea-0c77-0ae8025ace4fClickID2 headers {user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36 } wb_data requests.get(URL,headersheaders) soup BeautifulSoup(wb_data.content, lxml) #print(soup) NameList soup.select(h1.detail-title__name) ProductName NameList[0].text.strip() PriceList soup.select(span.infocard__container__item__main__text--price) ProductPrice PriceList[0].text.strip() ViewList soup.select(div.infocard__container__item__main) ProductView ViewList[1].text AreaList soup.select(div.infocard__container__item__main a) ProductArea AreaList[0].text-AreaList[1].text SellerNameList soup.select(div.infocard__container__item__main a) SellerName SellerNameList[2].text CatalogueList soup.select(div.nav a) Catalogue CatalogueList[-1].textdata_dict {产品类别: Catalogue,产品名称: ProductName,产品价格: ProductPrice,产品成色: ProductView,产品区域: ProductArea,卖家姓名: SellerName } print(data_dict) 注意headers需要修改成自己电脑的详见我的博客【python爬虫–招聘信息】-headers错误信息如果不写headers会被反爬取。 爬去一项的结果 {产品类别: 北京平板电脑, 产品名称: surface pro5 I5 8G 128G, 全新未拆封, 产品价格: 5000 元, 产品成色: 全新, 产品区域: 通州-马驹桥, 卖家姓名: 张先生}二、爬取一整页 url ‘https://bj.58.com/pingbandiannao/?PGTID0d409654-017a-3436-09be-f01fa1e2217fClickID13’ 一整页代码 import requests from bs4 import BeautifulSoup#得到每个的详细信息 def get_info(URL):#URL https://bj.58.com/pingbandiannao/35923077687887x.shtml?psid157596847202024134799949907entinfo35923077687887_pslot-1iuTypep_1PGTID0d305a36-0000-19ea-0c77-0ae8025ace4fClickID2headers {user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36 }try:wb_data requests.get(URL,headersheaders)soup BeautifulSoup(wb_data.content, lxml)#print(soup)NameList soup.select(h1.detail-title__name)ProductName NameList[0].text.strip()PriceList soup.select(span.infocard__container__item__main__text--price)ProductPrice PriceList[0].text.strip()AreaList soup.select(div.infocard__container__item__main a)ProductArea AreaList[0].text.strip()-AreaList[1].text.strip()SellerNameList soup.select(div.infocard__container__item__main a)SellerName SellerNameList[2].textCatalogueList soup.select(div.nav a)Catalogue CatalogueList[-1].textdata_dict {产品类别: Catalogue,产品名称: ProductName,产品价格: ProductPrice,产品区域: ProductArea,卖家姓名: SellerName}print(data_dict)except:print(此项信息被修改所以爬取错误) #不想看到这句话可以写pass#get_info() 下面是得到一整页中每个卖家信息的链接这里只爬取了第一页中的全部信息 也可以爬取好多页。只需要将下方的url中根据每页信息的不同变化相应的数字页码。def get_all_info():url https://bj.58.com/pingbandiannao/?PGTID0d409654-017a-3436-09be-f01fa1e2217fClickID13headers {user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36 }wb_data requests.get(url,headersheaders)soup BeautifulSoup(wb_data.text, lxml)GetLink soup.select(td.t a)#print(GetLink)for i in GetLink:link i.get(href) #得到href链接#删选是平板电脑的链接if pingbandiannao in link:get_info(link)get_all_info() 一整页的全部信息结果 {产品类别: 北京平板电脑, 产品名称: 上门回收IPAD平板电脑 IPHONE全系列, 产品价格: 4999 元, 产品区域: 北京-邢先生, 卖家姓名: } 此项信息被修改所以爬取错误 {产品类别: 北京平板电脑, 产品名称: 展柜展示柜钛合金展柜精品展柜珠宝玉器展柜化妆品展柜, 产品价格: 面议, 产品区域: 东城-东城周边, 卖家姓名: 徐经理} {产品类别: 北京平板电脑, 产品名称: 联想Yogabook Android 128G 雅黑色, 产品价格: 2000 元, 产品区域: 朝阳-望京, 卖家姓名: 胡先生} 此项信息被修改所以爬取错误 此项信息被修改所以爬取错误 此项信息被修改所以爬取错误 {产品类别: 北京平板电脑, 产品名称: 戴尔i7吃鸡游戏, 产品价格: 2800 元, 产品区域: 朝阳-东坝, 卖家姓名: s***0} {产品类别: 北京平板电脑, 产品名称: 古董私人收购 玉器瓷器青铜器古币字画 现金结算收购, 产品价格: 99999 元, 产品区域: 北京-陈枫, 卖家姓名: } 此项信息被修改所以爬取错误 {产品类别: 北京平板电脑, 产品名称: 转让带车指标的公司, 产品价格: 1 元, 产品区域: 朝阳-安贞, 卖家姓名: 郭先生} 此项信息被修改所以爬取错误 {产品类别: 北京平板电脑, 产品名称: 华为荣耀畅玩二平板电脑, 产品价格: 650 元, 产品区域: 石景山-金顶街, 卖家姓名: z***3} {产品类别: 北京平板电脑, 产品名称: Lenovo/联想 Miix5 I5 转卖, 产品价格: 4396 元, 产品区域: 石景山-衙门口, 卖家姓名: l***8} {产品类别: 北京平板电脑, 产品名称: 九成新转让平板电脑, 产品价格: 1600 元, 产品区域: 昌平-沙河, 卖家姓名: m***t} {产品类别: 北京平板电脑, 产品名称: 公司发的福利一共两台出售一台, 产品价格: 1200 元, 产品区域: 丰台-蒲黄榆, 卖家姓名: e***6} {产品类别: 北京平板电脑, 产品名称: 全新未拆封微软Surface Por电脑, 产品价格: 6000 元, 产品区域: 朝阳-大屯, 卖家姓名: q***8} 此项信息被修改所以爬取错误 {产品类别: 北京平板电脑, 产品名称: 三星TAB3 16G 8.1寸, 产品价格: 500 元, 产品区域: 大兴-观音寺, 卖家姓名: s***5} {产品类别: 北京平板电脑, 产品名称: 小米平板便宜出需要的联系我, 产品价格: 500 元, 产品区域: 顺义-李桥, 卖家姓名: f***6} {产品类别: 北京平板电脑, 产品名称: 电影孩子学习有帮助, 产品价格: 1499 元, 产品区域: 房山-阎村, 卖家姓名: h***r} 此项信息被修改所以爬取错误 {产品类别: 北京平板电脑, 产品名称: surfacePro4全新基本未用, 产品价格: 4300 元, 产品区域: 丰台-丽泽桥, 卖家姓名: 1***h} {产品类别: 北京平板电脑, 产品名称: 个人全新Ipad Pro转让, 产品价格: 3666 元, 产品区域: 丰台-马家堡, 卖家姓名: o***4} {产品类别: 北京平板电脑, 产品名称: 华为P20亮黑色, 产品价格: 3300 元, 产品区域: 朝阳-大山子, 卖家姓名: n***9} {产品类别: 北京平板电脑, 产品名称: 处理老台式显示器, 产品价格: 150 元, 产品区域: 朝阳-甘露园, 卖家姓名: x***3} {产品类别: 北京平板电脑, 产品名称: 转全新国行未拆封ipad一台, 产品价格: 2150 元, 产品区域: 朝阳-北苑, 卖家姓名: 小***滔} {产品类别: 北京平板电脑, 产品名称: 自用ipad air2 wifi版, 产品价格: 1800 元, 产品区域: 海淀-马连洼, 卖家姓名: 1***o} {产品类别: 北京平板电脑, 产品名称: 海尔品牌一体电脑, 产品价格: 260 元, 产品区域: 昌平-城北, 卖家姓名: z***1}Process finished with exit code 0 图片比较 这里的标签被网页改了所以以前的代码会报错 ------------------------------------------------------------------------------------ 谢谢支持亲测运行成功。注意更改headers好像不修改也可以用
http://www.dnsts.com.cn/news/167568.html

相关文章:

  • 周村网站制作首选公司阿里巴巴运营流程
  • 湘潭网站建设磐石网络上班时间建设银行信用卡网站下载
  • 昆明网站建设优化邮箱163登录
  • 网站制作策划建设大纲wordpress怎么搬迁
  • 合肥做网站价格是多少转塘有做网站的吗
  • 外贸型网站推广与监测客户资源软件
  • 企业网站系统的设计与开发教程重庆网站建设学习
  • 常德建设网站制作高端品牌网站设计
  • 唐山网站建设网站怎么做404页面的跳转
  • wordpress 多站点 子目录合肥网站设计公司
  • 株洲营销网站建设mip网站模板
  • 网站多少流量够用装潢公司企业网站源码
  • 打开这个你会感谢我的网站网站管理后台地址
  • 建网站wordpresswordpress托管 根目录
  • 太原网站建设外包须知传媒重庆网站建设公司招聘
  • 做班级网站代码cms网站管理系统制作
  • 网站开发学什么语言传奇手游官方网站
  • 贵州省建设厅网站四川有什么好的网站建设公司
  • 咋么做网站网站建站域名解析最后做
  • 如果让你建设一个网站网站水印图片欣赏
  • 白酒 网站模板关键词优化app
  • 网站推广seo设置做食品网站有哪些东西
  • 甘肃路桥建设集团网站房产中介网站建设管理
  • 技术支持 天空网络-临汾做网站手机网站设计图尺寸
  • 单县做网站省 两学一做 专题网站
  • 企业网站建设的服务类型有哪些优化是什么
  • 北京微信网站开发报价都江堰网站建设
  • 怎样做关于自己的网站申泽seo
  • 山西 网站制作美食网页模板
  • 大气装饰公司网站源码怎样免费制作网站