当前位置: 首页 > news >正文

网站建设中数据字典软件开发项目经理招聘

网站建设中数据字典,软件开发项目经理招聘,企业解决方案和应对措施的区别,如何建设自己的淘宝客网站基于Scrapy框架实现POST请求爬虫 前言 本文中介绍 如何基于 Scrapy 框架实现 POST 请求爬虫#xff0c;并以抓取指定城市的 KFC 门店信息为例进行展示 正文 1、Scrapy框架处理POST请求方法 Scrapy框架 提供了 FormRequest() 方法来发送 POST 请求#xff1b; FormReques…基于Scrapy框架实现POST请求爬虫 前言 本文中介绍 如何基于 Scrapy 框架实现 POST 请求爬虫并以抓取指定城市的 KFC 门店信息为例进行展示 正文 1、Scrapy框架处理POST请求方法 Scrapy框架 提供了 FormRequest() 方法来发送 POST 请求 FormRequest() 方法 相比于 Request() 方法多了 formdata 参数接受包含表单数据的字典或者可迭代的元组并将其转化为请求的 body。 POST请求yield scrapy.FormRequest(urlpost_url,formdata{},meta{},callback...) 注意使用 FormRequest() 方法发送 POST 请求一定要重写 start_requests() 方法 2、Scrapy框架处理POST请求案例 项目需求抓取指定城市的 KFC 门店信息。终端提示请输入城市xx 将所有 xx 市的 KFC 门店数据抓取下来。 所需数据门店编号、门店名称、门店地址、所属城市、所属省份 url 地址http://www.kfc.com.cn/kfccda/storelist/index.aspx POST请求url地址http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?opcname F12抓包分析找到需要爬取的数据获取门店信息获取门店总数 获取form表单获取 form 表单数据 创建Scrapy项目编写items.py文件 import scrapyclass KfcspiderItem(scrapy.Item):# 门店编号rownum scrapy.Field()# 门店名称storeName scrapy.Field()# 门店地址addressDetail scrapy.Field()# 所属城市cityName scrapy.Field()# 所属省份provinceName scrapy.Field()编写爬虫文件 import scrapy import json from ..items import KfcspiderItemclass KfcSpider(scrapy.Spider):name kfcallowed_domains [www.kfc.com.cn]post_url http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?opcnamecity_name input(请输入城市名称)# start_urls [http://www.kfc.com.cn/]def start_requests(self):重写start_requests()方法获取某个城市的KFC门店总数量:return:formdata {cname: self.city_name,pid: ,pageIndex: 1,pageSize: 10}yield scrapy.FormRequest(urlself.post_url, formdataformdata, callbackself.get_total,dont_filterTrue)def parse(self, response):解析提取具体的门店数据:param response::return:htmljson.loads(response.text)for one_shop_dict in html[Table1]:itemKfcspiderItem()item[rownum]one_shop_dict[rownum]item[storeName]one_shop_dict[storeName]item[addressDetail]one_shop_dict[addressDetail]item[cityName]one_shop_dict[cityName]item[provinceName]one_shop_dict[provinceName]#一个完整的门店数据提取完成交给数据管道yield itemdef get_total(self, response):获取总页数并交给调度器入队列:param response::return:html json.loads(response.text)count html[Table][0][rowcount]total_page count // 10 if count % 10 0 else count // 10 1# 将所有页的url地址交给调度器入队列for page in range(1, total_page 1):formdata {cname: self.city_name,pid: ,pageIndex: str(page),pageSize: 10}# 交给调度器入队列yield scrapy.FormRequest(urlself.post_url, formdataformdata, callbackself.parse) 编写设置文件 BOT_NAME KFCSpiderSPIDER_MODULES [KFCSpider.spiders] NEWSPIDER_MODULE KFCSpider.spiders# Obey robots.txt rules ROBOTSTXT_OBEY False# See https://docs.scrapy.org/en/latest/topics/settings.html#download-delay # See also autothrottle settings and docs DOWNLOAD_DELAY 1# Override the default request headers: DEFAULT_REQUEST_HEADERS {Accept: text/html,application/xhtmlxml,application/xml;q0.9,*/*;q0.8,Accept-Language: en,User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.1 (KHTML, like Gecko) }# 设置日志级别DEBUG INFO WARNING ERROR CARITICAL LOG_LEVEL INFO # 保存日志文件 LOG_FILE KFC.log# Configure item pipelines # See https://docs.scrapy.org/en/latest/topics/item-pipeline.html ITEM_PIPELINES {KFCSpider.pipelines.KfcspiderPipeline: 300, }# Set settings whose default value is deprecated to a future-proof value REQUEST_FINGERPRINTER_IMPLEMENTATION 2.7 TWISTED_REACTOR twisted.internet.asyncioreactor.AsyncioSelectorReactor FEED_EXPORT_ENCODING utf-8 在管道文件中直接打印 item 创建run.py文件运行爬虫 from scrapy import cmdline cmdline.execute(scrapy crawl kfc.split())运行效果
http://www.dnsts.com.cn/news/227171.html

相关文章:

  • 建网站什么语言如何制作自己想要的图片
  • 建设网站制作wordpress支付宝当面付插件
  • 福州做网站fjfzwl工程建设流程
  • 自己公司的网站怎么编辑器什么用wordpress
  • 网站单页面怎么做的宜选科技就是帮人做网站
  • 网站做有偿广告需要什么有序聊城做wap网站服务
  • 外贸网站seo优化贺卡制作网页
  • 社交网站只做郑州网络营销
  • 网站设计教科书西安seo公司哪家好
  • 网站流量统计分析便宜建站空间
  • 网站icp备案网址wordpress菜单不现实
  • wordpress 文章置顶英文网站如何做seo
  • 自助建站系统wordpress响应式播放器
  • 网站有哪些费用多少钱小程序可做网站吗
  • app网站开发定制wordpress网站跳转nginx
  • 做网站 徐州平台网站建设方案模板下载
  • 卖车网站宁波有哪些公司做网站
  • 网站rp原型图怎么做互联网网站备案
  • 做羞羞的事的视频网站织梦网站一级目录
  • 做外贸需要到外汇管理网站企业网站怎么做省钱
  • 成都网站建设龙兵网络网站做导航条
  • 长春网站建设中心哪个网站做调查赚钱多
  • 网站的建设有什么好处wordpress文章加载特效
  • 网站上传文章平面设计师工作内容
  • 营销型网站建设策划案论坛网站html模板
  • 电子政务公开 网站建设记事本里做网站 怎么把字体
  • 怎么建立自己的公司网站网站建设与管理自考题
  • 做团购网站多少钱注册网站填写不了地区
  • 健身网站建设宣传册设计与制作公司
  • 做网站导流专门做油站数据的网站