当前位置: 首页 > news >正文

企业网站建设公司公司公司网站怎么登录

企业网站建设公司公司,公司网站怎么登录,品牌建设模型,网站建设功能文案1#xff0c;指纹去重原理存在于 scrapy.util.requests 里面 需要安装的包 pip install scrapy-redis-cluster # 安装模块 pip install scrapy-redis-cluster0.4 # 安装模块时指定版本 pip install --upgrade scrapy-redis-cluster # 升级模块版本 2#xff0c;setting配置 …1指纹去重原理存在于 scrapy.util.requests 里面 需要安装的包 pip install scrapy-redis-cluster # 安装模块 pip install scrapy-redis-cluster0.4 # 安装模块时指定版本 pip install --upgrade scrapy-redis-cluster # 升级模块版本 2setting配置 # -*- coding: utf-8 -*-BOT_NAME zonghengSPIDER_MODULES [rankxs.spiders] NEWSPIDER_MODULE rankxs.spiders# Crawl responsibly by identifying yourself (and your website) on the user-agent# Obey robots.txt rules ROBOTSTXT_OBEY False###################################################### ##############下面是Scrapy-Redis相关配置################ ####################################################### 指定Redis的主机名和端口 REDIS_HOST localhost REDIS_PORT 6379# 调度器启用Redis存储Requests队列 SCHEDULER scrapy_redis.scheduler.Scheduler# 确保所有的爬虫实例使用Redis进行重复过滤 DUPEFILTER_CLASS scrapy_redis.dupefilter.RFPDupeFilter# 将Requests队列持久化到Redis可支持暂停或重启爬虫 SCHEDULER_PERSIST True# Requests的调度策略默认优先级队列 SCHEDULER_QUEUE_CLASS scrapy_redis.queue.PriorityQueue# 将爬取到的items保存到Redis 以便进行后续处理 ITEM_PIPELINES {rankxs.pipelines.RankxsPipeline: 1,scrapy_redis.pipelines.RedisPipeline: 2 } 此处的关键点在于管道的先后顺序顺序错了数据库的数据会进不去 3指纹去重在redis里面的显示,用redis做去重逻辑--先遣队 zongheng:items  和 zongheng:dupefilters  两个key   一个是items 里面的数据  ,另外一个则是已经爬取的  md5 url 爬虫爬取会先去查询redis里面的dupefiters md5 url 4,多爬虫任务可以在同一个文件进行执行CrawlerProcess和CrawlerRunner crawler.CrawlerRunner from scrapy.utils.project import get_project_settings# processcrawler.CrawlerProcess(get_project_settings()) # process.crawl(ZonghengSpider) # process.start(stop_after_crawlFalse) 程序执行报错 关键点在于stop_after_crawl配置和注释TWISTED_REACTOR可以避免具体原因可以去看源码 5关于多功能的 from scrapy.linkextractors import LinkExtractor 不论是scrapy 还是scrawlspider 都可以用的链接提取器比较实用
http://www.dnsts.com.cn/news/36340.html

相关文章:

  • 网站建设与管理ppt天河建设网站开发
  • 山西省建设监理协会网站上海网上注册公司官网
  • 万网速成网站有哪些 功能正规的培训行业网站开发
  • php开源网站 网上商城少儿编程哪家机构比较好
  • 镇海区建设交通局网站进不去了创意规划设计有限公司官网
  • 做网站设计最好的公司中国优秀网站
  • 网站建设图片路径错了 怎么改女教师遭网课入侵视频大全集
  • 泉州网站快速排名提升手机网站的模板下载软件
  • 19年做网站还能赚钱可以做设计赚钱的网站
  • 微信微网站模板下载哈尔滨建站流程
  • 竭诚网络网站建设价格快照网站
  • 南宁seo建站网上怎么做网站赚钱
  • 江苏建设招标信息网站ps临摹图片做网站的图片犯法吗
  • 完成网站建设石家庄建站模板厂家
  • 个人网站建设的花费浙江公司网站建设制作
  • 网站建设具体工作总结江苏外贸型网站制作
  • 申请一个域名可以做多少网站百度推广登陆网址
  • 工具类网站如何做排名属于网页制作平台的是
  • 做公司点评的网站个人电脑做外网网站
  • 计算机网站开发实现总结网络投票怎么做
  • 成都市微信网站建设2023还能上的网站
  • 做网站主要显哪些内容网站开发与客户沟通
  • 怎样让网站显示网站建设中建站系统推荐
  • 网站排名 算法怎样装修公司网站
  • 庆阳网站设计价格wordpress先页面再首页
  • 快速做效果图的网站叫什么软件wordpress不使用ip访问
  • 深圳做针织衫服装的网站如何快速提升网站pr
  • 佛山建网站哪里好做网站模板出售类网站怎么样
  • 建站行业转型电子商务网站建设需求概述
  • 网站门户建设方案网站建设艾瑞市场分析