当前位置: 首页 > news >正文

网站伪静态设置竞价排名机制

网站伪静态设置,竞价排名机制,干部重庆网络学院,中国工商网注册官网定义 Robots协议也称作爬虫协议、机器人协议#xff0c;全名为网络爬虫排除标准#xff0c;用来告诉爬虫和搜索引擎哪些页面可以爬取、哪些不可以。它通常是一个叫做robots.txt的文本文件#xff0c;一般放在网站的根目录下。 robots.txt文件的样例 对有所爬虫均生效#…定义 Robots协议也称作爬虫协议、机器人协议全名为网络爬虫排除标准用来告诉爬虫和搜索引擎哪些页面可以爬取、哪些不可以。它通常是一个叫做robots.txt的文本文件一般放在网站的根目录下。 robots.txt文件的样例 对有所爬虫均生效只能爬取public目录 User-agent:* Disallow:/ Allow:/public/禁止所有爬虫访问所有目录 User-agent:* Disallow:/允许所有爬虫访问所有目录 User-agent:* Disallow:禁止所有爬虫访问网站某些目录也可以写做 User-agent:* Disallow:/private/ Disallow:/tmp/只允许某一个爬虫访问所有目录 User-agent:WebCrawler Disallow: User-agent:* Disallow:/一些常见的爬虫名称 robotparser使用 该模块提供了一个类RobotFileParser,它可以根据某网站的robots.txt文件判断一个爬虫是否有权限爬取这个网页。 RobotFileParser类的常用方法 set_url:用来设置robots.txt文件的链接。read:读取robots.txt文件进行分析。parse:用来解析robots.txt文件can_fetch:该方法有两个参数第一个是User-Agent,第二个是要抓取的URL。返回结果是True或者False表示User-Agent指示的搜索引擎是否可以抓取这个URL。mtime返回上次抓取和分析robots.txt文件的时间。modified:它对长时间分析和抓取的搜索爬虫很有帮助可以将当前时间设置为上次抓取和分析robots.txt文件的时间 代码示例 from urllib.robotparser import RobotFileParserrp RobotFileParser() rp.set_url(http://www.baidu.com/robots.txt) rp.read()print(rp.can_fetch(Baiduspider, http://www.baidu.com)) print(rp.can_fetch(Baiduspider, http://www.baidu.com/homepage/)) print(rp.can_fetch(Googlebot, http://www.baidu.com/homepage/))这里能看到Googlebot是被严格禁止了的所以为false 注 以上便是robots协议的学习笔记整理来源于当前正在看的一本书–《Python3网络爬虫开发实战》。后面会持续学习并整理的。 感谢阅读~
http://www.dnsts.com.cn/news/257192.html

相关文章:

  • 网站开发 上海有哪些免费推广网站
  • 德州手机网站建设报价拟定建设方案物流网站
  • 淄博网站制作定制齐齐哈尔做网站公司
  • 58同城网站建设 推广徐州百度seo排名
  • 泸友科技网站如何做国外销售网站
  • 网站建设安全规划响应式网页开发
  • 网站 通管局 报备网站建设免费建站免费源代码
  • 免费个人网站自助建设百度收录工具
  • 网站详情页链接怎么做深圳航空公司订票电话
  • 常用的网站建设程序有那些wordpress poetry
  • 古典网站织梦模板互联网创业有哪些项目
  • 赣州深科网站建设抖音seo排名优化公司
  • 那间公司做网站好无锡网站制作公司
  • 优质服务的网站设计制作百度搜索网站排名
  • 创业公司做网站英文网站建设优化
  • 服装公司网站接推广任务的平台
  • 网站发送邮件功能专门做奢侈品的网站有哪些
  • 做外贸需掌握的网站烟台企业展厅设计
  • 贝贝网网站开发背景重庆网站建设总结
  • 辽宁建设工程信息网中标公示几天中国seo公司
  • 深圳网站seo外包公司哪家好网站第一关键词怎么做
  • 德州网站开发人员广企网站建设
  • 内网建站教程seo的优点有哪些
  • 网站建设学多久济宁建设网站首页
  • 如何为网站做推广什么文案容易上热门
  • 北京网站建设华网用户体验设计的重要性
  • 农业网站电子商务平台建设方案申请网站域名怎么做
  • 随州北京网站建设好的公司网站有什么用
  • 做网站有什么平台什么网站可以做推广
  • 山西电商网站开发深圳注册公司代理机构