当前位置: 首页 > news >正文

门户网站如何做谷歌seo上海网站建设空间

门户网站如何做谷歌seo,上海网站建设空间,中国兰州,网站建设与维护工资1. 使用requests获取网页内容 以巴鲁夫产品为例#xff0c;可以用get请求获取内容#xff1a; https://www.balluff.com.cn/zh-cn/products/BES02YF 对应的网页为#xff1a; 使用简单方法进行解析即可 import requests r BES02YF res requests.get(https://www.…1. 使用requests获取网页内容 以巴鲁夫产品为例可以用get请求获取内容 https://www.balluff.com.cn/zh-cn/products/BES02YF 对应的网页为 使用简单方法进行解析即可 import requests r BES02YF res requests.get(https://www.balluff.com.cn/zh-cn/products/%s%r).text result res.split(/title)[0].split(title)[1]2. 添加多进程 使用multiprocessing进行加速以上面的balluff为例 from multiprocessing.dummy import Pool as ThreadPool from tqdm import tqdm import numpy as np import os,json,requests,base64,struct data pd.read_excel(balluff.xlsx,sheet_nameall) valuelist list(data[Type]) def getf(type_value):try:res requests.get(https://www.balluff.com.cn/zh-cn/products/%s%type_value).textreturn res.split(/title)[0].split(title)[1]except:return None results [] with ThreadPool(100) as p:results list(tqdm(p.imap(getf, valuelist), totallen(valuelist)))3. 加入header 有一些网站有防爬虫的功能需要在请求中添加header例如西门子的网站需要用如下的方法 def getf(type_value):try:headers {user-agent: Mizilla/5.0}res requests.get(https://mall.industry.siemens.com/mall/zh/CN/Catalog/Product/?mlfb%sSiepCountryCodeCN%type_value,headersheaders).text.split(productIdentifier)[1]return res.split(/span)[0].split()[-1]except:return None4. 使用selenium 以festo为例会很讨厌的弹出对话框。 我们使用selenium模拟点击。并且用find_element找到元素 from selenium import webdriver import time from selenium.webdriver.common.by import By driver webdriver.Chrome() driver.get(https://www.festo.com.cn/cn/zh/search/?text548755) f1driver.find_element(By.PARTIAL_LINK_TEXT,接受) f1.click() from tqdm import tqdm r1 [] r2 [] for type_value in tqdm(valuelist):try:driver.get(https://www.festo.com.cn/cn/zh/search/?text%s%type_value)time.sleep(1)r1.append(driver.find_element(By.CLASS_NAME,product-code--NjIDg).text)try:r2.append(driver.find_element(By.CLASS_NAME,ident-code--qx13c).text)except:r2.append(driver.find_element(By.CLASS_NAME,product-order-code--TR15s).text)except:r1.append(None)r2.append(None)5. 获取真实的requests地址 以keyence为例查看网页源代码是无法获得产品清单的需要在chrome的开发者工具中点击Network选择Fetch/XHR然后刷新页面找到Type为fetch的链接 链接为/data/api/seriesModels?siteID21languageIDzh-CNgroupIDtcm%3A115-347504typeIDtcm%3A115-347487seriesIDWS_SR_fu其中groupID开始的部分可以从源代码中获得。具体代码为 import json from tqdm import tqdm result [] for r2i in tqdm(r2):result json.loads(requests.get(https://www.keyence.com.cn/data/api/seriesModels?siteID21languageIDzh-CN\list(filter(lambda x:prd-seriesFooter-navLink of-support in x,requests.get(r2i)\.text.split(\n)))[0].split(?)[1].split(modelId)[0].replace(Id,ID)).text)[models]如果找到的链接过于难处理比如post请求带着一堆请求体那可以直接右键选择copy-copy curl然后替换其中的关键字用命令行执行即可。
http://www.dnsts.com.cn/news/240720.html

相关文章:

  • 百度站长工具如何使用雅安市建设网站
  • 重庆专业网站推广报价跨境电商怎么做无货源模式
  • 英文视频网站如何做外链制作表白网站的软件
  • 网站上传大马后怎么做春节彩灯制作公司
  • 我想建个自己的网站聊城高新区建设局网站
  • 天门市规划建设局网站如何做积分商城网站
  • 什么网站是用php做的宁波网站推广制作
  • 重庆云阳网站建设公司推荐青岛网络公司有哪些
  • asp网站变成php公司都是自己制作网站
  • 西安做网站的公司有网站百度不收录的原因
  • 做网站 客户大概会有那些问题山东省建设工程信息网站
  • mixkitcom素材网站买个天猫店多少钱一个
  • 上海网站关键词排名优化报价深圳公司视频制作
  • 美容院门户网站开发成都快速做网站
  • 谷歌官方网站登录入口丹阳建设工程管理处网站
  • 网站页面创意sns网站开发
  • 成都网站制作系统网站功能定位分析
  • 做微信头图的网站wordpress自定义小工具
  • 响应式网站开发遇到的问题wordpress搭建问题
  • 营销型网站建设吉林邢台市做网站电话
  • 物流百度推广怎么做网站南通市住房和城乡建设厅网站
  • 网站系统分析的步骤有哪些青山做网站
  • 科迪兔网站建设松江新城做网站公司
  • 帮企业建设网站销售wordpress pdf缩略图不显示
  • 深圳电子网站建设购物网站可行性分析报告
  • 江阴公司网站建设息县网站建设公司
  • 做网站如何适配手机百度权重高的发帖网站
  • 拼多多网站建设过程最新国家大事件
  • 深圳网站设计美工深夜视频在线免费
  • 手机响应式网站开发模板之家网络营销网站类型