当前位置: 首页 > news >正文

洛阳做网站找哪家好长沙品牌网站制作服务报价

洛阳做网站找哪家好,长沙品牌网站制作服务报价,wordpress最简易主题,对于给不良网站发律师函如何做此篇文章主要介绍如何使用 Selenium 模块实现 无界面模式 执行JS脚本(把滚动条拉到底部)#xff0c;并以具体的示例进行展示。 1、Selenium 设置无界面模式 创建浏览器对象之前#xff0c;创建 options 功能对象 #xff1a;options webdriver.ChromeOptions() 添加…此篇文章主要介绍如何使用 Selenium 模块实现 无界面模式 执行JS脚本(把滚动条拉到底部)并以具体的示例进行展示。 1、Selenium 设置无界面模式 创建浏览器对象之前创建 options 功能对象 options webdriver.ChromeOptions() 添加无界面功能参数options.add_argument(--headless) 构造浏览器对象打开浏览器并设置 options 参数 browser webdriver.Chrome(optionsoptions) from selenium import webdriver options webdriver.ChromeOptions()  # 创建浏览器对象之前创建options功能对象 options.add_argument(--headless)  # 添加无界面功能参数 browser webdriver.Chrome(optionsoptions)  # 构造浏览器对象打开浏览器 2、Selenium 执行JS脚本 创建浏览器对象browser webdriver.Chrome() 执行JS脚本browser.execute_script() 最常用脚本 - 把滚动条拉到底部browser.execute_script(window.scrollTo(0,document.body.scrollHeight)) from selenium import webdriver browser webdriver.Chrome() # 创建浏览器对象 browser.execute_script(     window.scrollTo(0,document.body.scrollHeight) ) # 把滚动条拉到最底部 3、Selenium 设置无界面模式 执行JS脚本 案例 3.1 需求分析 基于 Selenium Chrome 抓取 http://www.jd.com/ 下 “python书籍” 的信息 3.2 爬虫思路 打开浏览器输入主页地址https://www.jd.com/ 使用 Selenium 的 Xpath 找到 信息输入框 和 点击搜索 节点//*[idkey] //*[idsearch]/div/div[2]/button 输入 “python书籍” 并点击 点击搜索按钮 使用 Selenium 的 Xpath 找到 书籍信息 节点对象列表 //*[idJ_goodsList]/ul/li  依次遍历每个元素并依次提取每本书籍信息 爬取完一页信息后需要判断是否是最后一页 可以看到 最后一页的节点信息为pn-next disabled 非最后一页的节点信息为pn-next 如果不是最后一页点击下一页继续进行爬取//*[idJ_bottomPage]/span[1]/a[9] 3.3 程序实现 初始化函数     def __init__(self):         # 设置为无界面         self.options webdriver.ChromeOptions()  # 创建浏览器对象之前创建options功能对象         self.options.add_argument(--headless)  # 添加无界面功能参数         self.driver webdriver.Chrome(optionsself.options)  # 构造浏览器对象打开浏览器         self.driver.get(urlhttp://www.jd.com/)  # 进入主页         # 搜索框发送python书籍点击搜索按钮         self.inputJD self.driver.find_element(By.XPATH, //*[idkey])  # 搜索框xpath://*[idkey]         self.inputJD.send_keys(python书籍)         self.driver.find_element(By.XPATH,                                  //*[idsearch]/div/div[2]/button).click()  # 搜索按钮xpath//*[idsearch]/div/div[2]/button 并点击         time.sleep(1)  # 要给页面元素加载预留时间 提取数据函数 def parse_html(self):                 function:  具体提取数据方法               in:  None              out:  None           return:  None           others:  Data Extraction Func                 self.driver.execute_script(             window.scrollTo(0,document.body.scrollHeight)         )  # 先把滚动条拉到最底部等待所有商品加载完成再进行数据爬取         time.sleep(3)  # 给页面元素加载预留时间         # 具体提取数据         li_list self.driver.find_elements(By.XPATH,                                             //*[idJ_goodsList]/ul/li)  # 基准xpath//*[idJ_goodsList]/ul/li 每一个商品对应一个li节点         item {}  # 定义一个空字典         for li in li_list:             item[名称] li.find_element(By.XPATH, .//div[classp-name]/a/em).text.strip()             item[价格] li.find_element(By.XPATH, .//div[classp-price]/strong).text.strip()             item[评价] li.find_element(By.XPATH, .//div[classp-commit]/strong).text.strip()             item[商家] li.find_element(By.XPATH, .//div[classp-shopnum]).text.strip()             print(item)  # 打印 程序入口函数 def run(self):                 function:  程序入口函数               in:  None              out:  None           return:  None           others:  Program Entry Func                 while True:             self.parse_html()             # 不是最后一页pn-next             # 最后一页pn-next disabled             if self.driver.page_source.find(pn-next disabled) -1:  # 没有找到 pn-next disabled说明不是最后一页                 self.driver.find_element(By.XPATH, //*[idJ_bottomPage]/span[1]/a[9]).click()                 time.sleep(1)             else:                 self.driver.quit()                 break 3.4 完整代码 import time from selenium import webdriver from selenium.webdriver.common.by import By class JDSpider:     def __init__(self):         # 设置为无界面        self.options webdriver.ChromeOptions()  # 创建浏览器对象之前创建options功能对象         self.options.add_argument(--headless)  # 添加无界面功能参数         self.driver webdriver.Chrome(optionsself.options)  # 构造浏览器对象打开浏览器         self.driver.get(urlhttp://www.jd.com/)  # 进入主页         # 搜索框发送python书籍点击搜索按钮         self.inputJD self.driver.find_element(By.XPATH, //*[idkey])  # 搜索框xpath://*[idkey]         self.inputJD.send_keys(python书籍)         self.driver.find_element(By.XPATH,                                  //*[idsearch]/div/div[2]/button).click()  # 搜索按钮xpath//*[idsearch]/div/div[2]/button 并点击         time.sleep(1)  # 要给页面元素加载预留时间 def parse_html(self):                 function:  具体提取数据方法               in:  None              out:  None           return:  None           others:  Data Extraction Func                 self.driver.execute_script(             window.scrollTo(0,document.body.scrollHeight)         )  # 先把滚动条拉到最底部等待所有商品加载完成再进行数据爬取         time.sleep(3)  # 给页面元素加载预留时间         # 具体提取数据         li_list self.driver.find_elements(By.XPATH,                                             //*[idJ_goodsList]/ul/li)  # 基准xpath//*[idJ_goodsList]/ul/li 每一个商品对应一个li节点         item {}  # 定义一个空字典         for li in li_list:             item[名称] li.find_element(By.XPATH, .//div[classp-name]/a/em).text.strip()             item[价格] li.find_element(By.XPATH, .//div[classp-price]/strong).text.strip()             item[评价] li.find_element(By.XPATH, .//div[classp-commit]/strong).text.strip()             item[商家] li.find_element(By.XPATH, .//div[classp-shopnum]).text.strip()             print(item)  # 打印 def run(self):                 function:  程序入口函数               in:  None              out:  None           return:  None           others:  Program Entry Func                 while True:             self.parse_html()             # 不是最后一页pn-next             # 最后一页pn-next disabled             if self.driver.page_source.find(pn-next disabled) -1:  # 没有找到 pn-next disabled说明不是最后一页                 self.driver.find_element(By.XPATH, //*[idJ_bottomPage]/span[1]/a[9]).click()                 time.sleep(1)             else:                 self.driver.quit()                 break if __name__ __main__:     spider JDSpider()     spider.run() 3.5 实现效果
http://www.dnsts.com.cn/news/203329.html

相关文章:

  • 蓝众建站_专业网站建设模板ppt免费
  • 画册设计报价明细表南昌seo网站建设
  • 成品网站源码下载wordpress5.0编辑器
  • 新营销平台电商网站网络优化大师手机版
  • 网站建设 哪家好群晖wordpress端口映射
  • 网站后期维护方案企业做网站的注意
  • 建设网站需要什么基础知识wordpress首页密码访问
  • 东莞外贸网站设计建设工程设计招标信息网站.
  • 网站设计制作价钱低北京公司注册查询
  • 站长工具短链接生成手机网站demo
  • 简单大气的网站网站建设 任务
  • 山楂树建站公司wordpress简
  • 免费发布广告信息的网站外链兔
  • asp汽车驾驶培训学校网站源码微博网站开发平台
  • 优惠券网站开发深圳搜狗seo
  • 关于做网站策划书app介绍网站模板免费下载
  • 网站推广公司就去柚米正规的镇江网站建设
  • 网站制作招聘上海普陀门户网站
  • 建设培训网站淘宝优惠券发布网站怎么做
  • 网站建设调查报告中国新闻社归哪个部门管
  • 网站不用域名可以吗注册中文域名费用一般多少钱
  • 佛山网站建设网站制作公司网站建设和应用的情况
  • 福州建设人才网站sae wordpress 4.3
  • 晋中住房与城乡建设厅网站娱乐城网站开发
  • 网站建设不用备案的wordpress pods
  • 确定网站主题鞍山人才网站
  • 网站推广广告营销方案音乐排行榜网页设计作业
  • 海淀重庆网站建设html好看的颜色代码
  • 网站建设程序制作设计网站会员哪个好用
  • 长沙网页建站dz网站模板 首页显示内容