当前位置: 首页 > news >正文

网站翻页建设工程抗震应当坚持的原则

网站翻页,建设工程抗震应当坚持的原则,wordpress 腾讯云oss,电商数据分析网站JavaScript动态渲染界面爬取-Selenium实战 爬取的网页为#xff1a;https://spa2.scrape.center#xff0c;里面的内容都是通过Ajax渲染出来的#xff0c;在分析xhr时候发现url里面有token参数#xff0c;所有我们使用selenium自动化工具来爬取JavaScript渲染的界面。 fr…JavaScript动态渲染界面爬取-Selenium实战 爬取的网页为https://spa2.scrape.center里面的内容都是通过Ajax渲染出来的在分析xhr时候发现url里面有token参数所有我们使用selenium自动化工具来爬取JavaScript渲染的界面。 from selenium import webdriver from selenium.webdriver.common.by import By from selenium.common.exceptions import TimeoutException, NoSuchElementException from selenium.webdriver.support.ui import WebDriverWait import logging from selenium.webdriver.support import expected_conditions import re import json from os import makedirs from os.path import exists# 配置日志 logging.basicConfig(levellogging.INFO, format%(asctime)s - %(levelname)s: %(message)s) # 基本url url https://spa2.scrape.center/page/{page} # selenium初始化 browser webdriver.Chrome() # 显式等待初始化 wait WebDriverWait(browser, 10) book_url list()# 目录设置 RESULTS_DIR results exists(RESULTS_DIR) or makedirs(RESULTS_DIR) # 任意异常 class ScraperError(Exception):pass# 获取书本URL def PageDetail(URL):browser.get(URL)try:all_element wait.until(expected_conditions.presence_of_all_elements_located((By.CSS_SELECTOR, .el-card .name)))return all_elementexcept TimeoutException:logging.info(Time error happen in %s while finding the href, URL)# 获取书本信息 def GetDetail(book_list):try:for book in book_list:browser.get(book)URL browser.current_urlbook_name wait.until(expected_conditions.presence_of_element_located((By.CLASS_NAME, m-b-sm))).textcategories [elements.text for elements in wait.until(expected_conditions.presence_of_all_elements_located((By.CSS_SELECTOR, .categories button span)))]content wait.until(expected_conditions.presence_of_element_located((By.CSS_SELECTOR, .item .drama p[data-v-f7128f80]))).textdetail {URL: URL,book_name: book_name,categories: categories,content: content}SaveDetail(detail)except TimeoutException:logging.info(Time error happen in %s while finding the book detail, browser.current_url)# JSON文件保存 def SaveDetail(detail):cleaned_name re.sub(r[\/:*?|], _, detail.get(book_name))detail[book_name] cleaned_namedata_path f{RESULTS_DIR}/{cleaned_name}.jsonlogging.info(Saving Book %s..., cleaned_name)try:json.dump(detail, open(data_path, w, encodingutf-8),ensure_asciiFalse, indent2)logging.info(Saving Book %s over, cleaned_name)except ScraperError as e:logging.info(Some error happen in %s while saving the book detail, cleaned_name)# 主函数 def main():try:for page in range(1, 11):for each_page in PageDetail(url.format(page page)):book_url.append(each_page.get_attribute(href))GetDetail(book_url)except ScraperError as e:logging.info(An abnormal position has occurred)finally:browser.close()if __name__ __main__:main()
http://www.dnsts.com.cn/news/131621.html

相关文章:

  • 商业网站开发实训报告总结媒体平台是什么
  • 深圳网站设计建设公司建设厅是做什么的
  • 网站被加黑链软件商店2023
  • 汽车装饰网站源码wordpress如何从网站登录后台
  • 群晖如何做网站服务器广东网约车涨价
  • 网站建设的技巧有哪些软件开发培训思摩特
  • 企业宣传片广告制作站长工具seo综合查询广告
  • 室内效果图代做网站优秀的网页设计案例
  • 网站海外推广建一个自己的网站需要多少钱
  • 小城镇建设网站答案创意网站设计团队
  • 武昌区建设局网站蜀都网站建设舜王
  • 合肥网站制作推广泰来县城乡建设局网站
  • 专业网站设计发展前景网页设计是什么职业
  • 网站制作培训网站申请
  • 建设文明网 联盟网站的wordpress增加广告
  • 做网站全包营销型网站建设风格设定包括哪些方面?
  • 重庆建站模板搭建公司网站建设费用预算
  • 西安做网站的公司北京公司招聘
  • 云南建设注册考试中心网站深圳福田香格里拉酒店
  • 做电影网站考什么成都管控最新通告
  • 买服务器做网站 镜像选什么美容加盟的网站建设
  • 网站项目开发收费标准合肥设计网站公司
  • 从化手机网站建设tv域名的网站
  • 建设项目环境影响评价登记表网站jsp小型网站开发代码
  • 网站优化推广费用学做网站课程
  • 娄底网站开发室内设计图片大全
  • 王者荣耀网站建设的步骤阿里巴巴网站建设建议
  • 怎样查一个网站的空间商网站优化一般怎么做
  • 南宁做网站比较好的公司网站开发中期检查
  • 做礼品的网站qingdao城乡住房建设厅网站