当前位置: 首页 > news >正文

南京做网站南京乐识专心济南骏驰网站开发

南京做网站南京乐识专心,济南骏驰网站开发,企业做不做网站的坏处,网站开发 沈阳先来说实现逻辑#xff0c;首先我要获取到这个网站上所有的信息#xff0c;那么我们就可以开始对元素进行检查 我们发现他的每一个学校信息都有一个对应的属性#xff0c;并且是相同的#xff0c;那么我们就可以遍历这个网页中的所有属性一样的开始爬取 在来分析#xff0… 先来说实现逻辑首先我要获取到这个网站上所有的信息那么我们就可以开始对元素进行检查 我们发现他的每一个学校信息都有一个对应的属性并且是相同的那么我们就可以遍历这个网页中的所有属性一样的开始爬取 在来分析我们会发现是不是我们不只是要获取到一页的数据我们要获取这个网站上所有的大学数据对吧那么我们就要获取到这个按钮然后通过模拟用户操作webdriver来模拟用户点击执行然后在对这个数据来进行保存当然这个数据是保存到数据库中的 import timefrom selenium import webdriver from selenium.common.exceptions import TimeoutException, NoSuchElementException from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as ECdriver webdriver.Chrome()url https://www.gaokao.cn/lineschool driver.get(url)try:# 等待直到元素加载完成element WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.CLASS_NAME, ant-btn-primary)))# 点击按钮element.click() except TimeoutException:pass# 提取学校信息 school_infos driver.find_elements(By.CLASS_NAME, line-school_schoolInfo__1sdvn) # 初始化列表用于存储提取的信息 school_data []# 循环执行点击操作 for i in range(3):print(第 str(i))# # 将页面滚动到最底部# driver.execute_script(window.scrollTo(0, document.body.scrollHeight);)# 点击下一页next_page_element driver.find_element(By.CLASS_NAME, ant-pagination-next)next_page_element.click()try:driver.find_element(By.CLASS_NAME, login-popup_wordIcon__ljiP9).click()password_login_element driver.find_element(By.XPATH, //div[classlogin-popup_passwordItem__OouFG])password_login_element.click()time.sleep(2)name driver.find_element(By.CSS_SELECTOR, .login-popup_inputItem__29c36 .undefined )name.send_keys(15573491551)password_input_element driver.find_element(By.XPATH, //input[typepassword])password Tjt987666password_input_element.send_keys(password)# 找到复选框并点击选中checkbox_element driver.find_element(By.XPATH, //input[typecheckbox])checkbox_element.click()# 获取到点击按钮driver.find_element(By.CLASS_NAME, login-popup_loginBtn__3buCc ).click()except TimeoutException:print(没有继续下一步)school_infos driver.find_elements(By.CLASS_NAME, line-school_schoolInfo__1sdvn)# 遍历每个学校信息for school_info in school_infos:print(数据执行)# 提取学校名称和所在城市信息name_element school_info.find_element(By.CSS_SELECTOR, .line-school_schoolName__1Zk8b em)city_element school_info.find_element_by_class_name(line-school_cityName__VnOjC)school_name name_element.textcity_name city_element.text# 提取标签信息tags_elements school_info.find_elements_by_class_name(line-school_tagName__1Hr9k)tags_text [tag.text for tag in tags_elements]# 获取最后一个 span 标签的文本值last_span_text school_info.find_element(By.XPATH,.//div[classline-school_tags__3Cdah]//span[last()]).text# 提取数字部分score_value last_span_text.split()[-1]# 存储学校信息为元组school_tuple (school_name, city_name, tags_text, score_value)# 将元组添加到列表中school_data.append(school_tuple)for school_tuple in school_data:print(school_tuple)
http://www.dnsts.com.cn/news/249369.html

相关文章:

  • 廊坊企业网站团队网站设计研究方法
  • 自己如何建设刷赞网站专业上海网站建设
  • 国税网站上如何做股权变更招聘网站有哪些
  • 海南建设网站公司建设网站的报告
  • 网站整体迁移该怎么做wordpress 调用图片
  • 网站建设还好做吗wordpress get categories
  • 网站开发需要考什么证wordpress+任务发布插件
  • 免费网站建立做网站代码的含义
  • 广州电信网站备案mcms怎么做网站
  • 常见的网站建设程序有哪些如何把官网
  • 微信做单页的网站google官网登录入口
  • 网站模版的软件网站开发参考资料
  • 重庆网站推广入口无锡网站设计系统
  • 企业网站建设维护合同书怎么制作手机网站平台
  • 福州网站seo推广优化昆明做网站建设的公司哪家好
  • 网站开发哪一种语言好重庆装修贷款利率是多少
  • 芜湖市网站建设公司国内做led灯网站有
  • 做设计找图有哪些网站服务器和电脑主机的区别
  • 东莞建设工程交易中心网站网站建设教程小说
  • 成都网站建设招标网站设计的知识技能
  • app和网站哪个难做成都网站制作机构
  • 网站建设公司网址大全iis部署网站提示建设中
  • 南京建站公司哪家好500元制作网站
  • 单页网站如何制作网站建设流程是什么
  • 实名网站审核中心全国十大装修公司排名全国装修公司哪家好
  • 淘宝客做网站要钱吗上海地图
  • 龙岗网站设计机构艺梵科技 网站建设
  • 做网站小程序挣钱吗杭州建德网站建设
  • 校园类网站建设珠宝商城网站模板免费下载
  • 企业做增资 网站平台书籍网站建设规划书