当前位置: 首页 > news >正文

海外访问国内网站 dnswordpress 同步微信

海外访问国内网站 dns,wordpress 同步微信,义乌便宜自适应网站建设厂家,软件开发技术管理系统研发豆瓣电影Top250 豆瓣榜单简介需求描述Python实现 豆瓣榜单简介 豆瓣电影 Top 250 榜单是豆瓣网站上列出的评分最高、受观众喜爱的电影作品。这个榜单包含了一系列优秀的影片#xff0c;涵盖了各种类型、不同国家和时期的电影。 需求描述 使用python爬取top250电影#xff… 豆瓣电影Top250 豆瓣榜单简介需求描述Python实现 豆瓣榜单简介 豆瓣电影 Top 250 榜单是豆瓣网站上列出的评分最高、受观众喜爱的电影作品。这个榜单包含了一系列优秀的影片涵盖了各种类型、不同国家和时期的电影。 需求描述 使用python爬取top250电影获取相应电影排名电影名星级 打分和评论人数信息将信息输出到Excel表格中。 Python实现 获取爬取网页 def download_all_htmls(index list(range(0, 250, 25))):htmls []for idx in index:url fhttps://movie.douban.com/top250?start{idx}filterprint(craw html:, url)# 豆瓣具有反爬虫机制添加headersheaders {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36}r requests.get(url, headers headers)if r.status_code ! 200:raise Exception(error)htmls.append(r.text)return htmls解析得到单个网页内容 def parse_single_heml(html):soup BeautifulSoup(html, html.parser)article_items soup.find(div, class_article)\.find(ol, class_grid_view)\.find_all(div, class_item)datas []for article_item in article_items:rank article_item.find(div, class_pic).find(em).get_text()info article_item.find(div, class_info)title info.find(div, class_hd).find(span, class_title).get_text()stars info.find(div, class_bd).find(div, class_star).find_all(span)rating_star stars[0][class][0]rating_num stars[1].get_text()comments stars[3].get_text()datas.append({rank: rank,title: title,rating_star: rating_star.replace(rating,).replace(-t,),rating_num: rating_num,comments: comments.replace(人评价, )})return datas爬取相关内容并将结果写入Excel import requests from bs4 import BeautifulSoup import pandas as pd import pprint import jsonhtmls download_all_htmls() all_datas [] for html in htmls:all_datas.extend(parse_single_heml(html)) df pd.DataFrame(all_datas) df.to_excel(practice03_豆瓣电影top250.xlsx, indexFalse)结果展示
http://www.dnsts.com.cn/news/231647.html

相关文章:

  • 采集wordpress整站数据网站分析的优劣势
  • 网站标签设计整合营销是什么
  • 山东做网站找哪家好茂名建设局网站
  • 个人主页网站制作教程全网营销推广有哪些平台
  • 比较出名做耐克的网站无锡新闻最新消息今天
  • 制作一个网站的流程有哪些科技工作室网站模板
  • 做企业网站需要注意哪些seo站外推广有哪些
  • 济宁网站建设济宁最好的网络推广方式
  • 传销公司做网站什么罪名上海网站建设公司sky
  • 西安建设网站办公电脑租赁平台
  • 山东住房与城乡建设部网站苏州专业网站建设设计公司排名
  • 公司建设网站的费用苏州小程序开发
  • 西安做网站商标眉山网站设计
  • php网站开发技术代码新闻稿发布平台
  • 零基础学建网站网站建设主管的策划案
  • 中国建设企业银行网站首页Wordpress虚拟网址
  • 湛江市住房和城乡建设网站在线制作图片渐变色
  • muse做网站arcengine网站开发
  • 做律师咨询网站三只松鼠的网络营销方式
  • 观澜网站制作多个 管理 wordpress
  • 企业网站建设公司电话wordpress访问速度太慢
  • 国外教做蛋糕的网站乐清本地网站
  • 网站建设公司服务公司北京网络技术有限公司
  • 深圳有做网站的公司公司网站建设哪个好
  • 免费做产品宣传的网站平面图在线设计
  • 做gif动图的网站犯法吗廊坊制作网站模板建站公司
  • 龙岗区网站建设事件营销ppt
  • 网站导航栏字体平台商城网站建设
  • 高校档案室网站建设二维码制作网站
  • 贺州同城购物网站建设龙胜网站建设公司