当前位置: 首页 > news >正文

做旅游宣传网站的流程图百度网站的优势

做旅游宣传网站的流程图,百度网站的优势,北京网站建设外包,湖南株洲静默爬取当当网图书数据并保存到本地#xff0c;使用request、lxml的etree模块、pandas保存数据为excel到本地。 爬取网页的url为#xff1a; http://search.dangdang.com/?key{}actinputpage_index{} 其中key为搜索关键字#xff0c;page_index为页码。 爬取的数据…爬取当当网图书数据并保存到本地使用request、lxml的etree模块、pandas保存数据为excel到本地。 爬取网页的url为 http://search.dangdang.com/?key{}actinputpage_index{} 其中key为搜索关键字page_index为页码。 爬取的数据包括爬取的数据包括书名、作者、图书简介、出版社、出版日期、价格、评论数量。 代码如下 import random import requests from lxml import etree import pandas as pd import timedata [] data.append([书名, 作者, 图书简介, 出版社, 出版日期, 价格, 评论数量]) def get_book_info(url):headers {User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36}response requests.get(url, headersheaders)response.encoding gbkif response.status_code 200:selector etree.HTML(response.text) book_list selector.xpath(//*[idcomponent_59]/li)for book in book_list:# 书名 book_name .join(book.xpath(.//p[1]/a/title))# 作者book_author .join(book.xpath(.//p[5]/span[1]/a/title))# 图书简介book_intro .join(book.xpath(.//p[2]/text()))# 出版社book_publisher .join(book.xpath(.//p[5]/span[3]/a/title)) # 出版日期 book_date .join(book.xpath(.//p[5]/span[2]/text()))# 价格book_price .join(book.xpath(.//p[3]/span[1]/text()))# 评论数量book_comments .join(book.xpath(.//p[4]/a/text()))# 随机等待时间防止被封IPrdn random.randint(1, 5) print(f等待时间{rdn})time.sleep(rdn)data.append([book_name, book_author, book_intro, book_publisher, book_date, book_price, book_comments])if __name__ __main__: keyword input(请输入搜索关键字)page_index 1while True:url fhttp://search.dangdang.com/?key{keyword}actinputpage_index{page_index}print(f正在爬取第{page_index}页数据...)get_book_info(url)page_index 1if page_index 1:breakdf pd.DataFrame(data[1:], columnsdata[0])# 将DataFrame保存为Excel文件df.to_excel(f{keyword}.xlsx, indexFalse)
http://www.dnsts.com.cn/news/86401.html

相关文章:

  • 购物网站开发方案德江网站建设
  • 罗定市城乡规划建设局网站黑龙江省建设教育协会网站
  • 山东省建设厅招标网站首页当阳网站建设
  • 查询邮箱注册过的网站广州个人网页制作
  • 长沙网站制作公司有哪些幼儿网站源代码
  • 怎样做好网站wordpress 搭建cms
  • 做塑胶网站需要什么材料wordpress高级企业自适应主题
  • 查询网站用什么做的wordpress 分类目录使用英文
  • 安全的网站建设公做网站时怎么选择数据库类型
  • 网站建设 10万元如何更换网站服务商
  • cn网站怎么做wordpress简约下载站模板
  • 做盗版漫画网站乐华网络公司服务内容
  • 个人建站做淘客网站备案网站域名后缀有什么用
  • 保定网络营销网站苏州网站营销公司
  • 网站类网站开发教程怎么用腾讯云做网站
  • 商丘市有没有做网站怎么创建微信公众号免费
  • wordpress 安装路径宁波seo软件
  • 公司怎么做网站页面山东卓创网络网站建设
  • wp网站开发如何快速提高网站排名
  • 杭州市建设信用网官网河西网站建设优化seo
  • app加网站开发重庆新闻频道
  • 哪个网站上网好教做吃的网站
  • 网站后台系统使用wordpress加入侧边栏
  • 吉林省 网站建设小网站怎么建设
  • dw怎么新建网站漫画主体wordpress
  • 湖南郴州建设局网站本地用织梦做网站
  • 安全联盟可信任网站认证 网站wordpress手机播放
  • 网站模板 百科网站服务器购买价格
  • 拉链网站源码公司画册设计制作
  • 落地页模板网站2017年网站开发用什么语言