当前位置: 首页 > news >正文

土特产网站建设事业计划书江门网站制作系统

土特产网站建设事业计划书,江门网站制作系统,微信小程序申请,公司网站内容模块布局前言#xff1a; 本篇文章主要作为一个爬虫项目的小练习#xff0c;来给大家进行一下爬虫的大致分析过程以及来帮助大家在以后的爬虫编写中有一个更加清晰的认识。 一#xff1a;环境配置 Python版本#xff1a;3.7 IDE:PyCharm 所需库#xff1a;requests#xff0…前言 本篇文章主要作为一个爬虫项目的小练习来给大家进行一下爬虫的大致分析过程以及来帮助大家在以后的爬虫编写中有一个更加清晰的认识。 一环境配置 Python版本3.7 IDE:PyCharm 所需库requestsbs4,xlwt 二网页分析 1我们需要去找到user-Agent 三编写代码  1导入所需库 import requests from bs4 import BeautifulSoup import xlwt 2编写请求头与参数 url https://trains.ctrip.com/TrainBooking/Search.aspx headers{User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36,Cookie:UnionOUIDindexAllianceID4897SID155952SourceIDcreatetime1693561627Expires1694166426834; MKT_OrderClickASID4897155952AID4897CSID155952OUIDindexCT1693561626835CURLhttps%3A%2F%2Fwww.ctrip.com%2F%3Fsid%3D155952%26allianceid%3D4897%26ouid%3DindexVAL{}; _ubtstatus%7B%22vid%22%3A%221693561626984.ex3rp%22%2C%22sid%22%3A1%2C%22pvid%22%3A1%2C%22pid%22%3A102001%7D; MKT_CKID1693561627205.kumds.y2nu; MKT_CKID_LMT1693561627205; GUID09031035213146004963; _jzqco%7C%7C%7C%7C1693561627595%7C1.1256646287.1693561627210.1693561627210.1693561627210.1693561627210.1693561627210.0.0.0.1.1; _RF1183.230.199.69; _RSG..qaukvM.m2ykJjUVrQ3T8; _RDG28437eee4e4c56259b173f8be0c752f59b; _RGUID2c3e5b9b-b893-4fbe-8743-6b57deb53bbc; MKT_PagesourcePC; _bfaStatusPVSend1; _bfip1%3D102001%26p2%3D0%26v1%3D1%26v2%3D0; _bfaStatussuccess; nfes_isSupportWebP1; nfes_isSupportWebP1; Hm_lvt_576acc2e13e286aa1847d8280cd967a51693561632; UBT_VID1693561626984.ex3rp; __zpspc9.1.1693561627.1693561631.3%232%7Cwww.baidu.com%7C%7C%7C%25E6%2590%25BA%25E7%25A8%258B%7C%23; _resDomainhttps%3A%2F%2Fbd-s.tripcdn.cn; Hm_lpvt_576acc2e13e286aa1847d8280cd967a51693580464; _bfa1.1693561626984.ex3rp.1.1693580463154.1693580623580.1.6.10650065554; _pd%7B%22_o%22%3A30%2C%22s%22%3A154%2C%22_s%22%3A1%7D } params{from:wushan,to:chongqing,dayday:false,fronCn:巫山,toCn:重庆,date:2023-09-02, } 3发送请求并编写表头把数据写入excel文件 responserequests.get(urlurl,headersheaders,paramsparams) soupBeautifulSoup(response.text,html.parser) ticket_listsoup.select(#div_Result .list_item)workbook xlwt.Workbook(encodingutf-8) worksheetworkbook.add_sheet(Ticket Info,cell_overwrite_okTrue)worksheet.write(0,0,label车次) worksheet.write(0,1,label出发时间) worksheet.write(0,2,label到达时间) worksheet.write(0,3,label历时) worksheet.write(0,4,label余票)row1 for ticket in ticket_list:train_noticket.select(.numa)[0].text.strip()start_timeticket.select(.cds .start_time)[0].text.strip()end_time ticket.select(.cds .end_time)[0].text.strip()duration ticket.select(.cds .time)[0].text.strip()remarks ticket.select(.cds .note)[0].text.strip()ticket_url https://trains.ctrip.com/TrainBooking/TrainQuery.aspxticket_params{from:wushan,to:chongqing,dayday:false,date:2023-09-02,trainNo:train_no,}ticket_responserequests.get(ticket_url,headersheaders,paramsticket_params)ticket_soupBeautifulSoup(ticket_response.text,html.parser)ticket_remainingticket_soup.select(.new_situation p span)[0].text.strip()worksheet(row,0,labeltrain_no)worksheet(row, 1,labelstart_time)worksheet(row, 2,labelend_time)worksheet(row, 3,labelduration)worksheet(row, 4,labelticket_remaining)row 1print(train_no,start_time,end_time,duration,remarks,ticket_remaining) workbook.save(ticket_info.xls) 以上便是基本的源码由于12306官网具有严格的反爬机制所以不建议对12306官网进行爬取如果未经授权将会承担相关责任所以请选择其他软件进行示范不过其他软件也会具有一些反爬机制会导致爬取失败。
http://www.dnsts.com.cn/news/62606.html

相关文章:

  • 网站宽度设计推广网站如何做
  • 企业门户网站建设方案及报价wordpress上传后设置密码
  • 10黄页网站建设江苏省两学一做网站
  • 南宁商城网站建设电销防封号系统
  • 网站建设湖北企业网站网址举例
  • 如何看到网站的制作公司网站建设工种
  • 网络游戏制作软件wordpress 优化标题
  • 上海建设安全生产协会网站手机制作ppt哪种软件好
  • 信创网站建设东莞常平火车站叫什么
  • 网站建设策划书ol外贸业务网络推广
  • 怎么让网站收录在google外贸网站 自建
  • 做婚礼设计在哪个网站下载素材wordpress更换域名
  • 网站建设合同书保密条款wordpress备份数库
  • 深圳最专业的高端网站建设如何做类似于淘宝的网站
  • 海南 网站开发吉林省建设厅网站杨学武
  • 政务网站模板漳州室内设计公司排名
  • 汕头中文建站模板中核集团
  • 企业网站推广方案在哪里酒店可以采用的网络营销方式
  • 网站搜索框代码怎么做wordpress同步知乎插件
  • 重庆工程建设招标网官方网站php网站上传
  • 湖北手机网站制作wordpress新闻发布时间
  • 网站静态页面访问很快php页面访问非常慢网站开发报价
  • 网站导航是什么企业所得税怎么算2020
  • 网站中队人物介绍怎么做微信辅助网站制作
  • 网站优化方式有哪些山东建设银行怎么招聘网站
  • 佛山网站优化平台定制化网站开发一般多少钱
  • 部门网站建设意见world做网站怎么做连接
  • 箱包网站建设策划报告网站建设策划基本流程图
  • 建设厅网站合同备案在哪里.net网站做优化
  • 网站备案 注意phpstorm