当前位置: 首页 > news >正文

企业建站设计官方进一步优化

企业建站设计,官方进一步优化,wordpress 新建数据表,企业建设门户网站的需求Python爬虫:下载人生格言 爬取网页 将这些格言下载存储到本地 代码: import requests #导入requests库#xff0c;用于提取网页 from lxml import etree#导入lxml库#xff0c;用于Xpath数据解析#请求头 header{ user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) A…Python爬虫:下载人生格言 爬取网页 将这些格言下载存储到本地 代码: import requests #导入requests库用于提取网页 from lxml import etree#导入lxml库用于Xpath数据解析#请求头 header{ user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36 Edg/127.0.0.0 }#每个浏览器的user-agent不一样在浏览器中查找urlhttp://m.3chongmen.com/renshenggeyan/162.html#请求网址 res1requests.get(urlurl,headersheader).text htmletree.HTML(res1) titlehtml.xpath(//div[classtitle]/h1/text())[0]#数据解析提取标题 contenthtml.xpath(//div[classcontent]/text())#数据解析提取内容 content.join(content) print(title) print(content)运行结果: 分析: 导入requests库 requests库是第三方库要提前安装 输入指令进行安装 pip install requests*导入lxml库 输入指令 pip install lxmlheaders 最简单的只用加上user-agent就可以了 鼠标右键选择”检查“点击”网络“ctrlR刷新页面点击第一份文件点击”标头“滑到最下方查找”User-Agent“,复制到pycharm中即可 数据解析Xpath 用requets获取的源代码如图想要的信息就在这里面我们需要提取出来因此就要用到Xpath进行解析要先学习一下Xpath语法和lxml库的使用可以在网上查找相关资料 拓展 将目录下的所有人生格言提取并保存在本地 代码 import requests from lxml import etreeheader{ user-agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0.0 Safari/537.36 Edg/127.0.0.0 }def spider(url):res1requests.get(urlurl,headersheader).texthtmletree.HTML(res1)contenthtml.xpath(//div[classcontent]/text())content.join(content)titlehtml.xpath(//div[classtitle]/h1/text())[0]return title,contenturl1http://m.3chongmen.com/renshenggeyan resrequests.get(urlurl1,headersheader).text htmletree.HTML(res) linkshtml.xpath(//ul[classlist_cnt]//a[target_blank]/href)for link in links:title,contentspider(link)with open(f格言/{title}.txt,w,encodingutf-8) as f:f.write(title\n\n)f.write(content)运行结果:
http://www.dnsts.com.cn/news/103143.html

相关文章:

  • 网站建设公司哪家最好0网站建设公司宣传册
  • 凯里网站设计公司湛江seo代理商
  • 做网站的市场有那么大吗企网官方网站
  • 温州微网站制作电话刀客源码网
  • 浦东手机网站建设青岛公司建站
  • 票务网站做酒店推荐的目的杭州行业网页设计公司
  • .net网站 作品网站系统繁忙
  • 广州网站定制开发网站建设公司不挣钱的原因
  • 做餐饮网站直播软件推荐
  • 电商网站建设培训班网站建设开题报告中的问题
  • 办公用品网站建设可行性分析江门网站优化方案
  • 做陶瓷的公司网站计算机培训机构排名前十
  • 哪里有制作网站服务怎样做才能发布你的网站
  • 网站空间申请开通怎么创建游戏平台
  • 名字做头诗的网站北京网站制作与网站设计
  • 广东省建设工程安全协会网站南宁刚刚发生的事
  • php网站数据迁移青州市住房和城乡建设局网站
  • 上海 网站建设公司更换网站需要怎么做
  • 泰州网站建设开发网页链接提取
  • 蓝色网站模版济南最好的网站制作公司
  • 教育类网站开发文档wordpress显示同一分类的文章
  • 怎么找到php网站的首页面html如何提交网站给百度
  • 网站的结构是什么样的做亚马逊学英语有什么网站吗
  • 网站的切换语言都是怎么做的济南 网站 建设
  • 网页设计作业网站素材和效果图什么是网络营销传播
  • 凡科怎么做网站网站用什么系统好
  • 石家庄网站建设策略wordpress的主题
  • 王烨雄seo入门教学
  • WordPress主题DUX主题优化网站公司
  • 华云电力建设监理公司网站有没有做catalog的网站