当前位置: 首页 > news >正文

自己如何做购物网站如何修改公司网站内容

自己如何做购物网站,如何修改公司网站内容,wordpress用思源黑体,昆山广告设计制作公司本项目纯学习使用。 1 scrapy 代码 爬取逻辑非常简单#xff0c;根据url来处理翻页#xff0c;然后获取到详情页面的链接#xff0c;再去爬取详情页面的内容即可#xff0c;最终数据落地到excel中。 经测试#xff0c;总计获取 11299条中医药材数据。 import pandas as…本项目纯学习使用。 1 scrapy 代码 爬取逻辑非常简单根据url来处理翻页然后获取到详情页面的链接再去爬取详情页面的内容即可最终数据落地到excel中。 经测试总计获取 11299条中医药材数据。 import pandas as pd import scrapyclass ZhongyaoSpider(scrapy.Spider):name zhongyaostart_urls [fhttps://www.zysj.com.cn/zhongyaocai/index__{i}.html for i in range(1, 27)]def __init__(self, *args, **kwargs):self.data []def parse(self, response):for li in response.css(div#list-content ul li):a_tag li.css(a)title a_tag.css(::attr(title)).get()href a_tag.css(::attr(href)).get()if title and href:# 构建完整的详情页 URLdetail_url response.urljoin(href)yield scrapy.Request(detail_url, callbackself.parse_detail, meta{title: title})# 解析逻辑def parse_detail(self, response):title response.meta[title]pinyin response.css(div.item.pinyin_name_phonetic div.item-content::text).get(default).strip()alias response.css(div.item.alias div.item-content p::text).get(default).strip()english_name response.css(div.item.english_name div.item-content::text).get(default).strip()source response.css(div.item.alias div.item-content p::text).get(default).strip()# 性味flavor response.css(div.item.flavor div.item-content p::text).get(default).strip()functional_indications response.css(div.item.flavor div.item-content p::text).get(default).strip()usage response.css(div.item.usage div.item-content p::text).get(default).strip()excerpt response.css(div.item.excerpt div.item-content::text).get(default).strip()#habitat response.css(div.item.habitat div.item-content p::text).get(default).strip()# 出处provenance response.css(div.item.provenance div.item-content p::text).get(default).strip()# 性状shape_properties response.css(div.item.shape_properties div.item-content p::text).get(default).strip()# 归经attribution response.css(div.item.attribution div.item-content p::text).get(default).strip()# 原形态prototype response.css(div.item.prototype div.item-content p::text).get(default).strip()# 名家论述discuss response.css(div.item.discuss div.item-content p::text).get(default).strip()# 化学成分chemical_composition response.css(div.item.chemical_composition div.item-content p::text).get(default).strip()item {title: title,pinyin: pinyin,alias: alias,source: source,english_name: english_name,habitat: habitat,flavor: flavor,functional_indications: functional_indications,usage: usage,excerpt: excerpt,provenance: provenance,shape_properties: shape_properties,attribution: attribution,prototype: prototype,discuss: discuss,chemical_composition: chemical_composition,}self.data.append(item)yield itemdef closed(self, reason):# 当爬虫关闭时保存数据到 Excel 文件df pd.DataFrame(self.data)df.to_excel(zhongyao_data.xlsx, indexFalse)2 爬取截图 3 爬取数据截图
http://www.dnsts.com.cn/news/158187.html

相关文章:

  • 网站模板目录一个新品牌怎样营销推广
  • wordpress 插件路径seo优化能提高网站的流量吗
  • 北京市住房城乡建设部网站古镇免费网站建设
  • 做网站纸张大小邢台ps网络设计
  • 起重机网站怎么做只做一页的网站多少钱
  • 公司需要一个简单的网站保定市网站制作
  • 海口公司网站建设西安市建设工程交易信息网
  • 贵阳网络营销推广专家大连网站seo顾问
  • 做静态网站步骤如何优化关键词提升相关度
  • 一键网站建站系统房屋设计软件有哪些
  • 给企业做网站用什么程序机械类外贸网站建设
  • 制作app免费网站模板下载什么是网络广告营销
  • 邵阳做网站的公司网站的关键词
  • 中国人做外贸网站都卖什么wordpress 工具安装教程
  • 站长怎么添加网站内容二级域名注册平台
  • 做轮播海报的网站网站后台上传图片失败
  • 哪个网站做的游戏好玩wordpress mu下载
  • 网站访客qq号码获取mine-video wordpress
  • 网站地图无法生成2023一般纳税人企业所得税怎么算
  • 如何找网站制作wordpress 国产主题
  • 青岛网站制作设计设计工作一般多少工资
  • 大型大型网站制作兰州网站建设运营方案
  • 品牌建设 网站网站建设费属于哪个税种
  • 外贸网站优势注册公司流程和费用公司注册
  • 标准网站建设合同网站备案每年一次
  • 古董交易网站怎么做泰州做网站淘宝
  • 中国建设银行网站签名通下载郑州的建设网站有哪些手续费
  • 微页制作网站模板下载天津网站建设优化企业
  • 贵阳建网站做任务领积分兑换别的网站上的会员
  • 网站名称是网址吗数字营销策划