当前位置: 首页 > news >正文

四川建设安全协会网站信誉好的集团网站建设

四川建设安全协会网站,信誉好的集团网站建设,整合营销传播方案案例,月嫂网站建设环境 1、安装nodejs 官网#xff1a;https://nodejs.org/zh-cn 下载安装好nodejs只后 验证#xff1a;node -v 出现版本号表示安装成功#xff0c;否则需要配置环境变量 2、创建node项目并初始化 随便新建一个文件夹 进入文件夹搜索cmd回车 执行npm init -y 安装依赖 …环境 1、安装nodejs 官网https://nodejs.org/zh-cn 下载安装好nodejs只后 验证node -v 出现版本号表示安装成功否则需要配置环境变量 2、创建node项目并初始化 随便新建一个文件夹 进入文件夹搜索cmd回车 执行npm init -y 安装依赖 使用vscode或webStorm打开项目,我这里使用WebStorm进行演示安装puppeteer依赖npm install puppeteer 随便新建一个test.js 中文文档:https://puppeteer.bootcss.com/ 粘贴文档中的例子看下环境是否有问题 const puppeteer require(puppeteer);(async () {const browser await puppeteer.launch();const page await browser.newPage();await page.goto(https://example.com);await page.screenshot({path: example.png});await browser.close(); })();运行node ./test.js,成功截图 选择器 浏览器谷歌浏览器 本次实践抓取B站热播榜top100的电影信息https://www.bilibili.com/movie/?spm_id_from333.1007.0.0 点击进入top100进来后的url : https://www.bilibili.com/v/popular/rank/movie/?from_spmid666.7.hotlist.more 右击排行第一的影片点击检查 可以看到右边的代码和左边的界面上阴影部分是对应的 我们需要找到一块区域包含所有top100的元素标签 右键元素 - 复制 - 复制选择器 打开控制台 在控制台输入$$(粘贴前面复制的选择器),在这里输入$$(#app div div.rank-container div.rank-list-wrap)回车 OK现在拿到了div这个标签下面包含了top100接下来我们需要层层递进。 观察元素可以发现div下面的ul是top100ul下面的li是每一个影片 在控制台递进到li使用表示递进 可以看到我们在原先的选择器后面加上 ul li就递进到了每个top现在top100拿到了接下来获取top里面的数据了 随便点开一个li看一下我们需要的信息在哪个属性里面 可以看到视频播放链接在innerHTML标题、播放量和点赞量在innerText 在控制台打印innerText看看效果$$(#app div div.rank-container div.rank-list-wrap ul li).forEach(e {console.log(e.innerText)}) Puppeteer通过选择器获取top100数据 test.js代码 const puppeteer require(puppeteer);(async () {const browser await puppeteer.launch({headless: false, // 以非无头模式启动浏览器可见浏览器窗口slowMo: 100 // 添加延迟减慢操作速度用于观察和调试});const page await browser.newPage(); // 创建一个新的页面对象await page.goto(https://www.bilibili.com/v/popular/rank/movie/?from_spmid666.7.hotlist.more); // 访问指定的 URL// 等待页面加载2秒钟await new Promise(resolve setTimeout(resolve, 4000));let top100Combined await page.$$eval(#app div div.rank-container div.rank-list-wrap ul li, lis {return lis.map(li {return {innerText: li.innerText, // 获取每个li元素的innerText属性innerHTML: li.innerHTML // 获取每个li元素的innerHTML属性};});}); // 格式化数据let top100 [];for (let top100CombinedKey in top100Combined) {const {innerText, innerHTML} top100Combined[top100CombinedKey];// 使用正则表达式匹配电影信息let parts innerText.split(\n);let rank parseInt(parts[0]);let movieName parts[1];let releaseDate parts[2];let playCount parseFloat(parts[3]);let likeCount parseFloat(parts[4]);// 构造电影对象let top {rank,movieName,releaseDate,playCount,likeCount,};// 正则表达式匹配视频播放链接let regexLink /a href(\/\/www\.bilibili\.com\/bangumi\/play\/[^])/;let matchesLink innerHTML.match(regexLink);if (matchesLink matchesLink.length 2) {let videoUrl https:${matchesLink[1]};top.videoUrl videoUrl;} else {console.log(无法提取视频播放链接);}top100.push(top)}console.log(top100);await browser.close(); // 关闭浏览器实例})() 运行脚本 运行此脚本 node ./test.js 浏览器页面可以看到数据全都抓到了
http://www.dnsts.com.cn/news/218477.html

相关文章:

  • 做啤酒纸箱包装的网站高档网站模板
  • 上海亿网站建设网站制作ppt模板
  • 长沙建网站一般多少钱医院网站制作公司
  • 搭建网站上传文件昆明网络公司网站
  • 沈阳网站关键字优化什么样的网站空间做电影网站不卡
  • 做网站的服务器怎么选建设设计院网站
  • 网站平台运营方案应用商城app开发下载
  • 建立网站需要备案吗企业邮箱收费吗
  • 免费推广网站建设建筑公司企业宗旨
  • 域名 网站wordpress 主题改多频道
  • 鹤壁做网站哪家便宜今天的新闻内容
  • 成都做网站的公司建设刷会员网站
  • 山东定制网站建设公司服务器调用wordpress
  • 怎么向搜索引擎提交网站汽车网新车报价大全
  • 文化传播公司网站模板刚开始做网站哪有免费空间
  • 做微信小程序和做网站婚纱网站html源码
  • 黑色网站贵阳网站建设q479185700棒
  • 女人做绿叶网站相亲拉人佛山企业网站多少钱
  • wordpress软件网站模板下载失败杭州建网站的公司
  • 网站建设都用哪些软件浙里建官方网站
  • 宁波网站建设网络推广济南哪里做网站好
  • 网站建设的建议和意见爱客crm软件
  • 有没有做网站的教程广州高端网页制作
  • 工程建设项目网站企业网站建设情况说明
  • 做一个什么样的网站某旅行社网站建设规划书
  • 网站建设经营范围怎么写外贸网站推广 sit
  • 网上做效果图网站一级域名生成二级域名
  • 企业网站建设的类型主要有wordpress手机端
  • ps网站设计怎么做中国未来巨型空间站
  • 订阅号做影视网站广东省建设工程质量安全监督检测总站网站