当前位置: 首页 > news >正文

礼盒包装设计网站面包屑导航wordpress

礼盒包装设计网站,面包屑导航wordpress,做粤菜的视频网站,景区网站建设方案 费用使用python读取文件#xff0c;其中pdf、docx、pptx可以直接读#xff0c;.ppt和.doc文件不能直接读#xff0c;需要转换成.pptx和.docx文件#xff0c;并且需要区分系统 如果是linux系统#xff0c;请先安装组件 #doc2docx yum install -y libreoffice-headless yum ins…使用python读取文件其中pdf、docx、pptx可以直接读.ppt和.doc文件不能直接读需要转换成.pptx和.docx文件并且需要区分系统 如果是linux系统请先安装组件 #doc2docx yum install -y libreoffice-headless yum install -y libreoffice-writer# ppt2pptx yum install epel-release -y yum install libgdiplus -y pip3 install aspose.slidespython代码如下 import osdef read_pptx(fp):import pptxprs pptx.Presentation(fp)for i, slide in enumerate(prs.slides):# if i 1: 在这里可以指定提取ppt的具体页数for shape in slide.shapes:if shape.has_text_frame:text_frame shape.text_frameprint(str(i) 页 text_frame.text)def read_ppt(fp):import platformos_type platform.system()if os_type Windows:import win32com.client as wcpowerpoint wc.Dispatch(PowerPoint.Application)wc.gencache.EnsureDispatch(PowerPoint.Application)powerpoint.Visible 1ppt powerpoint.Presentations.Open(fp)ppt.SaveAs(fpx)powerpoint.Quit()elif os_type Linux:import aspose.slides as slideswith slides.Presentation(fp) as presentation:presentation.save(fpx, slides.export.SaveFormat.PPTX)read_pptx(fpx)def read_docx(fp):import docxfile docx.Document(fp)print(段落数: str(len(file.paragraphs))) # 段落数为13每个回车隔离一段# 输出每一段的内容for para in file.paragraphs:print(para.text)def read_doc(fp):import platformos_type platform.system()if os_type Windows:import doc2docxdoc2docx.convert(fp,fpx)elif os_type Linux:import subprocesssubprocess.check_output([soffice, --headless, –-invisible, --convert-to, docx, fp, --outdir, fpx])read_docx(fp x)def read_pdf(fp):import pdfplumberpdfFile open(fp,rb)pdf pdfplumber.open(pdfFile)for page in pdf.pages:text page.extract_text()print(text)# file_path *.pptx file_path *.ppt # file_path *.docx # file_path *.doc # file_path *.pdf file_extension os.path.splitext(file_path)[-1].lower() print(文件后缀 file_extension) if file_extension .pptx:print(读取pptx文件)read_pptx(file_path) elif file_extension .ppt:print(读取ppt文件)read_ppt(file_path) elif file_extension .docx:print(读取docx文件)read_docx(file_path) elif file_extension .doc:print(读取doc文件)read_doc(file_path) elif file_extension .pdf:print(读取pdf文件)read_pdf(file_path)
http://www.dnsts.com.cn/news/127294.html

相关文章:

  • 重庆网站优化指导网站域名怎么改
  • 学校网站建设具体分工个人网站免费推广
  • 电子商务网站建设与管理教材水果网站建设
  • 外贸建站与推广如何做二维码生成器免费
  • 高端网站建设苏州分类目录网站大全
  • 成华区微信网站建设公电视剧怎么做短视频网站
  • 哈尔滨铁路局建设网站智慧团建网站登陆
  • 做围棋题最好的网站nas ddnsto wordpress
  • 自助网站建设软件重庆商业网站有哪些
  • 素材网站视频广州专业的网站建设公司
  • 大型网站开发前端准备新冠政策最新20条
  • wiki网站开发工具如何申请一个网站 做视频直播
  • 公司网站建设费用怎么记账手机app软件开发的价格
  • mvc做网站前台代码合肥大建设
  • 义乌网站建设公司代理上海网站建设兴策
  • access做网站数据库阿里大数据官网
  • 网站与装修公司自己网站怎么做优化
  • 阿里云买域名后怎么做网站营销型网站需要备案吗
  • 德州极速网站建设 小程序易语言编程可以做网站么
  • jsp做的网站难吗百度一下你就知道了官网
  • 常州知名网站网站建设制作人员招聘要求
  • 怎么做淘宝客网站优化介绍学校网站怎么做
  • 上海门户网站开发关于 公司网站建设的通知
  • 桥拓云智能建站手机怎么注册自己的网站
  • 山东建设厅执业资格注册中心网站建站宝盒源码
  • 深圳网站排名优化公司太原公司网站建立
  • wordpress仿站抓取软件用户登录入口
  • 微信网站小游戏设计免费素材网站
  • 网站建设花费录什么费用网站排名必做阶段性seo策略
  • 双色调网站wordpress左右两栏