当前位置: 首页 > news >正文

建筑论坛网站东莞市网络策划推广哪家好

建筑论坛网站,东莞市网络策划推广哪家好,互联网域名交易中心,上海网站备案审核最近几天#xff0c;paddleOCR开发了新的功能#xff0c;通过将图片中的表格提取出来#xff0c;效果还不错#xff0c;今天#xff0c;作者按照步骤测试了一波。 首先#xff0c;讲下这个工具是干什么用的#xff1a;它的功能主要是针对一张完整的PDF图片#xff0c;可…最近几天paddleOCR开发了新的功能通过将图片中的表格提取出来效果还不错今天作者按照步骤测试了一波。 首先讲下这个工具是干什么用的它的功能主要是针对一张完整的PDF图片可以对文档图片中的文本、表格、图片、标题与列表区域进行分类。同时还可以利用表格识别技术完整地提取表格结构信息使得表格图片变为可编辑的Excel文件。如下图所示可以进行版面分析表格识别。 核心技术在于两个一个是PP-Structure的版面分析技术另一个是PaddleDetection开源的高效检测算法PP-YOLO v2。 PP-Structure Pipeline介绍 下面作者按照官网的说明进行安装(https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.2/ppstructure/README_ch.md) #step1: 首先需要安装paddle # GPU安装 python -m pip install paddlepaddle-gpu2.1.1 -i https://mirror.baidu.com/pypi/simple # CPU安装作者在这里使用CPU安装  python -m pip install paddlepaddle2.1.1 -i https://mirror.baidu.com/pypi/simple #step2安装 Layout-Parser pip  install -U https://paddleocr.bj.bcebos.com/whl/layoutparser-0.0.0-py3-none-any.whl #step3安装PaddleOCR包含PP-OCR和PP-Structure pip install paddleocr2.2 这样就算安装好了但是途中会有一些报错信息一个是 ImportError: DLL load failed: 找不到指定的模块。 在查阅了相关的资料之后发现重新安装也没有用作者是通过安装旧版本的软件就解决了这个问题。另一个报错是cv2.imread读取图像结果为none,这个错误是由于你的路径中有中文字体全部修改为英文的即可。 接下来就是运行主要的程序代码 1 import os2 import cv23 from paddleocr import PPStructure,draw_structure_result,save_structure_res4 5 table_engine PPStructure(show_logTrue)6 7 #你的文件结果目录8 save_folder C:/Users/hp/Desktop/pdf_ocr/output/table9  10 #输入的图片 11 img_path C:/Users/hp/Desktop/pdf_ocr/table/5.png 12 img cv2.imread(img_path) 13  14 result table_engine(img) 15 save_structure_res(result, save_folder,os.path.basename(img_path).split(.)[0]) 16  17 for line in result: 18     line.pop(img) 19     print(line) 20  21 from PIL import Image 22  23 #字体路径可以从paddleOCR的github上面下载 24 font_path C:/Users/hp/Desktop/pdf_ocr/fonts/simfang.ttf25 image Image.open(img_path).convert(RGB) 26 im_show draw_structure_result(image, result,font_pathfont_path) 27 im_show Image.fromarray(im_show) 28 im_show.save(result.jpg)运行完成后每张图片会在​​output​​字段指定的目录下有一个同名目录图片里的每个表格会存储为一个excel图片区域会被裁剪之后保存下来excel文件和图片名名为表格在图片里的坐标。 这样就可以看到识别出来的excel表格了。
http://www.dnsts.com.cn/news/41890.html

相关文章:

  • 网站开发和软件开发含义网络营销推广专员的岗位职责
  • 做优惠卷网站倒闭了多少中建装饰集团
  • 网站聚合页面营销网站建设 公司排名
  • 新八建设集团网站杭州前十强装修公司有哪几家
  • 有口碑的郑州网站建设安卓app用什么开发
  • 网站可以自己维护吗望野王维原文
  • 如何抄袭网站电子商务网站建设 试卷
  • 自己怎么优化我网站关键词微信crm系统如何添加
  • 虚拟主机怎么搭建网站销售管理系统实验报告
  • 重庆森林讲的什么内容企业网站建设网站优化推广
  • 潍坊市网站wordpress返利主题
  • 网站建设 数据归属wordpress idstore
  • 深泽网站制作做英文网站賺钱
  • 长春网站建设方案优化网站设计专业公司价格
  • 广州 环保 凡人网站建设上海网站建设公司兴田德润放心
  • phpcms网站音乐代码存放在什么位置常用的网站建设技术有什么软件
  • 那个网站做百科好过钉钉怎么注册企业
  • 创建手机网站模版盘龙网站建设
  • 校园网站设计方案黄页88网站推广方案
  • 阿瓦提网站建设中国突然宣布大消息
  • cvv钓鱼网站怎么做甘肃省建设局网站首页
  • 成品短视频app大全南京seo报价
  • 网站设计需求表郑州网站seo
  • 网站建设鼠标移动变颜色网站建设公司转型
  • 网站的论坛怎么做的网站建设哪几家公司好
  • 招生网站开发的背景深圳公司排名前50
  • 网站怎么添加假备案号网站窗口代码
  • 关于网站制作青岛在线建站排名公司
  • 制作网站的流程网站策划方案
  • 网站如何运营做兼职比较好的网站