引航博景网站做的好吗,程序员自己做项目网站,网站的相关链接怎么做,专做户外装备测评视频网站深度学习 文章目录 深度学习前言一、环境搭建准备方式1#xff1a;安装Anaconda搭建1. Anaconda下载地址: [点击](https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?CMOD)2. 创建新的conda环境 方式2. 直接安装python 二、安装CPU版本1. 安装PaddlePaddle2、安装…深度学习 文章目录 深度学习前言一、环境搭建准备方式1安装Anaconda搭建1. Anaconda下载地址: [点击](https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?CMOD)2. 创建新的conda环境 方式2. 直接安装python 二、安装CPU版本1. 安装PaddlePaddle2、安装PaddleOCR whl包提示 验证安装如何卸载 三、安装和运行标注工具PPOCRLabel1. 获取源代码2. 安装运行3. 使用PPOCRLabel 问题汇总 前言
PaddleOCR是一个基于飞桨开发的OCROptical Character Recognition光学字符识别系统。其技术体系包括文字检测、文字识别、文本方向检测和图像处理等模块。
一、环境搭建准备
Windows和Mac用户推荐使用Anaconda搭建Python环境Linux用户建议使用docker搭建Python环境。 已搭建过查看环境 确认python的版本是否满足要求python --version 确认 pip 的版本是否满足要求python -m ensurepip 同时查看python -m pip --version 注pip 版本为 20.2.2 或更高版本
方式1安装Anaconda搭建
python集成环境Anaconda工具包安装完Anaconda后可以安装python环境以及numpy等所需的工具包环境
1. Anaconda下载地址: 点击
默认安装位置为C盘建议将安装位置更改到D盘勾选conda加入环境变量忽略警告 安装完成后打开终端并创建conda环境左下角Windows Start Menu - Anaconda3 - Anaconda Prompt启动控制台
2. 创建新的conda环境
在命令行输入以下命令此处为加速下载使用清华源
conda create --name paddle_env python3.10 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
该命令会创建1个名为paddle_env、python版本为3.10的可执行环境根据网络状态需要花费一段时间。
方式2. 直接安装python
python下载地址https://www.python.org/downloads/
点击Download后进入版本界面根据系统选择合适的版本
windows installerexe可执行文件安装比较方便。(windows下可执行文件一般是exe,msi等)
windows embeddable package:
注安装Python尽量选择最新版本的上一版本本人使用最新版各种出错无奈卸载重新下载另一版本才成功。
安装Python时记得勾选Add Python To Path。
安装完成进入Windows终端测试Python是否安装成功若出现不是内部或外部命令也不是可运行的程序, 请及时检查环境变量中是否存在 python安装的路径。 手动添加环境变量右键【此电脑】属性–高级系统设置----高级–环境变量
二、安装CPU版本
1. 安装PaddlePaddle
执行以下命令速度快
python -m pip install paddlepaddle2.6.0 -i https://pypi.tuna.tsinghua.edu.cn/simple或者
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple some-package速度慢
python3 -m pip install paddlepaddle2.6.0 -i https://mirror.baidu.com/pypi/simple如果提示升级pip执行以下命令三选一
python -m pip install --upgrade pip
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
python -m pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --upgrade pip注请确认需要安装 PaddlePaddle 的 Python 是您预期的位置因为您计算机可能有多个 Python。根据您的环境您可能需要将说明中所有命令行中的 python 替换为具体的 Python 路径。
2、安装PaddleOCR whl包
执行以下命令推荐使用2.6.0以上版本最新版是2.7所以我写的是大于版本2.6.0
pip install paddleocr2.6.0对于Windows环境用户直接通过pip安装的shapely库可能出现“找不到指定模块”的问题。建议下载shapely安装包完成安装。 1.下载安装whl以及确定Python适配版本请自行搜索 2.将 wheel 包下载到本地
python -m pip download paddlepaddle2.6.0 -f https://www.paddlepaddle.org.cn/whl/windows/openblas/avx/stable.html --no-index --no-deps3.再本地安装
python -m pip install [name].whl #[name]为 wheel 包名称提示
如果同时使用whl包安装了paddleocr其优先级大于通过paddleocr.py调用PaddleOCR类whl包未更新时会导致程序异常。 如果出现 module ‘cv2’ has no attribute INTER_NEAREST’错误需要首先删除所有opencv相关包然后重新安装4.2.0.32版本的headless opencvpip install opencv-contrib-python-headless4.2.0.32。
验证安装
需要先在终端里打开python在Python在运行
import paddle
paddle.utils.run_check()如果出现PaddlePaddle is installed successfully!即成功。 注需要先在终端里运行python然后再输入运行。
如何卸载
python -m pip uninstall paddlepaddle三、安装和运行标注工具PPOCRLabel
1. 获取源代码
PaddleOCR2.7版本https://github.com/PaddlePaddle/PaddleOCR 在PaddleOCR2.7文件夹下打开终端运行
pip3 install -r requirements.txt #安装第三方依赖库2. 安装运行
1 方法1终端运行通过whl包安装与运行
pip install PPOCRLabel # 安装在PaddleOCR2.7文件夹下打开终端运行
PPOCRLabel --lang ch # 启动【普通模式】用于打【检测识别】场景的标签
PPOCRLabel --lang ch --kie True # 启动 【KIE 模式】用于打【检测识别关键字提取】场景的标签。注如若出现了类似反馈 ppocr WARNING: When args.layout is false, args.ocr is automatically set to false可以忽略能正常使用。
此后会弹出PPOCRLabel窗口。
注通过whl包安装PPOCRLabel会自动下载paddleocr whl包其中shapely依赖可能会出现找不到指定模块的问题。建议从https://www.lfd.uci.edu/~gohlke/pythonlibs/#shapely下载shapely安装包完成安装。
3. 使用PPOCRLabel
1、打开文件夹在菜单栏点击 “文件”–打开目录选择待标记图片的文件夹。只能选择文件夹不能选择单个文件。 2、自动标注点击“自动标注”使用PP-OCR超轻量模型对图片文件名前图片状态为“X” 的图片进行自动标注。 3、手动标注点击“矩形标注”推荐直接在英文模式下点击键盘中的“W”)用户可对当前图片中模型未检出的部分进行手动绘制标记框。点击键盘Q则使用多点标注模式用户依次点击4个点后双击左键表示标注完成。 4、注在使用矩形标注时如果经常性闪退建议使用多点标注结合实际更换方法。 标记框绘制完成后用户点击“确认”检测框会先被预分配一个“待识别”标签可以在框选的文字右键–重识别此区块。“待识别”内容就会更新。 5、重新识别将图片中的所有检测画绘制/调整完成后点击“重新识别”PP-OCR模型会对当前图片中的所有检测框重新识别。 6、内容更改单击识别结果对不准确的识别结果进行手动更改。 7、确认标记点击 “确认”图片状态切换为“√跳转至下一张。 8、删除点击“删除图像”图片将会被删除至回收站。 9、导出结果用户可以通过菜单中“文件-导出标记结果”手动导出同时也可以点击“文件-自动导出标记结果”开启自动导出。自动导出点击“文件 - 自动导出标记结果”后用户每确认过一张图片程序自动将标记结果写入Label.txt中。若未开启此选项则检测到用户手动确认过5张图片后进行自动导出。默认情况下自动导出功能为关闭状态。 10、手动确认过的标记将会被存放在所打开图片文件夹下的Label.txt中。在菜单栏点击 “文件”–导出识别结果后会将此类图片的识别训练数据保存在crop_img文件夹下识别标签保存在rec_gt.txt中。
Label.txt检测标签可直接用于PPOCR检测模型训练。用户每确认5张检测结果后程序会进行自动写入。当用户关闭应用程序或切换文件路径后同样会进行写入。 fileState.txt图片状态标记文件保存当前文件夹下已经被用户手动确认过的图片名称。 Cache.cach缓存文件保存模型自动识别的结果。 rec_gt.txt识别标签。可直接用于PPOCR识别模型训练。需用户手动点击菜单栏文件–导出识别结果后产生。 crop_img识别数据。按照检测框切割后的图片。与rec_gt.txt同时产生。
注PPOCRLabel不支持对纯中文文件名的图片进行自动标注。
提示修改识别结果时文字如果出现突然不能输入中文或者输入法不出现等建议先对已标注进行保存然后重置界面与保存地址退出程序再次运行即可正常内容少的临时解决方法复制粘贴文字进行修改。
问题汇总
如果标注时打框就闪退 修改以下文件 1、D:\Python310\Lib\site-packages\PPOCRLabel\libs\canvas.py根据自己的Python安装位置找中
p.drawRect(leftTop.x(), leftTop.y(), rectWidth, rectHeight
改为
p.drawRect(int(leftTop.x()), int(leftTop.y()), int(rectWidth), int(rectHeight))p.drawLine(self.prevPoint.x(), 0, self.prevPoint.x(), self.pixmap.height())
改为
p.drawLine(int(self.prevPoint.x()), 0, int(self.prevPoint.x()), self.pixmap.height())p.drawLine(0, self.prevPoint.y(), self.pixmap.width(), self.prevPoint.y())
改为
p.drawLine(0, int(self.prevPoint.y()), self.pixmap.width(), int(self.prevPoint.y()))2、D:\Python310\Lib\site-packages\PPOCRLabel\PPOCRLabel.py 中
bar.setValue(bar.value() bar.singleStep() * units)
改为
bar.setValue(int(bar.value() bar.singleStep() * units))建议如果下载验证中途出现各种问题建议彻底删除相关所有软件再重新安装本人使用中因为版本及软件卸载遗留的问题等出现了多种莫名的问题无奈选择彻底卸载重装重来一遍就OK了 3、启动报错 添加环境变量 os.environ[“KMP_DUPLICATE_LIB_OK”]“TRUE”