老干部活动中心网站建设方案,wordpress 模板 html5,企业网盘收费标准,用家用电脑建设网站话接上篇#xff0c;自动化处理 PDF 文档#xff0c;完美实现 WPS 会员功能
小伙伴们更关心的是如何去除 PDF 中的水印~
今天#xff0c;就来分享一个超简单的 PDF 去水印方法~
1. 原理介绍
在上一篇中#xff0c;我们介绍了如何将 PDF 文档转换成图片#xff0c;图片…话接上篇自动化处理 PDF 文档完美实现 WPS 会员功能
小伙伴们更关心的是如何去除 PDF 中的水印~
今天就来分享一个超简单的 PDF 去水印方法~
1. 原理介绍
在上一篇中我们介绍了如何将 PDF 文档转换成图片图片就是 RGB 三通道像素点的集合。
我们发现水印的像素点和正常文字的像素点是有显著区别的。
如何查看水印的像素是多少呢
最简单的方式是打开一个截图工具聚焦到水印位置即可看到 所以水印的像素值有如下特点
像素分布在 180 - 250 注必要时阈值需适当调整RGB三通道的像素值基本相同。
基于上述两个特点我们就可以找到水印像素点的位置。
2. 代码实操
为了完美实现上述的两个判断当然你可以写两层 for 循环遍历像素值进行判断不过一旦图像尺寸太大处理速度就令人抓狂了。
最简单的方式就是采用 numpy 数组进行操作
import numpy as np
def judege_wm(img, low180, high250):# 通过像素判断low_bound np.array([low, low, low])high_bound np.array([high, high, high])mask (img low_bound) (img high_bound) (np.abs(img-img.mean(-1, keepdimsTrue)).sum(-1, keepdimsTrue) 10) # 要求rgb值相差不能太大img[mask] 255return img
最后我们来看下处理后的效果 3. 整体流程
上述步骤我们介绍了如何去除图片中的水印。
说好的 PDF 去水印呢
来参照下述流程走一遍 关于如何实现PDF转换成图片 以及 图片转换成PDF上篇已经给出了详细教程自动化处理 PDF 文档完美实现 WPS 会员功能
写在最后
本文给大家带来了一种最简单的图片 PDF 去水印方法可以满足绝大部分白底黑字的文档场景。
如果背景图像纷繁复杂本方法还无法完美解决。
欢迎有其他解决方案的小伙伴评论区交流下啊~
如果本文对你有帮助欢迎点赞收藏备用。