当前位置: 首页 > news >正文

外贸网站做哪些语言浙江省住房和城乡建设行业网站

外贸网站做哪些语言,浙江省住房和城乡建设行业网站,做网站感觉挣不到钱啊,六安门户网站建设哪家好#x1f604; 19年之后由于某些原因断更了三年#xff0c;23年重新扬帆起航#xff0c;推出更多优质博文#xff0c;希望大家多多支持#xff5e; #x1f337; 古之立大事者#xff0c;不惟有超世之才#xff0c;亦必有坚忍不拔之志 #x1f390; 个人CSND主页——Mi… 19年之后由于某些原因断更了三年23年重新扬帆起航推出更多优质博文希望大家多多支持 古之立大事者不惟有超世之才亦必有坚忍不拔之志 个人CSND主页——Micro麦可乐的博客 《Docker实操教程》专栏以最新的Centos版本为基础进行Docker实操教程入门到实战 《RabbitMQ》本专栏主要介绍使用JAVA开发RabbitMQ的系列教程从基础知识到项目实战 《设计模式》专栏以实际的生活场景为案例进行讲解让大家对设计模式有一个更清晰的理解 《Jenkins实战》专栏主要介绍JenkinsDockerGitMaven的实战教程让你快速掌握项目CI/CD是2024年最新的实战教程 如果文章能够给大家带来一定的帮助欢迎关注、评论互动 Spring Boot整合开源 Tess4J 实现OCR图片文字识别 1、前言2、什么是 Tess4J3、项目初始化3.1 引入Tess4J 依赖3.2 配置 Tesseract 数据文件 4、代码实现4.1 创建 OCR 服务类4.2 创建OCRController4.3 开始调试 5、出现 Unable to load library tesseract问题6、总结 1、前言 之前在某一个项目中客户要求根据上传的文档图片系统自动识别图片内容这就需要到了OCR技术我们公司一般做法通常是使用阿里云或腾讯云的OCR图片识别大厂的训练量更多更大识别更精准无奈客户资金有限又希望我们满足需求最后我们决定采用开源Tesseract 文字识别 OCR 引擎来实现 Tesseract 是一个功能强大的 OCR 引擎其发展经历了多个版本的迭代。最初由惠普实验室开发后由 Google 维护和发展。Tesseract 通过神经网络和图像处理技术对图像中的文字进行识别和提取。 2、什么是 Tess4J Tess4J 是一个 Java 的 OCR光学字符识别库基于 Tesseract OCR 引擎实现。Tess4J 为 Java 开发者提供了一个便捷的接口能够在 Java 项目中轻松调用 Tesseract 的 OCR 功能。 温馨提示 Tess4J 只是就是封装了Tesseract OCR的API让Java可以直接调用千万不要错误以为是Tess4J实现的 3、项目初始化 3.1 引入Tess4J 依赖 创建 Spring Boot 项目打开 pom.xml 文件添加 Tess4J 的依赖 dependencygroupIdorg.springframework.boot/groupIdartifactIdspring-boot-starter-web/artifactId /dependency !-- tess4j 最新版5.11.0 -- dependencygroupIdnet.sourceforge.tess4j/groupIdartifactIdtess4j/artifactIdversion5.11.0/version /dependencydependencygroupIdorg.springframework.boot/groupIdartifactIdspring-boot-starter-test/artifactIdscopetest/scope /dependency3.2 配置 Tesseract 数据文件 Tess4J 依赖 Tesseract 数据文件来识别不同语言的文本。可以从 Tesseract Github仓库 下载所需语言的训练数据。 如上图所示Tesseract有三个独立的语言模型存储库 tessdata、tessdata-best、tessdata-fast 他们分别都存储了语言模型主要有以下区别 数据模型存储库描述速度识别精度支持再训练tessdata_best最好最准确的训练LSTM模型最慢最高支持tessdata使用“最佳”LSTM模型遗留模型的快速变体训练模型均衡均衡不支持tessdata_fast训练LSTM模型的快速版本最快最低不支持 博主选择Tesseract最高的 tessdata_best 中文数据文件下载完成后将数据文件放在项目的资源目录中src/main/resources/tessdata 如果你只是处理中文、英文的文字识别无需将整个库下载找到chi_sim.traineddata 和eng.traineddata下载即可 如果整个存储库下载过大大家根据自己的需求下载对应语言版本或者特殊的模型如数学公式equ.traineddata 模型语言版本参考官方地址https://tesseract-ocr.github.io/tessdoc/Data-Files.html 4、代码实现 4.1 创建 OCR 服务类 首先创建一个 OCR 服务类用于处理图片文字识别的逻辑 import net.sourceforge.tess4j.Tesseract; import net.sourceforge.tess4j.TesseractException; import org.springframework.stereotype.Service;import java.io.File;Service public class OCRService {public String extractTextFromImage(File imageFile) {Tesseract instance new Tesseract();//设置 tessdata 目录instance.setDatapath(src/main/resources/tessdata);//设置语言 中文instance.setLanguage(chi_sim);try {return instance.doOCR(imageFile);} catch (TesseractException e) {e.printStackTrace();return 读取图像时出错;}} }4.2 创建OCRController 创建一个控制器用于处理前端请求并调用 OCR 服务 import org.springframework.beans.factory.annotation.Autowired; import org.springframework.http.HttpStatus; import org.springframework.http.ResponseEntity; import org.springframework.web.bind.annotation.*; import org.springframework.web.multipart.MultipartFile;import java.io.File; import java.io.IOException;RestController RequestMapping(/api/ocr) public class OCRController {Autowiredprivate OCRService ocrService;PostMapping(/extract-text)public ResponseEntityString extractTextFromImage(RequestParam(file) MultipartFile file) {if (file.isEmpty()) {return new ResponseEntity(未选择图片!, HttpStatus.BAD_REQUEST);}try {// 将 MultipartFile 转换为 FileFile imageFile convertMultiPartToFile(file);String result ocrService.extractTextFromImage(imageFile);return new ResponseEntity(result, HttpStatus.OK);} catch (Exception e) {e.printStackTrace();return new ResponseEntity(文件处理错误, HttpStatus.INTERNAL_SERVER_ERROR);}}private File convertMultiPartToFile(MultipartFile file) throws IOException {File convFile new File(System.getProperty(java.io.tmpdir) / file.getOriginalFilename());file.transferTo(convFile);return convFile;} }4.3 开始调试 准备一张文字图片就以本篇文章开头文案图片来测试 前端代码这里就不贴了我们使用Apifox或Postman进行调试博主这里使用Apifox测试效果如下 5、出现 Unable to load library tesseract’问题 如果有小伙伴在测试过程中出现了 Unable to load library tesseract的异常问题且你也是MacOS系统原因通常是因为 Tess4J 无法找到或加载 Tesseract OCR 引擎的本地库需要在Mac上安装Tesseract lib #使用homebrew安装 brew install tesseract#或者 sudo apt-get install tesseract6、总结 通过以上步骤我们成功地在 Spring Boot 项目中集成了 Tess4J实现了图片文字识别功能。本文详细介绍了从项目初始化、服务类和控制器的编写到最终测试希望对大家有所帮助。如果有更复杂的需求可以进一步优化和扩展此项目。
http://www.dnsts.com.cn/news/37126.html

相关文章:

  • 湛江论坛建站模板销售管理系统哪种好一点
  • 哈尔滨模板建站定制网站产品网站建设方案
  • 做慕课的网站dw网页制作模板下载
  • 做网站费免图片网站seo店铺描述
  • 企业营销网站建设系统比较多人用什么网站做推广
  • 网站备案所需资料去哪里弄Wordpress
  • 手机网站注册深圳工程建设交易中心网
  • 西安网站建设制作专业公司宣城网站建设
  • 河南企业网站定制企业管理10大系统
  • 网站设计遵循的原则上海技术做网站
  • 网站调用谷歌地图有赞微商城怎么收费
  • 安全认证的机票网站成就怎么做互联网公司设计
  • 接做名片的网站建立soho公司网站
  • 销售的产品是帮别人做网站网站显示正在建设中
  • 插画师培训网站建设程序员培训机构有哪些
  • 快设计网站官网互联网高端官网
  • 支付集成文件放在网站哪里wordpress安装服务器
  • 做视频有赚钱的网站有哪些深圳软件开发培训机构
  • Asp.net网站开发分析amp 网站开发
  • 重庆微信网站代理商广州公司网站制作
  • 站酷设计网站怎样下载图片一个网页大概多少钱
  • 网站关键词几个最好大众的网站建设
  • 网站建设与维护考试卷门户网站开发专业
  • 聊城建网站哪家好免费wordpress申请
  • 东莞企业网站模板建站安康seo
  • js做示爱网站例子网页设计怎么把图片上移
  • 手机网站 扁平化趋势合肥手机网站开发
  • 母婴网站建设前期规划潍坊市做网站
  • 网站建设笔试北京标识设计制作
  • 京东网站建设的目标客户说做网站没效果怎么回答好