当前位置: 首页 > news >正文

互动营销型网站建设企业seo网站营销推广

互动营销型网站建设,企业seo网站营销推广,怎么样做网站 用网站赚钱,网页网络游戏语音识别技术能够让计算机理解人类的语音#xff0c;从而支持多种语音交互的场景#xff0c;如手机应用、人车协同、机器人对话、语音转写等。然而#xff0c;在这些场景中#xff0c;语音识别的输入并不总是单一的语言#xff0c;有时会出现多语言混合的情况。例如#…语音识别技术能够让计算机理解人类的语音从而支持多种语音交互的场景如手机应用、人车协同、机器人对话、语音转写等。然而在这些场景中语音识别的输入并不总是单一的语言有时会出现多语言混合的情况。例如在中文场景中我们经常会使用一些英文专业术语来表达意思如“GPS信号弱”、“Java工程师”等这就给语音识别技术带来了新的挑战。本次PaddleSpeech发布的中英文语音识别预训练模型Conformer_talcs可以通过PaddleSpeech封装的命令行工具CLI或者Python接口快速使用开发者们可以基于此搭建自己的智能语音应用也可以参考示例训练自己的中英文语音识别模型。示例链接https://github.com/PaddlePaddle/PaddleSpeech/tree/develop/examples/tal_cs/asr1快速体验示例音频https://paddlespeech.bj.bcebos.com/PaddleAudio/ch_zh_mix.wav使用命令行工具CLI 快速体验语音识别效果命令如下bashpaddlespeech asr --model conformer_talcs --lang zh_en --codeswitch True --input ./ch_zh_mix.wav -v# 终端输出今天是monday 明天是tuesdayPython 接口快速体验代码实现如下pythonimport paddlefrom paddlespeech.cli.asr import ASRExecutorasr_executor  ASRExecutor()text  asr_executor(modelconformer_talcs,langzh_en,sample_rate16000,configNone, ckpt_pathNone,audio_file./ch_zh_mix.wav,codeswitchTrue,force_yesFalse,devicepaddle.get_device())print(ASR Result: \n{}.format(text)) ASR Result: 今天是 monday 明天是tuesday中英文语音识别技术中英文语音识别难点 中英文语音识别相较于单语言的语音识别而言主要难点如下数据量少中英混合数据相较于单语言的数据更少。目前开源的中文语音识别数据集如WenetSpeech10000小时有监督2500小时弱监督10000小时无监督、英文语音识别数据集Giga Speech10000小时有监督33000小时无监督都达到了万小时级别但是混合的开源中英文语音识别数据只有SEAME(120小时)和TAL_CSASR(587小时)两个开源数据混合数据集比单语言数据集会更少。中英相似发音易混淆中英文语音识别需要一个单一的模型来学习多种语音相似但具有不同含义的发音通常会导致模型的复杂度和计算量增加同时由于它需要区分处理不同语言的类似发音因此在模型建模时就需要按照不同语言区分不同的建模单元。PaddleSpeech 中英文语音识别方案模型选择与介绍 本方案使用了一种端到端语音识别模型Conformer U2模型其采用了Joint CTC/Attention with Transformer or Conformer的结构。训练时使用CTC 和 Attention Loss 联合优化并且通过dynamic chunk的训练技巧使Shared Encoder能够处理任意大小的chunk即任意长度的语音片段。其还使用CTC-Prefix Beam Search和Attention Decoder的方式进行解码得到最终结果同时实现了流式和非流式的语音识别支持控制推理延迟。 本次PaddleSpeech开源的预训练模型是非流式的端到端识别Conformer U2模型chunk中包含全部上下文信息需要整句输入进行识别。如果你想训练流式中英文语音识别模型也可以参考PaddleSpeech的Conformer U2/U2模型流式语音识别的示例训练自己的流式中英文语音识别模型。示例链接https://github.com/PaddlePaddle/PaddleSpeech/tree/develop/examples/wenetspeech/asr1Conformer U2 结构示意图[1]数据集介绍 本次使用了TAL_CSASR中英混合语音数据集。语音场景为语音授课音频包括中英混合讲课的情况总计587小时语音。数据集下载地址https://ai.100tal.com/dataset数据集介绍[2]中英混合语音识别建模单元在中文语音识别系统中常采用音素、汉字、词等作为声学模型的建模单元在英文语音识别系统中则常采用英文音素、国际音标、子词等作为声学模型的建模单元。 本次PaddleSpeech开源的预训练中英文语音识别模型是采用端到端语音识别模型Conformer U2未接入语言模型使用了中文字/词加英文子词的建模方法将中英文分开建模通过模型推理直接得到识别后的结果。试验结果对比 由于本项目使用的是中英文混合数据集所以我们选择混合错误率MERMix Error Rate作为评价指标中文部分计算字错误率CERCharacter Error Rate英文部分计算词错误率Word Error Rate。测试数据集选择TAL_CSASR中已经划分好的测试集。由于不同的解码方式识别的效果不同这里我们使用 Attention、CTC Greedy Search、CTC Prefix Beam Search、Attention Rescoring 四种解码方式进行试验解码效果最佳为Attention Rescoring混合错误率MER为0.084折算为我们常说的语音识别正确率91.6%。进一步优化与效果提升 当前中英文语音识别方案的效果还有进一步提升的空间比如在Conformer U2 模型后面加入Language Model通过语言模型学习中英文语言信息PaddleSpeech中提供了基于N-Gram的语言模型训练方案。此外可以在训练过程中加入Language ID使用token级别或者帧级别的语言ID标注信息可以进一步提高中英文语音识别的效果。如果你有更大的中英文混合数据集或者是场景相关的数据集可以通过微调或者进一步训练提高在业务场景中的识别效果。PaddleSpeech 语音识别技术介绍 除了中英文混合的Conformer U2模型以外飞桨语音模型库PaddleSpeech中包含了多种语音识别模型能力涵盖了声学模型、语言模型、解码器等多个环节支持多种语言。目前PaddleSpeech已经支持的语音识别声学模型包括DeepSpeech2、Transfromer、Conformer U2/U2 支持中文和英文的单语言识别以及中英文混合识别支持CTC前束搜索CTC Prefix Beam Search、CTC贪心搜索CTC Greedy Search、注意力重打分(Attention Rescoring)等多种解码方式支持 N-Gram语言模型、有监督多语言大模型Whisper、无监督预训练大模型wav2vec2同时还支持服务一键部署可以快速封装流式语音识别和非流式语音识别服务。通过PaddleSpeech提供的命令行工具CLI和Python接口可以快速体验上述功能。 通过PaddleSpeech精品项目合集可以在线体验PaddleSpeech的优秀项目上面更有PaddleSpeech核心开发者精心打造的《飞桨PaddleSpeech语音技术课程》帮助开发者们快速入门。项目传送门https://aistudio.baidu.com/aistudio/projectdetail/4692119?contributionType1 如果您想了解更多有关PaddleSpeech的内容欢迎前往PaddleSpeech主页学习更多用法Star 关注获取PaddleSpeech最新资讯。PaddleSpeech地址https://github.com/PaddlePaddle/PaddleSpeech引用[1] 模型结构图https://arxiv.org/pdf/2012.05481.pdf[2] 数据集介绍https://ai.100tal.com/dataset拓展阅读提速300%PaddleSpeech 语音识别高性能部署方案重磅来袭定制音库成本骤降98%PaddleSpeech小样本语音合成方案重磅来袭关注【飞桨PaddlePaddle】公众号获取更多技术内容~
http://www.dnsts.com.cn/news/20654.html

相关文章:

  • 淄博做网站58同城网站制作 意向单
  • 广东富盈建设有限公司企业网站设计方案流程
  • 珠海市网站开发公司电话wordpress提交订单
  • 网站设计制作的公司网站建设珠海 新盈科技公司
  • 如何在电脑登录wordpress宁波网站排名优化公司
  • 网站蓝色导航栏代码中国最好的影视后期培训学校
  • 福永附近网站建设公司公司如何制作网页
  • 网站与网页区别是什么意思帝国cms教程
  • 网页设计制作网站模板图片视频链接怎么wordpress
  • 做cpa的电影网站模板房屋设计图用什么软件
  • 济南网站建设的公司网站的网络推广
  • 应用网站建设湖南网站建设欧黎明
  • 做老师好还是网站编辑好沧州做网站
  • 公司介绍网站模板2022热点新闻事件
  • 做网站代理能赚钱吗软件开发报价单
  • 政务公开网站项目建设书做公司网站要营业执照吗
  • 室内设计师招聘网站简单的网页制作素材
  • 网站备案信息批量查询wordpress 推荐
  • 网站怎么看哪个公司网站建设在线培训网站怎么做
  • 网站建设原理试卷网页制作素材及流程
  • 如何做网站新手引导渭南建设用地规划查询网站
  • 怎么新增网站推广网站制作怎么报价单
  • 这几年做哪些网站致富wordpress 百度网盘插件
  • 达浒镇网站建设公司搭建网站需要学什么软件
  • 西安网站建设有限公司做一手房有哪些网站比较好啊
  • 企业的网站建设费账务处理企业网站建设项目描述
  • 旅游网站开发说明书商业授权书
  • 涿州网站开发分销平台网站建设
  • 个人网站建设方案书例文企业微信app官网下载
  • 广州网站建设联系信科海珠西安有什么好玩的地方适合年轻人