当前位置: 首页 > news >正文

安阳做网站优化佛山自定义网站建设

安阳做网站优化,佛山自定义网站建设,赣州章贡区哪里要招工,云浮网站网站建设这个文档主要是介绍一下我自己封装了 6 家厂商的短语音识别和实时流语音识别接口的一个包#xff0c;以及对这些接口的一个对比。分别是#xff0c;阿里#xff0c;快商通#xff0c;百度#xff0c;腾讯#xff0c;科大#xff0c;字节。 zxmfke/asrfactory (github.c…这个文档主要是介绍一下我自己封装了 6 家厂商的短语音识别和实时流语音识别接口的一个包以及对这些接口的一个对比。分别是阿里快商通百度腾讯科大字节。 zxmfke/asrfactory (github.com) 之前刚好在测试各家的语音识别相关功能但是每家的返回值都不同调用方式都不同所以就封装了这么一个包。主要就是用简易工厂模式封装了一下可以用来内部做测试。 功能方面只是单纯的返回识别结果实时流也是正常是要再返回时间戳的不过各家在时间戳上更是五花八门就之后有空再封装。 有什么需求也欢迎讨论另外接口的app账号需要自己去生成。 本文档偏主观不喜勿喷 接口官方文档地址 短语音识别URL阿里智能语音交互RESTfulAPIROA示例_智能语音交互-阿里云帮助中心 (aliyun.com)快商通快商通AI开放平台-短语音识别百度短语音识别标准版API - 语音技术 (baidu.com)腾讯语音识别 一句话识别-一句话识别相关接口-API 中心-腾讯云 (tencent.cn)科大语音听写_语音识别-讯飞开放平台 (xfyun.cn)字节一句话识别–语音技术-火山引擎 (volcengine.com) 实时流语音识别URL阿里如何自行开发代码访问阿里语音服务_智能语音交互-阿里云帮助中心 (aliyun.com)快商通快商通AI开放平台-实时语音识别百度语音技术 (baidu.com)腾讯语音识别 实时语音识别websocket-API 文档-文档中心-腾讯云 (tencent.com)科大实时语音转写_实时语音识别服务-讯飞开放平台 (xfyun.cn)字节流式语音识别–语音技术-火山引擎 (volcengine.com) 包封装实现 短语音识别 短语音比较简单主要就是一个 http 请求实现 Do 方法就可以了。 type Asr interface {Do(fileName string, sampleRate define.AudioSampleRate) (string, error) }实时流语音识别 实时流识别主要是抽象成 5 个函数均通过 websocket 的方式对接 type AsrWs interface {// 初始化创建 websocket 连接。把创建和发送 start 的逻辑封在一起。Init() error// 发送语音流数据Send([]byte) error// 接收识别结果Recv(chan- define.Output)// 发送结束标识End() error// 关闭 websocket 连接Close() }实时流语音识别可以分成 7 个步骤 建立 web socket 连接发送 start 的 Text message 这两步就是在 Init 里面实现如果 start 没有那 Init 里面就不会做 start 的逻辑 发送完 start 后会返回给 client 可以发送的 message 循环发送语音通过 Send 方法 同时接收识别结果Recv 来接收识别结果 语音数据发送结束后发送给 server 端数据发送完毕的标识即 End 方法 发送 End 后不要立马断开 web socket 连接。End 只是发送我没有要 server 端识别的数据了不过还是要等 server 端把所有语音数据都是识别完成返回全部识别结束。这时候才能 Close 连接。 Recv 和 End 方法在各家的实现里面是最不同的所以抽象的地方主要是在这两个函数。不过无论后面要再加什么厂商的接口基本上按照这 5 个方法是没什么问题的。字节的就是我在最后才加的。 接口语音要求 我只列常用的 语音要求阿里16k/8k wav/pcm快商通16k/8k wav百度16k pcm腾讯16k/8k wav/pcm科大16k/8k pcm字节16k/8k wav/pcm 接口文档是否易懂 文档易懂阿里有完整文档字段描述清晰范例代码挺多。快商通有完整文档字段描述清晰范例代码就一个js。百度有完整文档字段描述清晰逻辑性不是很强。腾讯有完整文档字段描述清晰逻辑性强范例代码多科大有完整文档字段描述清晰过于复杂字段命名不直观字节看文档看不懂只能看懂调用逻辑字段怎么用只能直接看范例范例也不知道为什么这么写 接口对接难易度 对接难易度这边更多指的是最后抽象成几个方法的难易度。 调用难易度阿里易发数据前要先发开始message快商通没有 go 范例得自己写不过逻辑还算比较简单清晰百度易发数据前要先发开始message腾讯易创建 ws 连接的时候得先获取 signature科大有点麻烦范例太过复杂创建 ws 连接的时候得先获取 signature。嵌套多层且字段名不直观抽象过程麻烦。字节有点麻烦范例太过复杂发数据前要先发开始message抽象过程麻烦。 接口识别效果 识别效果我只测了中文16k。8k 跟 16k 结果差不多。在正常语音正常噪音情况下腾讯阿里排在前两位后面的差不多。在有噪音前提下大体相差不了多少。其中快商通不支持多方言和多语种其他的都可以。 响应时间识别速度腾讯 阿里 百度 快商通 科大 字节 接口免费调用次数 各平台免费调用次数都比较充足价格就直接官网看比较直观因为有阶梯的不好比较。直接跟商务谈的也会有所区别。 总结 这个包就是来封装一下各家的语音识别接口方便调用。选哪家因人而异考量的点挺多。我个人觉得腾讯的是最好的它文档很丰富逻辑清晰范例也很清楚识别效果识别速度都是最好的。快商通的简单识别也还行就是支持的功能太少了。科大的应该是不错的不过不知道为什么识别效果怪怪的。字节的每太理解需要这么设计的逻辑会给使用者增加一些不必要的麻烦可能是我功力还不能理解他们的设计巧思。
http://www.dnsts.com.cn/news/18181.html

相关文章:

  • 邵阳市建设局网站首页自己的服务器做网站
  • php网站屏蔽词怎么做免费域名申请 2021
  • 网站外链建设是什么小程序商城开发公司哪个好
  • 通州广州网站建设外贸管理软件有哪些
  • 南安网站建设品牌形象设计方案
  • 那个网站有用director做的片头网页设计程序
  • 做网站ps建立多大的画布可以做微信推文的网站
  • 灵感网站seo搜索引擎的优化
  • 福州建设局网站如何做自己的网站后台
  • 做酒店网站wordpress页面显示分类
  • joomla网站如何加入会话功能辽源网站建设设计
  • 商城网站开发的目的和意义php做网站多少钱
  • 网站建设会遇到哪些问题wordpress浏览数插件
  • 邢台网站制作哪里做招聘网站开发策划方案
  • 做代理稳妥的彩票网站有哪些如何提高网站访客数
  • 易语言怎么做点击按钮打开网站网站地区词优化
  • 昆明网站开发多少钱成品影视app开发月光宝盒怎么样
  • html5网站后台制作企业网站管理系统源码
  • 哪些网站可以做免费外贸WordPress链接加前缀
  • 如何将自己做的网站变成中文用ps怎样做网站文字logo
  • 数字营销专业就业前景免费seo快速收录工具
  • 做阿里巴巴网站图片尺寸网站开发前台与后台的交互
  • 男女做暖暖的视频试看网站帮企业做网站前景怎么样
  • 营销型网站优点广州站扩建
  • 营销型网站建设区别网站怎么做百度快照
  • 游戏攻略网站开发wordpress免费采集器
  • 云浮哪有做网站公司中国国家标准建设信息网站
  • 网站开发入门需要学什么做的网站 如何在局域网内访问
  • 买完域名以后怎么做网站上海信用网企业查询
  • 做医院健康专题网站thinkphp大型网站开发