做网站用php如何学习,十大网站开发公司,北京十大影视公司,婚纱摄影网站设计目录 1.作者介绍2.华为云语音合成2.1 语音合成介绍2.2 华为语音合成服务2.3 应用场景 3. 实验过程以及结果3.1 获取API密钥3.2 调用语音合成算法API3.3 实验代码3.4 运行结果 1.作者介绍
袁斌#xff0c;男#xff0c;西安工程大学电子信息学院#xff0c;2023级研究生 研究… 目录 1.作者介绍2.华为云语音合成2.1 语音合成介绍2.2 华为语音合成服务2.3 应用场景 3. 实验过程以及结果3.1 获取API密钥3.2 调用语音合成算法API3.3 实验代码3.4 运行结果 1.作者介绍
袁斌男西安工程大学电子信息学院2023级研究生 研究方向医学影像大数据分析 电子邮件1424233159qq.com
吴思雨女西安工程大学电子信息学院2023级研究生 研究方向机器视觉与异常检测 电子邮件2879944563qq.com
2.华为云语音合成
2.1 语音合成介绍
语音合成技术通常被称为文本到语音Text-to-SpeechTTS是一种将书面文本转换为自然语音的技术。其主要应用包括为视障人士提供信息获取渠道、智能语音助手、自动化呼叫中心以及内容创作中的配音等。语音合成技术的发展历程可以大致分为几个阶段基于规则的合成、统计参数合成如隐马尔可夫模型HMM以及近年来的深度学习方法如基于神经网络的WaveNet、Tacotron等。
2.2 华为语音合成服务
华为语音合成服务是一种将文本转换成逼真语音的服务。用户通过实时访问和调用API获取语音合成结果将用户输入的文字合成为音频。通过音色选择、自定义音量、语速为企业和个人提供个性化的发音服务。
2.3 应用场景
1.语音导航 使用语音合成服务将车载导航数据转换成语音素材为用户提供精确的语音导航服务。利用个性化定制能力提供丰富的导航语音服务。 2.有声读物 将书籍、杂志、新闻的文本内容转换成逼真的人声发音充分解放人们的眼睛在搭乘地铁、开车、健身等场景下获取信息、享受乐趣。 3.电话回访 在客服系统场景中通过语音合成服务将回访内容转换成人声直接使用语音和客户交流提升用户体验。 4.智能教育 将书本上的文本内容合成为语音接近真人的发音可模拟真人教学场景实现课文的朗读和带读帮助学生更好地理解和掌握教学内容。
3. 实验过程以及结果
3.1 获取API密钥
1、注册华为云账号进行实名认证开通服务。 2、AK/SK认证下载文件credentials.csv。 3、登录控制台。 4、单击页面右上角的用户名并选择“我的凭证”。进入“我的凭证”页面 单击“访问秘钥”页签下的“新增访问密钥”。弹出“新增访问密钥”对话框 输入“登录密码”如果绑定了手机或者邮箱还需要获取验证码并进行验证。验证成功后弹出访问密钥下载对话框。单击“确定”并根据提示下载保存访问密钥。如果已生成过AK/SK找到原来已下载的AK/SK文件文件名一般为credentials.csv。
3.2 调用语音合成算法API
1、点击开发者页面下的开发工具 2、单击API Explorer进入华为云OpenAPI页面搜索语音交互。 3、设置参数 输入需要语音合成的文本设置语音格式采样率语种等参数示例 待合成的文本明月几时有把酒问青天 语音格式头 mp3 采样率 8000 语种 chinese_xiaoqi_common 小琪,标准女声发音人 4、API 3.0 Explorer 在线接口调试图 调试成功之后将自动生成的python代码复制即可但是一定要记得填入自己的AK/SK
3.3 实验代码
将aksk等参数修改为获取的密钥运行成功后获得temp.mp3文件正是所输入文本的语音。
# coding: utf-8
from huaweicloudsdkcore.auth.credentials import BasicCredentials
from huaweicloudsdksis.v1.region.sis_region import SisRegion
from huaweicloudsdkcore.exceptions import exceptions
from huaweicloudsdksis.v1 import *
import base64
def base64_to_file(base64_string, file_path):# 将base64字符串解码为字节流decoded_bytes base64.b64decode(base64_string)# 将字节流写入文件with open(file_path, wb) as file:file.write(decoded_bytes)
if __name__ __main__:ak __import__(os).getenv(CLOUD_SDK_AK)sk __import__(os).getenv(CLOUD_SDK_SK)projectId 6093a8e9e016484f9f9ccb3e85d1af45credentials BasicCredentials(ak, sk, projectId)client SisClient.new_builder() \.with_credentials(credentials) \.with_region(SisRegion.value_of(cn-east-3)) \.build()try:request RunTtsRequest()configbody TtsConfig(audio_formatmp3,sample_rate8000,_propertychinese_xiaoqi_common,speed10,pitch10,volume50)request.body PostCustomTTSReq(configconfigbody,text明月几时有,把酒问青天)response client.run_tts(request)print(response)base64_to_file(response.result.data, temp.mp3)except exceptions.ClientRequestException as e:print(e.status_code)print(e.request_id)print(e.error_code)print(e.error_msg)
3.4 运行结果