网站模版怎样使用,建筑局网站,没有网站可以做seo,wordpress后台管理地址更改海天瑞声数据集上新#xff1a;超60个国家地区口音英语语音识别数据集、多国口音西语语音识别数据集、印度多语种语音识别数据集、中文自然对话语音合成数据集、中文多音色语音合成数据集、多肤色高清人像数据集。海天瑞声高质量AI训练数据加速提升模型性能#xff0c;让AI产…海天瑞声数据集上新超60个国家地区口音英语语音识别数据集、多国口音西语语音识别数据集、印度多语种语音识别数据集、中文自然对话语音合成数据集、中文多音色语音合成数据集、多肤色高清人像数据集。海天瑞声高质量AI训练数据加速提升模型性能让AI产品更好地满足全球用户的多样化需求。 1. 超60个国家地区口音英语语音识别数据集
英语作为全球通用的语言被广泛使用但不同国家和地区的发音存在诸多差异。使用高质量的多国口音英语数据集有助于提升语音识别系统的鲁棒性和准确率。
产品特色该数据集包含60多个国家及地区的口音英语58,000名发音人总时长 30,000小时97%以上字准确率。发音人性别均衡年龄跨度从18岁到65岁全面覆盖了不同年龄段的语言特征。本次上新的口音英语数据集包括美国英语、新加坡英语、英国英语、澳大利亚英语、加拿大英语、印度英语、日本英语、法国英语、德国英语、中国香港英语、中国台湾英语等。
话题内容包含呼叫中心、商务会议、金融、保险、营销、教育、医疗、旅游等20多种领域。 2. 多国口音西班牙语语音识别数据集
西班牙语是联合国六大官方语言之一按照第一语言使用者数量排名西班牙语为世界第二大语言。
产品特色该数据集包含超7,800名发音人总时长超5,500小时97%以上字准确率。发音人性别均衡年龄跨度从18岁到65岁全面覆盖了不同年龄段的语言特征。包含8个国家及地区的西班牙语美国西班牙语、墨西哥西班牙语、哥伦比亚西班牙语、委内瑞拉西班牙语、智利西班牙语、阿根廷西班牙语等。
话题内容包含情感对话、商务会议、日常对话、新闻、金融等多领域的朗读及对话数据。 3. 印度多语种语音识别数据集
在印度除了第一官方语言印度语还有122种主要语言使用人口超过100万的语言有30种还有6种官方认定的古典语言。
产品特色该数据集包含16,000名发音人总时长超12,000小时97%以上字准确率。包含印度众多主要语种迈蒂利语、孟加拉语、马拉地语、泰卢固语、马拉雅拉姆语、泰米尔语、奥利亚语、乌尔都语克什米尔语、旁遮普语、阿萨姆语等。
话题内容包含日常、新闻、娱乐、闲聊等多领域的朗读数据。 4. 自然对话语音合成数据集 本次上新2个中文自然对话语音合成数据集音色自然度高为语音合成技术提供强大支持。
1) 中文平均音色-自然对话
产品特色该数据集共18小时由3男和2女录制涵盖自然对话、朗读、中英混读等多种场景。均经过精确标注包括发音、韵律和副语言特征确保了数据的高质量和实用性。
话题内容包含自然对话、单词、冷笑话、谜语、歇后语、绕口令、诗歌、歇后语、语气词等特色内容。
2) 中文平均音色-素人自然对话
产品特色该数据集共27小时由6男和21女录制发音和韵律均经过精确标注确保了数据的高质量和实用性。是由素人录制的音色自然度更高不完全是标准普通话可能存在些许口音、哑音情况。
话题内容包含话题拓展闲聊例如日常生活、兴趣爱好、特殊技能等特色内容。 5. 多风格多音色语音合成数据集
1) 中文平均音色-特色声音
产品特色该数据集共11小时由58男和42女录制涵盖多种不同音色 - 御姐音、大叔音、低音炮、夹子音、仿老年音等。均经过精确标注包括发音、韵律和副语言特征重音、拖音。
话题内容包含话题拓展闲聊例如名字由来、兴趣爱好、童年经历等。
2) 中文平均音色-素人多情感多风格
产品特色该数据集共11小时由50男和50女录制。均经过精确标注包括发音、韵律和音色标注。由素人录制的音色自然度更高对每个声音按照音色性别、听感年龄、声音听感描述、声带状态、发音位置等分类进行标注。
话题内容包含多情感数据平静、开心、生气、悲伤等情绪。 6. 多肤色高清人像数据集
产品特色该数据集采集了50,000人高清人像数据分辨率短边不小于1024。每人采集3-5张面部图片数据肤色包括黑、黄、其他人种不包括白人覆盖多种常见面部表情如自然表情、快乐、兴奋等包括多种照明条件如室内和室外的正常、明亮、昏暗和侧照明等。
应用领域可应用于智能座舱、智能安防、智慧金融、智能家居等领域推动计算机视觉技术在相应领域的应用和发展。