网站正在建设中是什么意思,网站开发技术架构,网站没有根目录,深圳设计公司深圳设计公司排名声纹识别#xff0c;又称说话人识别#xff0c;是根据语音信号中的声纹特征来识别话者身份的过程#xff0c;也是一种重要的生物认证手段。历经几十年的研究#xff0c;当前声纹识别系统已取得了令人满意的性能表现#xff0c;并在安防、司法、金融、家居等诸多领域中完成…声纹识别又称说话人识别是根据语音信号中的声纹特征来识别话者身份的过程也是一种重要的生物认证手段。历经几十年的研究当前声纹识别系统已取得了令人满意的性能表现并在安防、司法、金融、家居等诸多领域中完成部署有着广阔的应用前景。 然而大量证据表明这些系统在实际应用中容易受到恶意伪造行为的影响致使系统的安全性存在很大隐患在很大程度上限制了声纹识别技术的大规模推广应用。为了解决这一安全隐患当前研究界和产业界从技术导向出发对伪造攻击进行分类探索相应的对抗策略。其中ASVspoof竞赛系列最具代表。该赛事聚焦在声纹识别中的假冒闯入攻击与对策任务提供了一个公平的评测平台包括标准的数据、协议和评价极大地促进了研究社区的发展也积累了诸多有效的技术手段。
本文从应用导向出发对声纹识别中的音频伪造问题进行梳理提出了一种新的分类法并介绍了各类伪造技术的基本概念和代表对策。该研究工作《An Application-Oriented Taxonomy on Spoofing, Disguise and Countermeasures in Speaker Recognition》近期已在领域权威杂志《APSIPA Transactions on Signal and Information Processing》上发表。这项工作的主要贡献包括
从不同的应用场景Application出发衍生出不同的伪造行为Fake action。这些应用场景包括访问控制、监听和司法伪造行为分为假冒攻击Spoofing attack和伪装欺骗Disguise cheating两大类。进一步根据伪造音频的生成模式Production来自人还是机器和评价方法Evaluation通过听觉感知还是自动检测的不同对两大类伪造行为进一步细分划分出不同的伪造技术手段Technique形成了从应用层到技术层的五层概念图如下图所示。本工作更多是以应用为导向对音频伪造进行宏观划分因此面向读者可以是领域内的专家或技术人员也可以是对领域感兴趣的学生或工程师。以应用为导向声纹识别中的音频伪造分类图 原文链接可下载全文
https://www.nowpublishers.com/article/Details/SIP-2022-0017 参考文献
Lantian Li, Xingliang Cheng, Thomas Fang Zheng. An Application-Oriented Taxonomy on Spoofing, Disguise and Countermeasures in Speaker Recognition. In APSIPA Transactions on Signal and Information Processing, 11(2), 2022.