最新影视资讯盛会18 位大咖60 名商界巨擘共聚探索声纹识别技术的未来

在全球声纹识别研究与应用学术讨论会的盛况下,18 位知名专家和60 名行业代表齐聚昆山杜克大学,为探索这项前沿技术的未来而共同努力。会议由中国计算机学会与昆山杜克大学联合举办,获得了昆山市科学技术协会的大力支持,并有清华大学媒体大数据认知计算研究中心、中国计算机学会语音对话与听觉专业工作组等多方合作。

大会主席李明教授,以及何亮副研究员,不仅担任了开幕式上的主持,还分别致辞并引领了全天的研讨活动。开幕式上,昆山杜克大学学术事务副校长高海燕教授发表了热情洋溢的开场词,她强调了本次会议对于推动声纹识别领域发展至关重要的地位。

随后,由俞凯教授带领,我们进入了四个精彩环节:深度学习、对抗学习、说话人日志以及联合学习。每一环节都汇聚了一系列卓越演讲,其中包括李明教授关于“基于端到端深度学习的说话人和语种识别”的分享。他展示了团队在ICASSP及INTERSEECH等国际会议上取得的一系列突破性成果,这些成果不仅提升了系统性能,也为未来的研究指明了一条道路。

张鹏远研究员则探讨了“基于深度学习的短时声纹识别技术”,他提出了双路神经网络模型,以便从多个时间尺度中提取说话人的特征,并通过融合不同时间尺度实现互补效果。此外,他还介绍了一种区分性学习方法,使得低维向量能够更好地区分说话人。

宋彦副教授则专注于“基于深度学习的说话人识别方法”,他阐述了一种结合密集空洞卷积和注意力机制来提取帧级特征,以及跨层双线性池化操作映射段级特征,并且提出一种端到端优化目标实现的人工智能系统设计思路。

第二个环节中,谢磊教授分享了解决说对抗学习在语音领域应用的问题。在这个过程中,他详细介绍了解决噪声鲁棒性的解决方案,如使用生成式对抗网络(GAN)进行口音自适应,对抗样本攻击分类系统,以及利用多任务训练来增强数据质量。此外,洪青阳副教授进一步阐释如何通过对抗多任务网络提高噪声环境下的说话人识别性能,他们设计的一个编码器-判别器结构可以有效减少噪声干扰,从而提升系统准确率。

最后,在一个充满活力的氛围中,本次峰会圆满结束,每位参会嘉宾都带走了一份丰富的心得和新的灵感,为将来继续探索这项科技打下坚实基础。

标签: 智能装备方案

猜你喜欢