清华大学|信息学院|国家实验室|English Version

新闻媒体

1024日,英国斯特林大学的Andrew Abel博士受邀来信研院语音和语言技术中心访问,并作了题为“Cognitively Inspired Multimodal Speech Filtering”的学术报告。作为中英双方共同承担的NSFC-RSE合作交流项目部分成果,报告主要介绍了Andrew Abel博士在认知驱动的多模态语音增强方面的最新进展。该项技术目前主要应用于听力残疾人的语音过滤与增强,它融合了音频的语音传播信号和视频的口型识别图像信号,通过认知驱动的模糊逻辑模型,从两种不同的多模态信号选择有用的语音去过滤与增强特征。初步的实验结果已证实了该方法在排除音频噪声方面的重要作用。

             

【发布时间:2015-01-14】【浏览次数:1496】