清华大学|信息学院|国家实验室|English Version

新闻媒体

318日,剑桥大学张超博士访问我院语音和语言技术中心并以《Tandem and Hybrid Speech Recognition Systems based on a General ANN Extension in HTK》为题作了学术报告。报告介绍了HTK(The Hidden Markov Model Toolkit)对人工神经网络功能的扩展,这些扩展可较好地兼容原有的HTK系统架构,并可广泛应用于声学模型和特征提取等方面的任务。目前,有许多基于ANN的语音处理技术,包括区分性序列训练、说话人自适应、模型融合以及系统联合优化等,这些功能在最近发布的HTK v3.5版本中都进行了相应扩展。报告还就目前最流行的基于深度神经网络的tandemhybrid系统在电话会话语音以及多风格广播听写中的应用等作了主要的介绍。张超博士还对其最近的相关工作,如tandemhybrid系统的联合解码,语音识别中说话人相关和说话人无关模型的参数化激活函数等任务进行了详细的讲解。来自校内外同领域的师生学者40余人参加了此次学术报告会。

张超博士,2009-2012年就读于我院语音中心并获得硕士学位,2012年赴英国剑桥大学攻读博士学位,继续在语音识别领域学习和研究,主要致力于基于深度神经网络的语音识别及其联合优化,期间参了HTK神经网络模块的开发工作。他曾获得2011NCMMSC2014ICASSP最佳学生论文奖,2015ASRU最佳论文候选人等多项荣誉提名,他所研究开发的语音识别系统参与了iARPA Babel 2013DARPA BOLT 2014ASRU 2015 MGB等一系列语音识别相关的工程评测,是目前最佳的语音识别系统之一。

【发布时间:2016-04-12】【浏览次数:909】