Рассмотрены вопросы адаптации к голосу нового диктора к предварительно созданным системам пофонемного распознавания. Описан метод максимальной правдоподобности линейной регрессии. Приведены результаты экспериментальных исследований по адаптации для распознавания изолированных слов и спонтанной слитной речи. Проанализирована эффективность разных подходов в адаптации.
This paper is devoted to the problems of adaptation to a new speaker voice for speech recognition systems. The method of Maximum Likelihood Linear Regression (MLLR) is described. The results of different adaptation experiments with isolated words and continuous speech are discussed. Particularly the effectiveness of different approaches to the adaptation is analyzed.
Розглянуто адаптацію голосу нового диктора до створених попередньо систем пофонемного розпізнавання. Описано метод максимальної правдоподібності лінійної регресії. Подано результати експериментальних досліджень з адаптації для розпізнавання ізольованих слів та спонтанного злитого мовлення. Обговорюється ефективність різних підходів в адаптації.