Стаття присвячена розгляду та аналізу різних варіантів адаптації систем пофонемного розпізнавання ізольованих слів української мови до нового диктора. Описується метод адаптації під назвою «лінійна регресія максимальної правдоподібності» (MLLR). У рамках цього методу шляхом оптимізації значення
критерію розпізнавання обчислюються матриці лінійних перетворень, за якими адаптуються акустичні моделі фонем. Наводяться результати експериментальних досліджень розпізнавання мовлення адаптованої системи. Аналізуються дані розпізнавання адаптованих моделей залежно від кількості слів в адаптаційній вибірці.
Статья посвящена рассмотрению и анализу различных вариантов адаптации систем пофонемного распознавания изолированных слов украинского языка к новому диктору. Описывается метод адаптации под названием «линейная регрессия максимальной правдоподобности» (MLLR). В рамках этого метода
путем оптимизации значения критерия распознавания вычисляются матрицы линейных преобразований, которые задействованы в адаптации акустических моделей фонем. Представлены результаты экспериментальных исследований распознавания речи адаптированной системы. Анализируются данные распознавания адаптированных моделей в зависимости от количества слов в адаптационной выборке.
The paper deals with different variants of practical application of speaker adaptation for phoneme recognition of Ukrainian isolated words. The method of Maximum Likelihood Linear Regression (MLLR) is described. The matrixes of linear transformation are estimated in order to correct initial acoustic phoneme models. The results of experimental research of the adapted recognition system are discussed; particularly the amount of words in the adaptation sample is analyzed.