Наукова електронна бібліотека
періодичних видань НАН України

Розпізнавання спонтанного мовлення на основі акустичних композитних моделей слів у реальному часі

Репозиторій DSpace/Manakin

Показати простий запис статті

dc.contributor.author Робейко, В.В.
dc.contributor.author Сажок, М.М.
dc.date.accessioned 2014-03-14T08:52:19Z
dc.date.available 2014-03-14T08:52:19Z
dc.date.issued 2012
dc.identifier.citation Розпізнавання спонтанного мовлення на основі акустичних композитних моделей слів у реальному часі / В.В. Робейко, М.М. Сажок // Штучний інтелект. — 2012. — № 4. — С. 253-263. — Бібліогр.: 14 назв. — укр. uk_UA
dc.identifier.issn 1561-5359
dc.identifier.uri http://dspace.nbuv.gov.ua/handle/123456789/57739
dc.description.abstract У статті розглядається реалізація методів і алгоритмів розпізнавання злитого мовлення на основі композиції слів із акустичних генеративних моделей фонем. Аналізуються аспекти оцінки параметрів математичних моделей акустичної та лінгвістичної складових системи розпізнавання та перетворення графем на фонеми, що поєднує обидві ці складові. Окрема увага приділяється прогнозуванню наголосів у словах та врахуванню ознак спонтанності. Базова експериментальна система розпізнавання злитого (у тому числі спонтанного) мовлення в реальному часі оперує словником до ста тисяч слів та дає змогу набирати текст під диктування. Аналізуються перспективи подальшого розширення словника та вдосконалення процедур оцінки параметрів моделей, обговорюються ергономічні питання. uk_UA
dc.description.abstract Рассматривается реализация методов и алгоритмов распознавания слитной речи на основе композиции слов из акустических генеративных моделей фонем. Анализируются аспекты оценки параметров математических моделей акустической и лингвистической составляющей системы распознавания и преобразования графем в фонемы, объединяющей обе эти составляющие. Отдельное внимание уделяется прогнозированию ударений в словах и учету признаков спонтанности. Базовая экспериментальная система распознавания слитной (в том числе спонтанной) речи в реальном времени оперирует словарем до ста тысяч слов, и позволяет набирать текст под диктовку. Анализируются перспективы дальнейшего расширения словаря и совершенствования процедур оценки параметров моделей, обсуждаются эргономические вопросы. uk_UA
dc.description.abstract This paper describes implementation of methods and algorithms for the automatic speech recognition based on word composition proceeding from acoustic phoneme models. Such a design of the speech-to-text decoder is conventional and most productive for Western languages. The aim is to explore this approach applied to the Ukrainian language that is highly inflective with relatively free word order. We use data-driven methods to estimate parameters for both acoustic and linguistic components of the mathematical model. The grapheme-to-phoneme conversion procedure takes into account word stress issue and spontaneous continuous speech features. The basic speech-to-text system is able to operate a 100k vocabulary in real-time. The prospective of dictionary and domain extension, parameter estimation improvement and ergonomic issues are discussed. uk_UA
dc.language.iso uk uk_UA
dc.publisher Інститут проблем штучного інтелекту МОН України та НАН України uk_UA
dc.relation.ispartof Штучний інтелект
dc.subject Анализ и синтез коммуникационной информации uk_UA
dc.title Розпізнавання спонтанного мовлення на основі акустичних композитних моделей слів у реальному часі uk_UA
dc.title.alternative Распознавание спонтанной речи на основе акустических композитных моделей слов в реальном времени uk_UA
dc.title.alternative Real-Time Spontaneous Speech Recognition Based on Word Acoustic Composite Models uk_UA
dc.type Article uk_UA
dc.status published earlier uk_UA
dc.identifier.udc 004.934


Файли у цій статті

Ця стаття з'являється у наступних колекціях

Показати простий запис статті

Пошук


Розширений пошук

Перегляд

Мій обліковий запис