Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала

Домашня сторінка
→
Фізико-технічні та математичні науки
→
Відділення інформатики
→
Кибернетика и вычислительная техника
→
Кибернетика и вычислительная техника, 2012
→
Кибернетика и вычислительная техника, 2012, вип. 170
→
Переглянути статтю

dc.contributor.author	Сажок, Н.Н.
dc.date.accessioned	2013-06-19T20:41:25Z
dc.date.available	2013-06-19T20:41:25Z
dc.date.issued	2012
dc.identifier.citation	Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала / Н.Н. Сажок // Кибернетика и вычисл. техника. — 2012. — Вип. 170. — С. 59-66. — Бібліогр.: 8 назв. — рос.	uk_UA
dc.identifier.issn	0452-9910
dc.identifier.uri	http://dspace.nbuv.gov.ua/handle/123456789/45881
dc.description.abstract	Описано формирование лингвистической модели для распознавания слитной речи на основе объединения слов в классы. Широко применяемый для этого метод кластеризации с учетом рекурсии частот слов обеспечивает приемлемую скорость при работе со славянскими языками из-за огромного обилия словоформ. Анализ построения критерия точности аппроксимации дал возможность ввести рекурсию в итерации кластеризации на уровне компонентов критерия, что привело к существенному уменьшению сложности вычислений. Впервые автоматически сформированные для лингвистической модели распознавания украинской речи классы слов обобщают грамматические, семантические и фонетические признаки.	uk_UA
dc.description.abstract	Описано формування лінгвістичної моделі для розпізнавання злитого мовлення на основі об’єднання слів у класи. Найбільш поширений для цього метод кластеризації з урахуванням рекурсії частот слів не забезпечує прийнятної швидкості при роботі зі слов’янськими мовами через величезний надмір словоформ. Аналіз побудови критерію точності апроксимації дав змогу ввести рекурсію в ітерації кластеризації на рівні компонент критерію, що привело до суттєвого зменшення складності обчислень. Уперше автоматично сформовані для лінгвістичної моделі розпізнавання українського мовлення класи слів узагальнюють граматичні, семантичні та фонетичні ознаки.	uk_UA
dc.description.abstract	Operating with word classes rather than words is a constructive advance in speech recognition linguistic component development. Formed classes generalize grammatical, semantic and phonetic word features. The proposed method showed essential word clustering acceleration that is an important step to covering the entire lexicon in continuous speech recognition systems for Ukrainian.	uk_UA
dc.language.iso	ru	uk_UA
dc.publisher	Міжнародний науково-навчальний центр інформаційних технологій і систем НАН України та МОН України	uk_UA
dc.relation.ispartof	Кибернетика и вычислительная техника
dc.subject	Информационные технологии и системы	uk_UA
dc.title	Кластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала	uk_UA
dc.title.alternative	Кластеризація слів при побудові лінгвістичної моделі для автоматичного розпізнавання мовленнєвого сигналу	uk_UA
dc.title.alternative	Word clustering for speech signal recognition language model development	uk_UA
dc.type	Article	uk_UA
dc.status	published earlier	uk_UA
dc.identifier.udc	004.934