Морфологічний розклад слів на основі лексичного наголосу в задачах розпізнавання українського мовлення

Морфологічний розклад слів на основі лексичного наголосу в задачах розпізнавання українського мовлення

Інші назви: Морфологическое разложение слов на основании лексического ударения в задачах распознавания украинской речи
Lexical stress-based morphological decomposition for ukrainian speech recognition tasks

Тема: Анализ и синтез коммуникационной информации

УДК: 004.934

URI: http://dspace.nbuv.gov.ua/handle/123456789/85234

Посилання: Морфологічний розклад слів на основі лексичного наголосу в задачах розпізнавання українського мовлення / М.М. Сажок, В.В. Робейко // Искусственный интеллект. — 2013. — № 3. — С. 233–241. — Бібліогр.: 8 назв. — укр.

Дата: 2013

Завантажень: 1468

Морфологічний розклад слів на основі лексичного наголосу в задачах розпізнавання українського мовлення

Анотація:

У статті описано новий метод морфологічного розкладу слів шляхом моделювання лексичного наголосу, що актуально для систем розпізнавання українського мовлення. Критерій сегментації формулюється на підставі великого текстового корпусу та слів із позначеним наголосом. Наведений алгоритм пошуку знаходить одну або декілька найбільш імовірних сегментацій. Описуються експериментальні дослідження, обговорюються результати та плани на майбутнє.

В статье описан новый подход к морфологическому разложению слов на основе моделирования лексического ударения, что актуально для систем распознавания украинской речи. Критерий сегментации формулируется на основании большого текстового корпуса и слов с обозначенным ударением. Приведенный алгоритм поиска находит один или несколько наиболее вероятных сегментаций. Описываются экспериментальные исследования, обсуждаются результаты.

This paper presents an approach to the morphological level word segmentation based on lexical stress modeling, which is prospective for Ukrainian speech recognition systems. The formulated segmentation criterion is based on a training set of words with manually pointed stresses and a large text corpus. The described search algorithm finds one or more segmentations with the best likelihood. The developed toolkit is presented, experimental research is described and results are discussed.

Показати повний запис статті