У статті описано новий метод морфологічного розкладу слів шляхом моделювання лексичного наголосу,
що актуально для систем розпізнавання українського мовлення. Критерій сегментації формулюється на
підставі великого текстового корпусу та слів із позначеним наголосом. Наведений алгоритм пошуку
знаходить одну або декілька найбільш імовірних сегментацій. Описуються експериментальні дослідження,
обговорюються результати та плани на майбутнє.
В статье описан новый подход к морфологическому разложению слов на основе моделирования
лексического ударения, что актуально для систем распознавания украинской речи. Критерий сегментации
формулируется на основании большого текстового корпуса и слов с обозначенным ударением. Приведенный
алгоритм поиска находит один или несколько наиболее вероятных сегментаций. Описываются экспериментальные исследования, обсуждаются результаты.
This paper presents an approach to the morphological level word segmentation based on lexical stress modeling,
which is prospective for Ukrainian speech recognition systems. The formulated segmentation criterion is based on a
training set of words with manually pointed stresses and a large text corpus. The described search algorithm finds one
or more segmentations with the best likelihood. The developed toolkit is presented, experimental research is described
and results are discussed.