У статті розглядається актуальне питання породження послідовностей фонем за орфографічним текстом і зворотне перетворення. Пропонується модель, у якій закладені закономірності зв’язку між фонетичними й орфографічними символами. Багатозначні перетворення, що здійснюються згідно з моделлю, еквівалентні побудові направленого графа. Параметри моделі задаються таблично у вигляді
контекстно-залежних правил, які формує експерт. У моделі передбачено введення додаткових рівнів транскрибування, що дає змогу експертові будувати складніші перетворення, працюючи з відносно простими правилами. Розроблено систему, на вхід якої подається орфографічний текст із позначеннями наголосу, а на виході отримуємо послідовності фонем, які відповідають різним варіантам вимови вхідного тексту. Наводяться приклади практичного застосування системи для автоматичного розпізнавання українського спонтанного мовлення.
В статье рассматривается актуальный вопрос порождения последовательностей фонем по орфографическому тексту и обратное преобразование. Предлагается модель, в которой заложены закономерности связи между фонетическими и орфографическими символами. Многозначные преобразования, осуществляемые согласно модели, эквивалентны построению направленного графа. Параметры модели задаются таблично в виде контекстно-зависимых правил, которые формирует эксперт. В модели предусмотрено введение дополнительных уровней транскрибирования, что позволяет эксперту строить сложные преобразования, работая с относительно простыми правилами. Разработана система, на вход которой подается орфографический текст с обозначениями ударений, а на выходе получаем последовательности фонем, соответствующих различным вариантам произношения исходного текста. Приводятся примеры практического применения системы для автоматического распознавания украинской спонтанной речи.
In this paper we consider the actual problem of grapheme-to-phoneme conversion for forward and backward directions. We propose the model describing regularities of relations between the phonetic and spelling symbols. Multi-decision transformations carried out according to the model, are equivalent to building of a directed graph. The
model parameters are specified in tabular form as a set of context-sensitive rules formed by the expert. Introduced additional model levels of transcription allow the expert to build complex transformations, still working with relatively simple rules. The developed system takes the orthographic text with the pointed accentuation and produces phoneme sequences corresponding to the different pronunciation variants of the input text. The examples of practical applications of the system for automatic recognition of Ukrainian spontaneous speech are described.