Кибернетика и вычислительная техника, 2012http://dspace.nbuv.gov.ua:80/xmlui/handle/123456789/456762024-03-29T13:11:46Z2024-03-29T13:11:46ZАвторы номера 170 за 2012 г.http://dspace.nbuv.gov.ua:80/xmlui/handle/123456789/458842013-06-20T00:25:13Z2012-01-01T00:00:00ZАвторы номера 170 за 2012 г.
2012-01-01T00:00:00ZМоделирование особенностей спонтанной украинской речи в системах автоматического распознавания речевого сигналаРобейко, В.В.http://dspace.nbuv.gov.ua:80/xmlui/handle/123456789/458832013-06-20T00:24:42Z2012-01-01T00:00:00ZМоделирование особенностей спонтанной украинской речи в системах автоматического распознавания речевого сигнала
Робейко, В.В.
Исследованы особенности спонтанной украинской речи с учетом их дальнейшего моделирования в процессе распознавания речи. Отдельное внимание уделяется акустической, фонетической и лексической компонентам системы распознавания речевого сигнала, прогнозированию ударений в словах и учету признаков спонтанности во время формирования речевых и текстовых корпусов для обучения системы. Предложенная базовая экспериментальная система распознавания спонтанной речи в реальном времени оперирует словарем до ста тысяч слов и позволяет набирать текст под диктовку.; Досліджено особливості спонтанного українського мовлення з метою їх подальшого моделювання в процесі розпізнавання мовлення. Особлива увага приділяється акустичній, фонетичній та лексичній компонентам системи розпізнавання мовленнєвих сигналів, прогнозуванню наголосів у словах та врахуванню ознак спонтанності під час формування усних та писемних мовленнєвих корпусів для навчання системи. Запропонована базова експериментальна система розпізнавання спонтанного мовлення в реальному часі оперує словником до ста тисяч слів і дозволяє набирати текст у режимі диктування.; Presented spontaneous speech-to-text real-time system allows for recognizing Ukrainian spontaneous speech, operates with a 100k word dictionary and provides typing text by voice for an ordinary user. Acoustic model parameters are estimated by 40-hour spontaneous speech corpus and 2 GB text data is used to build a 3-gram language model. Word error rate has dropped below 5% for common and mass-media lexicon. The system is available worldwide for evaluation purposes.
2012-01-01T00:00:00ZМетоды и модели для анализа корпуса документов нормативных актов в задачах электронного управленияПомилуйко, П.А.Тимашова, Л.А.http://dspace.nbuv.gov.ua:80/xmlui/handle/123456789/458822013-06-20T00:22:03Z2012-01-01T00:00:00ZМетоды и модели для анализа корпуса документов нормативных актов в задачах электронного управления
Помилуйко, П.А.; Тимашова, Л.А.
Описаны подходы, используемые для классификации корпуса текстовых документов. Предлагаются новые модели и методы позволяющие осуществлять тематическую классификацию и вычислять степень тематической принадлежности текста к образцу.; Описано підходи, які використовуються для класифікації корпусу текстових документів. Запропоновано нові моделі і методи, які дозволяють реалізувати тематичну класифікацію та обчислювати ступінь тематичної приналежності тексту до зразка.; The result of this work is a new solution to the problem of finding documents in the sample. Developed: a model of structural representation of textual information, the method and algorithms of its thematic analysis that would allow the thematic classification and calculation of the degree of thematic text belonging to the sample.
2012-01-01T00:00:00ZКластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигналаСажок, Н.Н.http://dspace.nbuv.gov.ua:80/xmlui/handle/123456789/458812013-06-20T00:24:10Z2012-01-01T00:00:00ZКластеризация слов при построении лингвистической модели для автоматического распознавания речевого сигнала
Сажок, Н.Н.
Описано формирование лингвистической модели для распознавания слитной речи на основе объединения слов в классы. Широко применяемый для этого метод кластеризации с учетом рекурсии частот слов обеспечивает приемлемую скорость при работе со славянскими языками из-за огромного обилия словоформ. Анализ построения критерия точности аппроксимации дал возможность ввести рекурсию в итерации кластеризации на уровне компонентов критерия, что привело к существенному уменьшению сложности вычислений. Впервые автоматически сформированные для лингвистической модели распознавания украинской речи классы слов обобщают грамматические, семантические и фонетические признаки.; Описано формування лінгвістичної моделі для розпізнавання злитого мовлення на основі об’єднання слів у класи. Найбільш поширений для цього метод кластеризації з урахуванням рекурсії частот слів не забезпечує прийнятної швидкості при роботі зі слов’янськими мовами через величезний надмір словоформ. Аналіз побудови критерію точності апроксимації дав змогу ввести рекурсію в ітерації кластеризації на рівні компонент критерію, що привело до суттєвого зменшення складності обчислень. Уперше автоматично сформовані для лінгвістичної моделі розпізнавання українського мовлення класи слів узагальнюють граматичні, семантичні та фонетичні ознаки.; Operating with word classes rather than words is a constructive advance in speech recognition linguistic component development. Formed classes generalize grammatical, semantic and phonetic word features. The proposed method showed essential word clustering acceleration that is an important step to covering the entire lexicon in continuous speech recognition systems for Ukrainian.
2012-01-01T00:00:00Z