Векторные и распределенные представления, отражающие меру семантической связи слов

Векторные и распределенные представления, отражающие меру семантической связи слов

Місуно, І.С. ; Рачковський, Д.А. ; Сліпченко, С.В.

Інші назви: Векторні і розподілені представлення, що відображають ступінь семантичного зв’язку слів
Vector and distributed representations reflecting semantic relatedness of words

Тема: Моделювання і управління великими системами

УДК: 004.912 + 004.738.52

URI: http://dspace.nbuv.gov.ua/handle/123456789/58450

Посилання: Векторные и распределенные представления, отражающие меру семантической связи слов / І.С. Місуно, Д.А. Рачковський, С.В. Сліпченко // Мат. машини і системи. — 2005. — № 3. — С. 50-66. — Бібліогр.: 30 назв. — рос.

Дата: 2005

Завантажень: 377

Векторные и распределенные представления, отражающие меру семантической связи слов

Анотація:

Рассматриваются методы формирования многомерных векторных представлений слов, отражающих их семантическую близость. Используется статистика совместной встречаемости слов и контекстов, извлекаемая из больших корпусов текстов. Реализован прототип программных средств обработки текстовой информации, формирования семантических представлений и текстового поиска. Приводятся результаты экспериментальных исследований адекватности разработанных представлений в ряде тестовых задач.

Розглянуто методи формування багатовимірних векторних представлень слів, що відображають їх семантичну близькість. Використовується статистика сумісного вживання слів і контекстів у великих корпусах текстів. Реалізовано прототип програмних засобів обробки текстової інформації, формування семантичних представлень та текстового пошуку. Приведено результати експериментальних досліджень адекватності розроблених представлень у ряді тестових задач.

Methods for formation of multidimensional vector representation of words reflecting their semantic similarity are considered. The methods are based on statistics of co-occurrence of words and contexts that is extracted from large text corpuses. Prototypes of software systems for processing of textual information, formation of semantic representations and text search are implemented. Results of experimental investigation of the developed representations in a number of tests are provided.

Показати повний запис статті