Выявление понятий и их взаимосвязей в рамках технологии контент-мониторинга

Домашня сторінка
→
Фізико-технічні та математичні науки
→
Відділення інформатики
→
Реєстрація, зберігання і обробка даних
→
Реєстрація, зберігання і обробка даних, 2006 (том 8)
→
Реєстрація, зберігання і обробка даних, 2006, № 4
→
Переглянути статтю

Выявление понятий и их взаимосвязей в рамках технологии контент-мониторинга

Інші назви: Виявлення понять та їх взаємозв’язків у рамках технологій контент-моніторингу
Detection of Concepts and their Interrelations within the Framework of Content-Monitoring Technology

Тема: Інформаційно-аналітичні системи обробки даних

УДК: 004.5

URI: http://dspace.nbuv.gov.ua/handle/123456789/50862

Посилання: Выявление понятий и их взаимосвязей в рамках технологии контент-мониторинга / А.Г. Додонов, Д.В. Ландэ // Реєстрація, зберігання і оброб. даних. — 2006. — Т. 8, № 4. — С. 45-52. — Бібліогр.: 7 назв. — pос.

Дата: 2006

Завантажень: 1483

Выявление понятий и их взаимосвязей в рамках технологии контент-мониторинга

Анотація:

Приведены подходы к решению проблемы выявления фактографической информации из неструктурированных текстовых потоков. Описаны технологические решения, позволяющие извлекать из полнотекстовых документов такие понятия как фирмы, фамилии, географические названия и т.п., а также выявлять силу их взаимосвязей на основе применения двух алгоритмов. Первый из этих алгоритмов основывается на учете совместного вхождения понятий в одни и те же документы, а второй на учете общего для рассматриваемых понятий контекста.

Наведено підходи до вирішення проблеми виявлення фактографічної інформації з неструктурованих текстових потоків. Описано технологічні рішення, що дозволяють добути з повнотекстових документів такі поняття як фірми, прізвища, географічні назви тощо, а також виявляти силу їхніх взаємозв’язків на базі застосування двох алгоритмів. Перший з цих алгоритмів базується на врахуванні спільного входження понять до одних і тих самих документів, а другий — на врахуванні загального для понять, що розглядаються, контексту.

Approaches to the solution of a problem of revealing factual information from unstructured text flows are given. The technological solutions, allowing to take from text-through documents such concepts as a firm, a surname, place names, etc., and also to reveal force of their interrelations on the basis of application of two algorithms are described. The first of these algorithms is based on the account of joint concepts occurrence in the same documents, and the second one on the account of the context common for considered concepts.

Показати повний запис статті