У роботі запропонована модель семантичних та тематичних лексемних полів для інтелектуального аналізу
текстових документів. Розглянуто векторну модель текстових документів у семантичному просторі, базис
якого утворено частотно-дистрибутивними характеристиками семантичних та тематичних полів.
Експериментальний аналіз тестової вибірки показав високу ефективність використання лексемних полів у
класифікаційному аналізі авторства текстів.
В работе предложена модель семантических и тематических лексемных полей для интеллектуального
анализа текстовых документов. Рассмотрена векторная модель текстовых документов в семантическом
пространстве, базис которого образован частотно-дистрибутивными характеристиками семантических и
тематических полей. Экспериментальный анализ тестовой выборки показал высокую эффективность
использования лексемных полей в классификационном анализе авторства текстов.
The model of semantic and thematic lexemes fields for data mining of text documents has been proposed.
The vector model of text documents in the semantic space was considered. The basis of this space is formed
by frequency-distributional characteristics of semantic and thematic fields. The experimental analysis of texts
samples showed high efficiency of lexemes fields usage in the classification analysis of texts authorship.