Описаны подходы, используемые для классификации корпуса текстовых документов. Предлагаются новые модели и методы позволяющие осуществлять тематическую классификацию и вычислять степень тематической принадлежности текста к образцу.
Описано підходи, які використовуються для класифікації корпусу текстових документів. Запропоновано нові моделі і методи, які дозволяють реалізувати тематичну класифікацію та обчислювати ступінь тематичної приналежності тексту до зразка.
The result of this work is a new solution to the problem of finding documents in the sample. Developed: a model of structural representation of textual information, the method and algorithms of its thematic analysis that would allow the thematic classification and calculation of the degree of thematic text belonging to the sample.