У статті розглянуто особливості автоматизованого семантичного аналізу тексту, досліджено проблеми створення
автоматизованих лінгвістично-програмних засобів, придатних для
застосування в системах екстракції семантики з тексту. Автором
систематизовано та здійснено порівняльний аналіз результатів
наукових досліджень у галузі розробки моделей і методів семантичного аналізу природномовної інформації. Визначено два
основні підходи в напрямку комп’ютерної обробки природномовних
текстів: лінгвоаналітичний і статистичний. Автором аргументовано, що найбільш перспективними та ефективними з них
є, відповідно, експліцитні методи семантичного аналізу текстової
інформації (алгоритми онтологічного семантичного аналізу) та методи латентно-семантичного аналізу. Окреслено можливі шляхи
удосконалення існуючих комп’ютерних засобів діагностування релевантності природномовної інформації; обгрунтовано, що
найпопулярнішими методами обробки природномовної інформації з
метою екстракції та репрезентації семантики мають бути системи, що ґрунтуються на ефективному поєднанні лінгвістичних
технологій аналізу (графематичного, морфологічного, синтаксичного,
семантичного), зокрема із застосуванням онтологій, та методу
латентно-семантичного аналізу. Доведено, що інтеграція технологій
експліцитного семантичного аналізу, латентно-семантичного аналізу, методів теорії нечіткої логіки, штучного інтелекту та ін. є
перспективним шляхом розв’язання проблеми автоматизованого семантичного аналізу природномовної інформації.
In the article the features of automated semantic analysis of the text have been
considered; problems of creation of automated linguistic-software tools, which are
suitable for application in extraction systems of semantics from the text have been
investigated. The author has systematized and carried out a comparative analysis of
the results of scientific research in the field of developing models and methods of
semantic analysis of natural-language information. Two basic approaches in the
field of computer processing of natural-language texts have been determined: linguaanalytical
and statistical. The author has argued that the most promising and
effective of them are, respectively, explicit methods of semantic analysis of text information (algorithms of ontological semantic analysis) and methods of latent semantic analysis. Possible ways of improvement of existing computer means for
diagnosing the relevance of natural-language information have been outlined; it has been substantiated that the most popular methods of processing natural-language information for the purpose of extraction and representation of semantics should be
systems based on the efficient combination of linguistic analysis technologies (graphical, morphological, syntactic, semantic), in particular using ontologies, and the method of latent semantic analysis. It has been proved that the integration of
technologies of explicit semantic analysis, latent semantic analysis, methods of the theory of fuzzy logic, artificial intelligence, etc. is a promising way of solving the problem of automated semantic analysis of natural-language information.