Проведено дослідження щодо тенденцій інтелектуалізації програмних компонентів у сучасних аналітичних системах. Показано що однією з головних вимог до сучасних аналітичних систем є комфортність самого процесу спілкування з системою за рахунок їхньої інтелектуалізації, тобто здатність системи пропонувати корстувачеві найбільш імовірній крок сценарію, виходячи з аналізу попередніх дій і накопичених знань. Запропоновано підхід до вирішення задачі інтелектуалізації процесу формування сценарію аналітичної діяльності, що заснований на розвитку методів машинного навчання, а саме розвитку навчання деревами класифікації і регресії (Classification and Regression Trees) з використанням комбінації метрик оцінок ефективності запропонованого варіанта — коефіцієнта Gini або розрахунку ентропії корисності інформації. На підставі запропонованого підходу виконано реалізацію алгоритму у вигляді програми мовою Python, яка дозволяє пропонувати ймовірний крок сценарію аналітичної діяльності, навчаючись на діях користувача.
Проведено исследование тенденций интеллектуализации программных компонентов в современных аналитических системах. Показано что одним из главных требований к современным аналитическим системам является комфортность самого процесса общения с системой за счет их интеллектуализации, то есть способность системы предлагать пользователю наиболее вероятный шаг сценария, исходя из анализа предыдущих действий и накопленных знаний. Предложен подход к решению задачи интеллектуализации процесса формирования сценария аналитической деятельности, основанный на развитии методов машинного обучения, а именно развития обучения деревьями классификации и регрессии (Classification and Regression Trees) с использованием комбинации метрик оценки эффективности предложенного варианта — коэффициента Спи или расчета энтропии полезности информации. На основании предложенного подхода выполнена реализация алгоритма в виде программы на языке Руйюп, которая позволяет предлагать вероятный шаг сценария аналитической деятельности, обучаясь на действиях пользователя.
An analytical activity scenario has considered as a certain representation of knowledge, used to describe the sequence of related events — in the form of Directed Acyclic Graph. The article proposes an approach to solving the problem of intellectualization of the process of forming a scenario of analytical activity, based on the development of methods of machine learning, namely Classification and Regression Trees. This approach using a combination of metrics for evaluation of the effectiveness has been applied.
The authors have proposed an own version of the intellectualization software, that implement of the Classification and Regression Trees method on Python programming language. This version differs from the known, the possibility of using different metrics in analyzing the quality of the partition and through it the choice of the next step of the probable actions of analytical scenarios. Unlike existing approaches, the authors have offered the choice of the most optimal metric for assessing the quality of approximation to the desired learning result — the Gini coefficient or the method of calculating the entropy of utility information by Shannon.