Розроблено вдосконалені методи обчислення показників статистики Колмогорова-Смирнова, ваги категорії змінної та значення інформації без явного розбиття оригінальної вибірки на дві підмножини, з виведенням відповідних формул для аналізу предикативної (прогностичної) сили категоріальних змінних у задачах кредитного рейтингу та інших областях практичного застосування методів бінарної класифікації. Здійснено узагальнення класичних формул статистики Колмогорова-Смирнова, ваги категорії змінної та показника значення інформації шляхом перетворення агрегатних виразів для дискретних розподілів та кумулятивних функцій розподілу з застосуванням скалярного добутку векторів та операторів проектування, а також оператора умовної перестановки. Запропоновано вдосконалені формули обчислення статистики Колмогорова-Смирнова, ваги категорії змінної та індексу значення інформації, що узагальнено описуються в термінах дискретного безумовного розподілу вхідної змінної та умовного розподілу бінарної цільової змінної.
Разработаны усовершенствованные методы вычисления показателей статистики Колмогорова-Смирнова, веса категории переменной и значения информации без явного разбиения оригинальной выборки на два подмножества, с приведением соответствующих формул для анализа предикативной (прогностической) силы категориальных переменных в задачах кредитного рейтинга и других областях практического применения методов бинарной классификации. Произведено обобщение классических формул статистики Колмогорова-Смирнова, веса категории переменной и показателя значения информации путем преобразования агрегатных выражений для дискретных распределений и кумулятивных функций распределения с применением скалярного произведения векторов и операторов проектирования, а также оператора условной перестановки. Предложены усовершенствованные формулы вычисления статистики Колмогорова–Смирнова, веса категории переменной и индекса значения информации, которые обобщенно описаны в терминах дискретного безусловного распределения входящей переменной и условного распределения бинарной целевой переменной.
The improved evaluation methods of the Kolmogorov-Smirnov statistic, Weight of Evidence and Information Value indicators are developed without explicit splitting of the original sample into two subsets with developing corresponding formulas for the predictive (forecasting) power analysis of categorical variables in the credit scoring tasks and other fields of practical application of binary classification methods. The generalization of the classical formulas for the Kolmogorov-Smirnov statistic, Weight of Evidence and Information Value indicators have been performed by means of the aggregate expressions transformation for discrete distributions and cumulative distribution functions applying the inner product of two vectors, projection operators, and also a conditional substitution operator. The improved estimation formulas for the Kolmogorov-Smirnov statistic, Weight of Evidence and Information Value indices are proposed and generally described in terms of the discrete unconditional distribution of the input variable and the conditional distribution of the binary target variable.