В статье рассмотрена проблема построения эффективных бинарных классификаторов в условиях, когда классы сильно несбалансированы. Показана их связь с издержками классификации, рассмотрены стратегии борьбы с несбалансированностью и проведены эксперименты на кредитных историях российских банков.
У статті розглянута проблема побудови ефективних бінарних класифікаторів в умовах, коли класи сильно незбалансовані. Показаний їх зв’язок з витратами класифікації, розглянуті стратегії боротьби з незбалансованістю та проведені експерименти на кредитних історіях російських банків.
The article discusses the problem of constructing efficient binary classifiers on imbalanced datasets. Costs of classification and strategies to win the imbalance are considered. Experiments on the credit histories of Russian banks are made.