В статье рассматривается задача оценки репрезентативности выборки для обучения классификатора. Анализируется влияние статистических характеристик выборки на качество обучения. Предлагается определение репрезентативности через понятие функционала риска в рамках теории статистического обучения и проводится оценка состоятельности данного определения.
У статті розглядається задача оцінки репрезентативності вибірки для навчання класифікатора. Аналізується вплив статистичних характеристик вибірки на якість навчання. Пропонується визначення репрезентативності через поняття функціоналу ризику в рамках теорії статистичного навчання і проводиться оцінка спроможності даного визначення.
The article considers the problem of estimating the representativeness of the samples for training the classifier. Analyzes the impact of the statistical characteristics of the sample on the quality of teaching. The proposed definition of representativeness through the concept of the risk functional in the theory of statistical learning and assesses the consistency of this definition is evaluated.