Виявлення та оброблення невизначеностей у формі неповних даних методами інтелектуального анализу

Домашня сторінка
→
Фізико-технічні та математичні науки
→
Відділення інформатики
→
Системні дослідження та інформаційні технології
→
Системні дослідження та інформаційні технології, 2016
→
Системні дослідження та інформаційні технології, 2016, № 2
→
Переглянути статтю

Виявлення та оброблення невизначеностей у формі неповних даних методами інтелектуального анализу

Кузнєцова, Н.В.

Інші назви: Identification and dealing with uncertainties in the form of incomplete data by data mining methods

Тема: Методи аналізу та управління системами в умовах ризику і невизначеності

УДК: 519.816

Інший ID: DOI: doi.org/10.20535/SRIT.2308-8893.2016.2.10

URI: http://dspace.nbuv.gov.ua/handle/123456789/134018

Посилання: Виявлення та оброблення невизначеностей у формі неповних даних методами інтелектуального анализу / Н.В. Кузнєцова // Системні дослідження та інформаційні технології. — 2016. — № 2. — С. 104-115. — Бібліогр.: 16 назв. — укр.

Дата: 2016

Завантажень: 524

Виявлення та оброблення невизначеностей у формі неповних даних методами інтелектуального анализу

Анотація:

Розглянуто методи оброблення пропущених даних і запропоновано їх класифікацію з урахуванням видів вхідних даних, типів та форматів даних, причин пропусків, зумовлених проявом впливу невизначеностей навколишнього світу і об’єкта моделювання. Досліджено спільні ознаки та відмінності існуючих методів оброблення, визначено особливості їх застосування для дозаповнення пропущених даних залежно від характеру невизначеностей. Показано, що традиційний підхід до заповнення пропусків середнім значенням не дозволяє отримати достовірні прогнози у багатьох випадках через зміну характеру вибірки. Запропоновано використання методів інтелектуального аналізу даних для оброблення пропущених значень та наведено приклад заповнення пропусків даних методами регресійного аналізу, зокрема за допомогою оцінок прогнозів.

In this paper, the methods for processing missing data are reviewed. The classification of methods depending on input data, data types and formats, and causes of data incompleteness associated with influence of uncertainties of the outside world and modeling object is proposed. The commonalities and differences between existing methods are investigated. The application peculiarities of these methods for filling missing data depending on properties of uncertainties are determined. It is shown that the traditional approach for filling the missing data by average values does not allow obtaining correct forecasts in many cases due to changes in sample’s properties. The usage of data mining methods technologies for dealing with missing data is proposed. An example of using regression methods is shown for filling missing data, in particular, using the forecast evaluation.

Показати повний запис статті