The task was to determine the factors that have the most significant influence on the state of water in the Dnieper reservoirs by constructing a model of dependence of the concentration of chlorophyll a in phytoplankton according to long-term observations in Kremenchug and Kakhovka reservoirs. The results of observations of the Institute of Sciences in 1976–1993. Various inductive methods were used to obtain a satisfactory result. Algorithms: linear regression of (LR), LASSO, combinatorial algorithm of (COMBI) GMDH and correlation-rating algorithm (CRA).
Мета. Була поставлена задача визначення факторів, які мають найвагоміший вплив на стан води в Дніпровських водосховищах, шляхом побудови моделі залежності концентрації хлорофілу а у фітопланктоні за даними багаторічних спостережень в Кременчуцькому та Каховському водосховищах. Результати спостережень за 1976–1993 роки надані Інститутом гідробіології НАН України. Методи. Малий обсяг даних спостережень та похибки вимірювань значно ускладнює розв’язання задачі. Для отримання задовільного результату було застосовано різні індуктивні методи. Проведено моделювання алгоритмами: лінійна регресія LR, LASSO, комбінаторний алгоритм МГУА COMBI та кореляційний алгоритм з аналізу рейтингу факторів CRA. Для оцінки адекватності отриманих моделей застосовано коефіцієнт детермінації R2 та відповідний коефіцієнт множинної кореляції R. Результати. Для Кременчуцького водосховища виявилось, що моделі, побудовані за допомогою LASSO та COMBI мають негативне значення коефіцієнту детермінації R2, тобто недостатню адекватність. Модель, отримана за допомогою лінійної регресії LR, має коефіцієнт детермінації R2 = 0,204 (відповідно, множинної кореляції R = 0,452). Це означає, що модель має задовільну адекватність. Але при цьому має в своєму складі всі чинники, тобто не відбирає найвагоміші. Модель, отримана за допомогою кореляційного алгоритму з розрахунком рейтингу регресорів CRA, має коефіцієнт детермінації R2 = 0,273 (відповідно, множинної кореляції R = 0,522).