Проведено багатофакторний лінійний регресійний аналіз та класифікаційне моделювання (алгоритм Random Forest) протипухлинної активності похідних 4-тіазолідинонів з метою спрямованого синтезу сполук з протираковою дією. Прогностична здатність підтверджена статистичними показниками, отриманими в процесі створення моделі, та при прогнозі тестової вибірки. Здійснено аналіз вкладів дескрипторів у прийняття рішення, визначено найбільш важливі з них для проведення класифікації, розкрито їх фізико-хімічний зміст та проілюстровано зв'язок виділених молекулярних дескрипторів зі здатністю до інгібування росту онкоклітин.
Проведен многофакторный линейный регрессионный анализ и классификационное моделирование (алгоритм Random Forest) противоопухолевой активности производных 4-тиазолидинонов с целью целенаправленного синтеза соединений с противораковым действием. Прогностическая способность подтверждена статистическими показателями, полученными в процессе создания модели и при прогнозе тестовой выборки. Осуществлен анализ вкладов дескрипторов в принятие решения, определены наиболее важные из них для проведения классификации, раскрыто их физико-химическое значение и проиллюстрирована связь выделенных молекулярных дескрипторов со способностью к ингибированию роста онкоклеток.
In order to perform directed synthesis of antineoplastic compounds the multiple linear regression analysis and classifi cation modeling (by Random Forest algorithm) of 4-thiazolidinones as anticancer agents have been carried out. The predictive ability is confi rmed by the statistic data obtained during model developing and test sample predicting. Descriptors contribution in the decision making has been estimated, the most important descriptors for the classifi cation have been identifi ed and interpreted. The relationship between the molecular descriptors selected and cancer cells growth inhibition is given.