Aim. Development of an inductive technology of objective clustering of gene expression profiles based on a self-organizing SOTA clustering algorithm. Methods. Inductive methods of complex system analysis were used to implement the inductive technology of objective clustering of gene expression profiles. The optimal parameters of clustering algorithm were estimated using internal clustering quality criteria, external criteria and complex balance criteria. Results. Here we present the architecture of the inductive technology of objective clustering based on SOTA clustering algorithm and step-by-step procedure of its implementation. Charts of the internal, external and complex balance criteria versus the algorithm parameters were obtained during simulation. This allowed us to determine the optimal parameters of the algorithm. Conclusion. We have shown a high efficiency of the proposed technology. In case of analysis of gene expression profiles, this approach allows to implement a step-by-step cluster-bicluster technology of data grouping at an early stage of gene regulatory network reconstruction.
Мета. Розробка індуктивної технології об'єктивної кластеризації профілів експресій генів на основі самоорганізуючого алгоритму кластеризації SOTA. Методи. Індуктивні методи аналізу складних систем було використано у якості базової основи при створенні індуктивної технології об'єктивної кластеризації профілів експресій генів. Оптимальні параметри роботи алгоритму кластеризації визначалися на основі комплексного використання внутрішніх та зовнішніх критеріїв якості кластеризації та комплексного критерію балансу. Результати. У статті представлено архітектуру індуктивної технології об'єктивної кластеризації на основі алгоритму кластеризації СОТА та покрокова процедура її реалізації. У процесі моделювання було отримано графікі залежності внутрішніх, зовнішніх та комплексного критерію балансу від параметрів роботи алгоритму кластеризації, аналіз яких дозволяє визначити оптимальні параметри роботи алгоритму кластеризації. Висновки. Отримані результати моделювання показали високу ефективність запропонованої технології. У випадку обробки профілів експресій генів дана технологія створює умови для реалізації покрокової кластер-бікластер технології групування даних на ранньому етапі реконструкції генної регуляторної мережі.
Цель. Разработка индуктивной технологии объективной кластеризации профилей экспрессий генов на основе самоорганизующегося алгоритма кластеризации SOTA. Методы. Индуктивные методы анализа сложных систем были использованы в качестве базовой основы при создании индуктивной технологии объективной кластеризации профилей экспрессии генов. Оптимальные параметры работы алгоритма кластеризации определялись на основе комплексного использования внутренних и внешних критериев качества кластеризации и комплексного критерия баланса. Результаты. В статье представлена архитектура индуктивной технологии объективной кластеризации на основе алгоритма кластеризации СОТА и пошаговая процедура ее реализации. В процессе моделирования были получены графики зависимости внутренних, внешних и комплексного критерия баланса от параметров работы алгоритма кластеризации, анализ которых позволяет определить оптимальные параметры работы алгоритма кластеризации. Выводы. Полученные результаты моделирования показали высокую эффективность предложенной технологии. В случае обработки профилей экспрессии генов данная технология создает условия для реализации пошаговой кластер-бикластер технологии группировки данных на раннем этапе реконструкции генной регуляторной сети.