В работе предложен новый алгоритм множественного выравнивания биологических последовательностей. В этом алгоритме вначале на основе метода DotHelix строятся консенсусные участки в данном наборе последовательностей разной толщины и разной степени сходства, а затем из этих консенсусов составляются цепочки, согласованные с порядком букв в последовательностях, и такие цепочки являются каркасами выравниваний. На основе алгоритма на языке Си написана программа H-Align изпакета GenBee. Рассмотрен модельный пример, иллюстрирующий эффективность предложенного алгоритма.
У роботі запропоновано новий алгоритм множинного вирівнювання біологічних послідовностей. В ньому спочатку на основі методу DotHelix будуються консенсусні ділянки в даному наборі послідовностей різної товщини і ступеня схожості, а потім із цих консенсусів складаються ланцюжки, погоджені з порядком букв в послідовностях, і такі ланцюжки є каркасами вирівнювання. На основі алгоритму на мові Ci написана програма H-Align з пакету GenBee. Розглянутий модельний приклад ілюструє ефективність запропонованого алгоритму.
Summary Generalization of the multiple alignment is central to the entire field of biological sequence analysis. The algorithm of alignment by program H-align incorporated in GenBee package is a result of development of the local similarity search principle. It has two stages: 1) generalization of all the conservative regions (they cannot be present in all the aligning sequences). 2) optimal arrangement of these regions using two criteria — maximization of the total power of the conservative regions and minimization of the total number of spaces. This algorithm has at least two advantages over traditional algorithms (such as Needleman-Wunsch's one) : no penalty for insertion / deletion; not subsequent pair aligning procedure. The efficiency of the algorithm is shown at model example.