Статья посвящена разработке методики предобработки данных при проведении секвенциального анализа. Выделены и экспериментально подтверждены проблемы предобработки в данной области: зашумленность данных, избыточность алфавита, возможное наличие циклических повторов. Предложены способы их решения. Эффективность и результативность предложенных подходов показана на экспериментах.
Статтю присвячено розробці методики попередньої обробки даних задля проведення секвенційного аналізу. Виділено та експериментально підтверджено проблеми попередньої обробки у даній галузі: зашумленість даних, надлишковість алфавіту, можлива наявність циклічних повторів. Запропоновано способи їхнього вирішення. Ефективність і результативність запропонованих методів показано на дослідах.
A data preprocessing technique for sequential analysis is described. It is outlined and experimentally demonstrated the problems of this field of data mining: noisy data, alphabet redundancy, eventual presence of cyclic repeats. It is proposed the solution of these problems, effectivity of which is shown experimentally.