У статті пропонується підхід до структурно-віземного аналізу візуальної складової мовленнєвого процесу
у відеопотоці. Підхід дозволяє отримувати інформацію про кількісну присутність візем з заданого
базового набору на кадрі анімації при обчисленні параметрів оптимального стану тривимірної моделі
голови людини. Проведені експериментальні дослідження показали можливість використання запропонованої
моделі для ідентифікації базових станів губ при артикуляції на тестовій вибірці відеофрагментів 185 слів
української мови.
An approach to the structural analysis of visemes of visual component of speech process in the video stream
is proposed in this paper. The approach allows to compute numeric information about presence of a viseme in
an animation frame chosen from the given base set by calculating the optimal parameters of state for threedimensional
model of a human head. Experimental studies have shown the efficiency of using the proposed
model to identify the basic states of lip articulation by test video samples with 185 words of the Ukrainian
language.