Розглянуто питання сегментації мовлення при створенні баз мовленнєвих даних. Запропоновано використовувати для попередньої сегментації алгоритм Вітербі у поєднанні з методами розпізнавання. Для підвищення точності визначення границь сегментів запропоновано використовувати статистичну інформацію про тривалість фонем. Отримані результати може бути використано при розробці україномовної бази мовленнєвих даних.
Рассмотрен вопрос сегментации речи при создании баз речевых данных. Предложено использовать для предварительной сегментации алгоритм Витерби в соединении с методами распознавания. Для повышения точности определения границ сегментов предложено использовать статистическую информацию о длительности фонем. Полученные результаты могут быть использованы при разработке украиноязычной базы речевых данных.
The problem of speech segmentation in creating databases of speech data is considered. It is proposed to use the Viterbi algorithm in conjunction with the methods of recognition for presegmentation of speech data. To improve the accuracy of the segment boundaries is offered to use statistical information about the duration of phonemes. The obtained results can be used for development of Ukrainian-language speech data base.