Наукова електронна бібліотека
періодичних видань НАН України

Метод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями

Репозиторій DSpace/Manakin

Показати простий запис статті

dc.contributor.author Калюжный, А.Я.
dc.contributor.author Семенов, В.Ю.
dc.date.accessioned 2015-10-16T16:31:39Z
dc.date.available 2015-10-16T16:31:39Z
dc.date.issued 2009
dc.identifier.citation Метод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями / А.Я. Калюжный, В.Ю. Семенов // Акустичний вісник — 2009. —Т. 12, № 2. — С. 31-38. — Бібліогр.: 10 назв. — рос. uk_UA
dc.identifier.issn 1028-7507
dc.identifier.uri http://dspace.nbuv.gov.ua/handle/123456789/87277
dc.description.abstract В статье предложен метод автоматической классификации речевых фрагментов по признаку "мужчина/женщина" и описаны основные этапы его алгоритмической реализации. Метод основан на моделировании плотности распределения вектора акустических признаков голоса взвешенной суммой нескольких гауссовских распределений (метод гауссовых смесей). Каждый из членов GMM соответствует некоторому подклассу множества акустических параметров голосового сигнала. В качестве вектора акустических признаков была выбрана совокупность кепстральных RASTA-PLP коэффициентов, дополненных периодом основного тона. Обучение гауссовых смесей для мужских и женских голосов проводилось по методу expectation-maximization с инициализацией согласно алгоритму K-средних. Исследована зависимость процента ошибок классификации от типа ковариационных матриц GMM и их порядков. В различных экспериментах предложенный метод показал достаточно малую вероятность ошибки классификации (от 9 до 0%). Сделан вывод о вторичности порядка и типа GMM по сравнению с необходимостью разнообразного представления дикторов в обучающей базе речевых сигналов. uk_UA
dc.description.abstract В статті запропоновано метод автоматичної класифікації мовних фрагментів за ознакою "чоловік/жінка" та описані основні етапи його алгоритмічної реалізації. Метод заснований на моделюванні щільності розподілу вектора акустичних ознак голосу зваженою сумою декількох гаусівських розподілів (метод гаусових сумішей, GMM). При цьому кожний член GMM відповідає деякому підкласу множини акустичних параметрів голосового сигналу. За вектор акустичних ознак було обрано сукупність кепстральних RASTA-PLP коефіцієнтів, доповнених періодом основного тону. Навчання гаусових сумішей для чоловічих та жіночих голосів виконувалось за методом expectation-maximization з ініціалізацією згідно алгоритму K-середніх. Досліджено залежність процента помилок класифікації від типу коваріаційних матриць GMM та їхніх порядків. У різних експериментах запропонований метод показав достатньо малу ймовірність помилки класифікації (від 9 до 0%). Зроблено висновок щодо другорядності порядку та типу GMM у порівнянні з необхідністю різноманітного представлення дикторів у навчальній базі мовних сигналів. uk_UA
dc.description.abstract The method for automatic speaker's gender classification has been proposed and its basic algorithmic stages have been described. The method is based on modeling of voice acoustic parameters distribution by a weighted sum of several Gaussian distributions (Gaussian mixture modeling, GMM). In doing so, every component of the GMM corresponds to a certain subset of voice acoustic parameters. The set of cepstral RASTA-PLP coefficients extended by the period of the basic tone has been selected as the vector of acoustic features. The male and female GMMs were trained by the expectation-maximization method initialized according to the K-means algorithm. The dependence of classification errors on the GMM types and their orders has been investigated. In different experiments, the proposed method has shown low probability of classification errors (from 9 to 0%). This fact allows the conclusion about minor importance of the GMM order and type in comparison with a necessity of the diverse presenting of the speakers in the training data set. uk_UA
dc.language.iso ru uk_UA
dc.publisher Інститут гідромеханіки НАН України uk_UA
dc.relation.ispartof Акустичний вісник
dc.title Метод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями uk_UA
dc.title.alternative A method for speaker's gender identification on the basis of the Gaussian mixture modeling of voice acoustic parameters uk_UA
dc.type Article uk_UA
dc.status published earlier uk_UA
dc.identifier.udc 534.78+621.391


Файли у цій статті

Ця стаття з'являється у наступних колекціях

Показати простий запис статті

Пошук


Розширений пошук

Перегляд

Мій обліковий запис