Показати простий запис статті
dc.contributor.author |
Калюжный, А.Я. |
|
dc.contributor.author |
Семенов, В.Ю. |
|
dc.date.accessioned |
2015-10-16T16:31:39Z |
|
dc.date.available |
2015-10-16T16:31:39Z |
|
dc.date.issued |
2009 |
|
dc.identifier.citation |
Метод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями / А.Я. Калюжный, В.Ю. Семенов // Акустичний вісник — 2009. —Т. 12, № 2. — С. 31-38. — Бібліогр.: 10 назв. — рос. |
uk_UA |
dc.identifier.issn |
1028-7507 |
|
dc.identifier.uri |
http://dspace.nbuv.gov.ua/handle/123456789/87277 |
|
dc.description.abstract |
В статье предложен метод автоматической классификации речевых фрагментов по признаку "мужчина/женщина" и описаны основные этапы его алгоритмической реализации. Метод основан на моделировании плотности распределения вектора акустических признаков голоса взвешенной суммой нескольких гауссовских распределений (метод гауссовых смесей). Каждый из членов GMM соответствует некоторому подклассу множества акустических параметров голосового сигнала. В качестве вектора акустических признаков была выбрана совокупность кепстральных RASTA-PLP коэффициентов, дополненных периодом основного тона. Обучение гауссовых смесей для мужских и женских голосов проводилось по методу expectation-maximization с инициализацией согласно алгоритму K-средних. Исследована зависимость процента ошибок классификации от типа ковариационных матриц GMM и их порядков. В различных экспериментах предложенный метод показал достаточно малую вероятность ошибки классификации (от 9 до 0%). Сделан вывод о вторичности порядка и типа GMM по сравнению с необходимостью разнообразного представления дикторов в обучающей базе речевых сигналов. |
uk_UA |
dc.description.abstract |
В статті запропоновано метод автоматичної класифікації мовних фрагментів за ознакою "чоловік/жінка" та описані основні етапи його алгоритмічної реалізації. Метод заснований на моделюванні щільності розподілу вектора акустичних ознак голосу зваженою сумою декількох гаусівських розподілів (метод гаусових сумішей, GMM). При цьому кожний член GMM відповідає деякому підкласу множини акустичних параметрів голосового сигналу. За вектор акустичних ознак було обрано сукупність кепстральних RASTA-PLP коефіцієнтів, доповнених періодом основного тону. Навчання гаусових сумішей для чоловічих та жіночих голосів виконувалось за методом expectation-maximization з ініціалізацією згідно алгоритму K-середніх. Досліджено залежність процента помилок класифікації від типу коваріаційних матриць GMM та їхніх порядків. У різних експериментах запропонований метод показав достатньо малу ймовірність помилки класифікації (від 9 до 0%). Зроблено висновок щодо другорядності порядку та типу GMM у порівнянні з необхідністю різноманітного представлення дикторів у навчальній базі мовних сигналів. |
uk_UA |
dc.description.abstract |
The method for automatic speaker's gender classification has been proposed and its basic algorithmic stages have been described. The method is based on modeling of voice acoustic parameters distribution by a weighted sum of several Gaussian distributions (Gaussian mixture modeling, GMM). In doing so, every component of the GMM corresponds to a certain subset of voice acoustic parameters. The set of cepstral RASTA-PLP coefficients extended by the period of the basic tone has been selected as the vector of acoustic features. The male and female GMMs were trained by the expectation-maximization method initialized according to the K-means algorithm. The dependence of classification errors on the GMM types and their orders has been investigated. In different experiments, the proposed method has shown low probability of classification errors (from 9 to 0%). This fact allows the conclusion about minor importance of the GMM order and type in comparison with a necessity of the diverse presenting of the speakers in the training data set. |
uk_UA |
dc.language.iso |
ru |
uk_UA |
dc.publisher |
Інститут гідромеханіки НАН України |
uk_UA |
dc.relation.ispartof |
Акустичний вісник |
|
dc.title |
Метод идентификации пола диктора на основе моделирования акустических параметров голоса гауссовыми смесями |
uk_UA |
dc.title.alternative |
A method for speaker's gender identification on the basis of the Gaussian mixture modeling of voice acoustic parameters |
uk_UA |
dc.type |
Article |
uk_UA |
dc.status |
published earlier |
uk_UA |
dc.identifier.udc |
534.78+621.391 |
|
Файли у цій статті
Ця стаття з'являється у наступних колекціях
Показати простий запис статті