Extracción de características de la voz utilizando el pitch para sistemas de verificación automática del locutor

dc.contributor.advisorDíaz Amador, Roberto
dc.contributor.authorArmas Toledo, Ariel de
dc.coverage.spatialSanta Claraen_US
dc.date.accessioned2018-03-31T18:42:27Z
dc.date.available2018-03-31T18:42:27Z
dc.date.issued2011-07-04
dc.description.abstractLos Sistemas de Control de Acceso, la Autentificación de Clientes y otros sistemas biométricos constituyen una aplicación de los Sistemas de Verificación del Locutor. La mayoría de estas aplicaciones requieren de altos niveles de confiabilidad, por esta razón se han logrado introducir técnicas que permitan un buen funcionamiento de estos sistemas. Sin embargo se dedican grandes esfuerzos en la actualidad, orientados a lograr una mayor fiabilidad de estos sistemas, constituyendo un campo muy amplio de investigación. Dentro de los problemas aún sin resolver, se encuentra lograr obtener rasgos de la voz, que permitan discriminar mejor entre todos los locutores de un sistema. En este trabajo se implementan los métodos de extracción de características PHCC (Pitch Harmonics Cepstral Coefficients), y el PSMFCC (Pitch Synchronous Mel-Frequency Cepstral Coefficients) y se propone el método PSPHCC (Pitch Synchronous Harmonics Cepstral Coefficients). El funcionamiento de los tres métodos se verificó con un sistema basado en Modelos Ocultos de Markov. Con los métodos implementados se obtienen 96% de exactitud del sistema y un EER de 1.43 %, contra un 93% y un EER 2.18% por parte del algoritmo MFCC (Mel Frequency Cepstral Coefficients) tradicional. Como resultado final se desarrolló el software PHaSe-SAEC, que permite la extracción de las características del locutor por los métodos descritos en este trabajo y la obtención de los mismos en ficheros compatibles con el sistema HTK y el sistema Weka.en_US
dc.description.abstractAccess Control Systems, Client Authentication and other biometric systems are an application of the Speaker Verification. Most of these applications require high levels of reliability, for this reason they have managed to introduce techniques to smooth functioning of these systems. However devoted great efforts currently aimed at achieving greater reliability of these systems, providing a wide field of research. Among the problems still unsolved, is able to obtain the voice features that allow better discrimination between all speakers in a system. In this paper we implement the feature extraction methods PHCC (Pitch Harmonics Cepstral Coefficients) and PSMFCC (Pitch Synchronous Mel-Frequency Cepstral Coefficients) and the method proposed PSPHCC (Pitch Synchronous Harmonics Cepstral Coefficients). The operation of the three methods was verified with a system based on Hidden Markov Models. With the methods implemented are obtained 96% accuracy of the system and an EER of 1.43%, against 93% and 2.18% EER by MFCC (Mel Frequency Cepstral Coefficients) traditional algorithm. The end result is a software PHaSE-SAEC, which allows the extraction of characteristic of the speaker by the methods described in this work and getting them into files compatible with the HTK and the WEKA system.en_US
dc.description.sponsorshipFacultad de Matemática, Física y Computación. Departamento de Ciencias de la Computaciónen_US
dc.description.statusnon-publisheden_US
dc.identifier.urihttps://dspace.uclv.edu.cu/handle/123456789/9160
dc.language.isoesen_US
dc.publisherUniversidad Central “Marta Abreu” de Las Villasen_US
dc.rightsEste documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 Licenseen_US
dc.subjectVerificación Automática del Locutoren_US
dc.subjectProcesamiento Digital de Vozen_US
dc.subjectSistemas Biométricosen_US
dc.subjectModelos Ocultos de Markoven_US
dc.subjectSoftware PHaSe-SAECen_US
dc.subject.otherSistemas de Procesamiento de Vozen_US
dc.subject.otherDesarrollo de Algoritmosen_US
dc.titleExtracción de características de la voz utilizando el pitch para sistemas de verificación automática del locutoren_US
dc.typeThesisen_US
dc.type.thesisbacheloren_US

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
tesisArielFinal.pdf
Tamaño:
1.13 MB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
3.33 KB
Formato:
Item-specific license agreed upon to submission
Descripción: