Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10819/6827
Título : Clasificación de escenas acústicas a través de descriptores de audio y máquinas de aprendizaje. Aplicación en escenas de Medellín
Autor: Chica Osorio, Carlos Andrés
Yurgaky Valoyes, Dudley
Asesor : Ochoa Villegas, Jonathan
Palabras clave : Grabaciones en campo;Aprendizaje automático;Descriptores de audio;Eficiencia;Field recording;Machine Learning;Audio predictors;Accuracy
Fecha de publicación : 2019
Citación : [1] C. A. Chica Osorio, y D. Yurgaky Valoyes, “Clasificación de escenas acústicas a través de descriptores de audio y máquinas de aprendizaje. Aplicación en escenas de Medellín”, Tesis Ingeniería de Sonido, Universidad de San Buenaventura Medellín, Facultad de Ingenierías, 2019
Resumen : los últimos años, han aparecido métodos de aprendizaje automático que permiten obtener modelos para el análisis y clasificación de señales de audio (etiquetadas), como las máquinas de vectores de soporte, Ensemble Classifier, entre otros. Estos métodos presentan un problema al ser poco comprensibles en su funcionamiento interno, ya que, no muestran al usuario una estructura explicativa de como realizan las predicciones y que estas sean entendibles. Vale aclarar que los modelos son precisos, pero no son presentados adecuadamente. Debido a que no existe un banco de sonidos de las escenas acústicas de la ciudad, fue necesario realizar grabaciones en campo de dichas escenas en exteriores. Se emplearon descriptores de audio tales como MFCC y Chroma Vector, para la identificación de las escenas acústicas en conjunto con dos algoritmos SVM y uno Ensemble Classifier. El producto fue una tasa de eficiencia del 72,22% para los casos de las máquinas SVM (Medium Gaussian y Quadratic), los cuales son satisfactorios. Por otro lado, la máquina de aprendizaje basada en Ensemble Classifier (Boosted Tree) tuvo una tasa de eficiencia del 55,55%, siendo esta una máquina de bajo rendimiento.
Descripción : In recent years, automatic learning methods have been paired to obtain models for the analysis and classification of audio signals, such as the support vector machines, Ensemble Classifier, among others. These methods present a problem because they are not very understandable in their internal functioning, since they do not show the user an explanatory structure of how predictions are made and that they are understandable. It is worth mentioning that the models are accurate, but they are not presented properly. There is not a sound bank of the acoustic scenes of the city, it was necessary to record these outside scenes in the field. Audio descriptors such as MFCC and Chroma Vector were used to identify the acoustic scenes together with two SVM algorithms and one Ensemble Classifier. The result was an efficiency rate of 72.22% for the cases of SVM machines (Medium Gaussian and Quadratic), which are satisfactory. On the other hand, the learning machine based on Ensemble Classifier (Boosted Tree) had an Accuracy rate of 55.55%, this being a low performance machine.
URI : http://hdl.handle.net/10819/6827
Aparece en las colecciones: Ingenierías USB Medellín

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
Clasificacion_Escenas_Acusticas_Chica_2019.pdf2.94 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.