En español
En este trabajo se investiga la implementación de redes neuronales profundas en la clasificación de sonidos respiratorios, una tarea determinante para el diagnóstico de enfermedades pulmonares. Para esta labor, se emplea la arquitectura VGG-16, reconocida por su eficacia en la clasificación de imágenes, la cual ha sido adaptada para procesar datos de audio. Se realizaron la recopilación y preprocesamiento del conjunto de datos de sonidos respiratorios, utilizando coeficientes cepstrales de frecuencia de Mel (MFCC´s) como entrada de la red. Los resultados obtenidos revelan un rendimiento significativo, con una precisión del 79% en la clasificación de sonidos respiratorios. Este resultado resalta el potencial de las redes neuronales convolucionales pre entrenadas en el campo médico. Sin embargo, persisten desafíos por superar, como la necesidad de conjuntos de datos más amplios y una comprensión más profunda de los resultados para su implementación clínica efectiva.
En inglés
This study investigates the implementation of deep neural networks in the classification of respiratory sounds, a crucial task for diagnosing pulmonary diseases. For this purpose, the VGG-16 architecture, renowned for its effectiveness in image classification, was adapted to process audio data. The respiratory sound dataset was collected and preprocessed using Mel-frequency cepstral coefficients (MFCCs) as input to the network. The results reveal significant performance, achieving 79% accuracy in classifying respiratory sounds. This outcome highlights the potential of pre-trained convolutional neural networks in the medical field. However, challenges remain, such as the need for larger datasets and a deeper understanding of the results for effective clinical implementation.