En español
La utilización de algoritmos y técnicas de aprendizaje automático dentro del ámbito de la medicina ha demostrado ser de gran utilidad en tareas de asistencia al diagnóstico. Al mismo tiempo, durante los últimos años, se han dado a conocer problemáticas importantes que afectan el funcionamiento de estos métodos en subpoblaciones específicas, presentando un rendimiento dispar en determinados grupos demográficos. Este rendimiento dispar suele estar asociado a la subrepresentación de dichas poblaciones en los datos utilizados durante el entrenamiento, resultando en modelos sesgados. Este es un trabajo preliminar que busca explorar la existencia de sesgos en la clasificación de apnea a partir de oximetría de pulso considerando diferentes grupos étnicos. Para ello, se utiliza una base de datos con información étnica de pacientes y un algoritmo para detectar trastornos de sueño como apneas o hipopneas. Para la detección de dichos eventos, se emplea sólo la señal de saturación periférica de oxígeno en sangre (SpO2) junto al algoritmo basado en aprendizaje de diccionarios DAS-KSVD. Los experimentos consisten en analizar la base de datos de polisomnografía MESA, que contiene cuatro grupos étnicos, utilizando la señal de SpO2 para el aprendizaje de diccionarios con los que se mejora el proceso de detección de patologías.
En inglés
The use of machine learning algotithms and techniques within the field of medicine has proven to be very useful in diagnostic assistance tasks. At the same time, in recent years, important issues have been revealed that affect the performance of these methods in specific subpopulations, presenting uneven performance in certain demographic groups. This uneven performance is often associated with the underrepresentation of these populations in the data used during training, resulting in biased models. This is a preliminary work that seeks to explore the existence of biases in the classification of apnea from pulse oximetry considering different ethnic groups. To do this, a database with ethnic information on patients and an algorithm to detect sleep disorders such as apnea or hypopnea are used. For the detection of such events, only the peripheral blood oxygen saturation (SpO2) signal is used together with the algorithm based on DAS-KSVD dictionary learning. The experiments consist of analyzing the MESA polysomnography database, which contains four ethnic groups, using the SpO2 signal for dictionary learning that improves the pathology detection process.