En español
Actualmente las organizaciones disponen de conjuntos de datos cada vez más grandes y complejos. Para encontrar la información requerida, descubrir patrones novedosos y realizar una categorización se utilizan técnicas de descubrimiento de conocimiento en bases de datos (KDD) y data mining. En particular, las bases de datos hospitalarias tienen un gran potencial para explorar patrones ocultos en conjuntos de datos de dominio médico debido a su naturaleza voluminosa, heterogénea y distribuida. Estos patrones se pueden utilizar para el diagnóstico clínico y gestión de recursos, entre otros. Dada la situación de pandemia que se ha vivido recientemente, el descubrimiento de conocimiento para la eficiencia en la toma de decisiones se vuelve imprescindible. Este trabajo presenta la utilización de técnicas combinadas de clustering k-means, k-prototypes y mapas auto-organizados SOM del paradigma competitivo no supervisado, sobre la base de datos pública con casos COVID-19 a nivel nacional, del Ministerio de Salud de Argentina. Los resultados de k-prototypes permitieron obtener un panorama general de la distribución de las muestras, mientras que los SOM, con medidas de evaluación del modelo de gran calidad, posibilitaron un análisis más completo, profundo y visual. Adicionalmente, se presenta un software para facilitar a los expertos el estudio de resultados.
En inglés
Organizations today have increasingly large and complex data sets. Knowledge discovery in databases (KDD) and data mining techniques are used to find the required information, discover novel patterns and perform categorization. In particular, hospital databases have a great potential to explore hidden patterns in medical domain datasets due to their voluminous, heterogeneous and distributed nature. These patterns can be used for clinical diagnosis and resource management, among others. Given the recent pandemic situation, knowledge discovery for efficient decision making becomes imperative. This paper presents the use of combined k-means clustering techniques, k-prototypes and SOM self-organizing maps of the unsupervised competitive paradigm, on the public database with COVID-19 cases at the national level, from the Ministry of Health of Argentina. The results of k-prototypes allowed obtaining an overview of the distribution of samples, while the SOM, with high quality model evaluation measures, enabled a more complete, in-depth and visual analysis. In addition, software is presented to facilitate the study of results by experts.