En inglés
Thanks to the internet of things (IoT) and cyber physical systems (CPS), we face an incremental growth of the available data, either on the internet or in private databases. This resulted in data mining techniques becoming an essential piece in the information retrieval process. Moreover, trends like the industry 4.0 encourages its usage to support data driven decisions, for instance. Formal Concept Analysis (FCA) is one of the most used techniques in the unsupervised data mining field due to its inherent ability to find patterns between concepts. As a consequence, many applications need the use of fast algorithms to perform the calculations to retrieve either the lattice or the association rules related with the data at their disposal. Due to this, scientists often rely on manually crafted benchmarks to compare how certain algorithms perform under different circumstances. In this work, we propose the architecture of a software to generalize these benchmarks independently of the algorithms, to be integrated in the open source data analysis software Orange3.
En inglés
Gracias al internet de las cosas (IoT) y a los sistemas ciberfísicos (CPS), nos enfrentamos a un crecimiento incremental de los datos disponibles, ya sea en internet o en bases de datos privadas. Esto ha hecho que las técnicas de minería de datos se conviertan en una pieza esencial en el proceso de recuperación de información. Además, tendencias como la industria 4.0 fomentan su uso para respaldar, por ejemplo, las decisiones basadas en datos. El análisis formal de conceptos (FCA) es una de las técnicas más utilizadas en el campo de la minería de datos no supervisada debido a su capacidad inherente para encontrar patrones entre conceptos. Como consecuencia, muchas aplicaciones necesitan el uso de algoritmos rápidos para realizar los cálculos y recuperar la red o las reglas de asociación relacionadas con los datos de que disponen. Debido a esto, los científicos a menudo confían en benchmarks elaborados manualmente para comparar el rendimiento de ciertos algoritmos en diferentes circunstancias. En este trabajo, proponemos la arquitectura de un software para generalizar estos benchmarks independientemente de los algoritmos, que se integrará en el software de análisis de datos de código abierto Orange3.