En los últimos años, la severidad de los incendios forestales ha llegado a niveles preocupantes tanto a nivel internacional como nacional. No obstante, gracias al avance de la tecnología es posible predecir la ocurrencia y magnitud de los mismos a través de modelos de Machine Learning especialmente desarrollados para tal fin. Para lograr este objetivo, el presente trabajo describe el desarrollo de un pipeline de datos automatizado en el lenguaje de programación Python que genera el dataset de incendios forestales específico al Partido de Pinamar, permitiendo así el posterior entrenamiento de modelos predictivos de incendios. El mismo es a su vez configurable para reunir datos meteorológicos, topográficos y de combustible de otras áreas geográficas.