In English
Accurate estimation of global horizontal irradiance (GHI) is essential for solar energy resource assessment, particularly in regions with limited ground-based measurements.
This study evaluates the performance of three machine learning models—Simple Linear Regression (SLR), Extreme Gradient Boosting (XGB), and Multilayer Perceptron (MLP)—for the site adaptation of satellite-derived GHI data in five locations in Northwestern Argentina. Two satellite products, CAMS and LSA-SAF, were used as input data. The models were assessed using standard error metrics (MBE, MAE, RMSE), and their residual patterns were analyzed. Results show that LSA-SAF data led to lower errors compared to CAMS, especially in highaltitude sites. While complex models like MLP and XGB marginally improved accuracy in some cases, SLR offered comparable results with higher robustness.
The analysis also identified systematic biases and discretization effects in tree-based models. These findings suggest that, under current data conditions, simpler models may offer reliable performance. Enhancing input data quality and incorporating additional meteorological features may yield greater improvements than increasing model complexity.
In Spanish
La estimación precisa de la irradiancia global horizontal (GHI) es fundamental para evaluar el recurso solar, especialmente en regiones con escasas mediciones terrestres. Este estudio evalúa el desempeño de tres modelos de aprendizaje automático—Regresión Lineal Simple (SLR), Extreme Gradient Boosting (XGB) y Perceptrón Multicapa (MLP)—para la adaptación al sitio de datos de GHI obtenidos por satélite en cinco ubicaciones del noroeste argentino. Se utilizaron dos productos satelitales, CAMS y LSA-SAF, como datos de entrada. Los modelos se evaluaron mediante métricas estándar (MBE, MAE, RMSE) y análisis de residuos. Los resultados indican que los datos de LSA-SAF generaron errores menores, especialmente en sitios de gran altitud. Aunque modelos complejos como MLP y XGB mejoraron levemente la precisión en algunos casos, SLR logró resultados comparables con mayor robustez. El análisis también evidenció sesgos sistemáticos y efectos de discretización en modelos basados enárboles. Estos hallazgos sugieren que, dadas las condiciones actuales de los datos, modelos simples pueden ofrecer un desempeño confiable.
Mejoras significativas podrían lograrse mediante la incorporación de variables meteorológicas adicionales y datos de mayor calidad.