, -- de ----- del 2021 Título: “Predicción de generación fotovoltaica mediante técnicas de inteligencia artificial con deep learning”. Autor: Alejandro González Isidor Tutores: Dra. Lesyani Leon Viltres M.sc. Reinier Herrera Casanova Departamento de Electroenergética , junio 2018 Title: Prediction of photovoltaic generation using artificial intelligence techniques with deep learning Author: Alejandro González Isidor Thesis Director: Dra. Lesyani Leon Viltres M.sc. Reinier Herrera Casanova , … …, 2021 Electroenergetic Department Este documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas, y se encuentra depositado en los fondos de la Biblioteca Universitaria “Chiqui Gómez Lubian” subordinada a la Dirección de Información Científico Técnica de la mencionada casa de altos estudios. Se autoriza su utilización bajo la licencia siguiente: Atribución- No Comercial- Compartir Igual Para cualquier información contacte con: Dirección de Información Científico Técnica. Universidad Central “Marta Abreu” de Las Villas. Carretera a Camajuaní. Km 5½. Santa Clara. Villa Clara. Cuba. CP. 54 830 Teléfonos.: +53 01 42281503-1419 PENSAMIENTO “Nunca consideres el estudio como una obligación, sino como la oportunidad para penetrar en el bello y maravilloso mundo del saber.” Albert Einstein (1879-1955) DEDICATORIA A mis padres y mi hermano, sin ellos nada de esto hubiese sido posible por todo lo que pasamos juntos y por el apoyo incondicional que me dieron. Y en especial a los ya no están conmigo mi abuela Juana y mi tío Felin. AGRADECIMIENTOS A mis tutores Reinier y Lesyani desde el primer momento me brindaron toda su ayuda, a mis padres por estar ahí cada día apoyándome. Gracias a los magníficos Profesores que tuve en esto 5 años. A mis compañeros por vivir los mejores años de mi vida junto a ellos, por saber estar en las buenas y en las malas y brindarme su ayuda cada día. En fin, a todas aquellas personas que me dieron su mano que los tengo en mente, pero son tantos que no podría mencionarlos a todos. Gracias a todos. RESUMEN La energía solar constituye actualmente una fuente de energía muy utilizada por el hombre. Sin embargo, presenta un comportamiento que en ocasiones resulta extremadamente difícil de prever. Debido a esto deben realizarse varios análisis con el fin de determinar la expectativa real de generación de los parques solares fotovoltaicos. La predicción de la energía que se produce en un parque solar fotovoltaico presenta una gran cantidad de aplicaciones, sobre todo en lo referente a la planificación y operación del sistema eléctrico. En el siguiente trabajo se implementa un algoritmo de predicción de generación fotovoltaica para el parque solar fotovoltaico de la UCLV basado en técnicas de inteligencia artificial con deep learning con la utilización del software MATLAB, con el objetivo de realizar la predicción de la energía eléctrica de dicho parque con el menor error posible. Los resultados que se obtienen muestran que las predicciones realizadas para diferentes períodos de tiempo y épocas del año son correctas, lo que demuestra la efectividad del método de predicción utilizado. Palabras Clave: Parque Solar Fotovoltaico; Redes Neuronales Artificiales; Predicción. ÍNDICE INTRODUCCIÓN .............................................................................................................. 1 CAPÍTULO 1. ESTADO ACTUAL DE LA ENERGÍA SOLAR FOTOVOLTAICA Y LOS MÉTODOS DE PREDICCIÓN .......................................................................................... 4 1.1 Comportamiento de la generación fotovoltaica en la actualidad a nivel mundial y en Cuba ........................................................................................................................ 4 1.2 Principales variables meteorológicas que intervienen en la predicción de generación fotovoltaica ................................................................................................. 5 1.3 Predicción de la generación de energía en sistemas fotovoltaico ....................... 9 1.3.1 Ventajas de la predicción ............................................................................. 9 1.3.2 Horizontes de predicción ............................................................................10 1.3.3 Métricas para determinar la incertidumbre en la predicción ........................11 1.4 Principales modelos de predicción que se utilizan actualmente .........................12 1.5 Consideraciones finales del capitulo ..................................................................13 CAPÍTULO II. PROGRAMA PARA LA PREDICCIÓN DE LA GENERACIÓN DE ENERGÍA MEDIANTE TÉCNICAS DE INTELIGENCIA ARTIFICIAL CON DEEP LEARNING..........14 2.1 Principales características de las redes neuronales artificiales y deep learning......14 2.2 Redes neuronales recurrentes ...............................................................................16 2.3 Redes neuronales recurrentes del tipo LSTM .........................................................17 2.4 Metodología utilizada para la implementación y validación del modelo de predicción .....................................................................................................................................18 2.5 Consideraciones finales del capítulo ......................................................................22 CAPÍTULO III. RESULTADOS DE LAS PREDICCIONES REALIZADAS .........................23 3.1 Descripción del parque solar fotovoltaico analizado ...............................................23 3.2 Resultados obtenidos para el período de tiempo analizado ....................................24 3.3 Consideraciones finales del capítulo ......................................................................29 CONCLUSIONES ............................................................................................................30 RECOMENDACIONES ....................................................................................................31 BIBLIOGRAFIA ................................................................................................................32 1 INTRODUCCIÓN Actualmente el planeta muestra un incremento de las necesidades energéticas, impulsadas por el desarrollo tecnológico y económico de la sociedad. Uno de los grandes problemas de la humanidad es su dependencia de los combustibles fósiles, ya que provocan un fuerte impacto ambiental, además de diversos cambios en el ámbito económico. El reto está en conseguir que las energías alternativas y renovables sustituyan paulatinamente a los combustibles fósiles tradicionales. La principal ventaja de las energías renovables es la de su menor impacto ambiental, ya que, reducen el número de contaminantes a la atmósfera, además de su distribución territorial menos concentrada. Son fuentes continuas e inagotables de energía, por lo que son la alternativa del futuro. Los sistemas fotovoltaicos conectados a las redes eléctricas constituyen una de las tecnologías de la generación distribuida de mayor impacto y crecimiento en los últimos años. Estos sistemas en los circuitos de distribución ofrecen beneficios ya que reducen las pérdidas en las redes e incrementan la confiabilidad y la calidad del suministro de energía eléctrica. Uno de los factores fundamentales que incide en las fluctuaciones de la tensión es la aparición de los huecos de generación (intervalos de tiempo donde la generación disminuye debido principalmente a variables atmosféricas), ocasionados por la nubosidad, este y otros problemas todavía no se resuelven satisfactoriamente con las fuentes de energía renovables, especialmente con altos niveles de generación. Bajo estos conceptos varios análisis tienen que ser realizados con el fin de determinar la expectativa real de generación de las plantas fotovoltaicas. Uno de los motivos de la importancia que adquieren los diferentes modelos de predicción fotovoltaica es que la capacidad anual de energía solar fotovoltaica en el mundo se ha incrementado exponencialmente en los últimos diez años. Hoy en día, se trata del tipo de energía más barata en un gran número de países debido a que se han abaratado sustancialmente los costos de producción de módulos fotovoltaicos [1] La predicción de la energía producida por un parque fotovoltaico presenta una gran cantidad de aplicaciones tanto para la planificación como para la instalación de plantas fotovoltaicas. En este sentido, la aplicación de algoritmos de predicción que dan una aproximación de la generación prevista, representa un reto para los ingenieros eléctricos. 2 En algunos trabajos [2] se realiza la predicción de la generación fotovoltaica mediante técnicas estadísticas y modelos de regresión. Otros trabajos [3] y [4] emplean modelos ARIMA para realizar dicha predicción. Un gran número de publicaciones[5-10] utilizan las técnicas de inteligencia artificial para este fin, fundamentalmente las redes neuronales artificiales basadas en MLP (perceptrón multicapa). Cuba actualmente cuenta con 72 parque solares fotovoltaicos (PSF) sincronizados al SEN y se prevé que para el año 2030, las fuentes renovables de energía representen el 24 % de la matriz energética. Por lo que deben incrementarse el número de instalaciones fotovoltaicas en todo el país. El parque solar fotovoltaico de la UCLV, en la provincia de Villa Clara, posee una potencia nominal de 1.1 MW, fue puesto en marcha en el año 2019. Se encuentra ubicado en la zona suroeste de la Facultad de Ingeniería Eléctrica de la Universidad Central "Marta Abreu” de Las Villas, en los 22.4° de latitud norte y los 79.96° de longitud oeste. Se dispone de un amplio grupo de mediciones de las variables siguientes: radiación solar, temperatura ambiente, temperatura de los módulos fotovoltaicos y potencia generada. Por lo tanto, se tienen los elementos necesarios para realizar el estudio en este parque solar fotovoltaico. A partir de todo lo anterior, se plantea como problema de investigación: ¿Cómo predecir la generación de energía eléctrica en el parque solar fotovoltaico de la UCLV? De acuerdo al problema de investigación, se traza como objetivo general: Implementar un algoritmo de predicción de generación fotovoltaica para el parque solar fotovoltaico de la UCLV basado en técnicas de inteligencia artificial con deep learning. Para dar cumplimiento al mismo, se declaran como objetivos específicos: 1. Describir los métodos utilizados para la predicción de la generación de energía en parques fotovoltaicos. 2. Analizar estadísticamente de la base de datos para eliminar valores atípicos. 3. Implementar el modelo de predicción mediante deep learning. 4. Entrenar el modelo a través de los datos disponibles. 5. Realizar la predicción de la generación de energía en el parque solar fotovoltaico en diferentes horizontes de pronóstico. Las tareas científicas que contribuyen al cumplimiento de los objetivos específicos son: 1. Realización de una búsqueda bibliográfica sobre el tema. 2. Análisis de los principales métodos utilizados para la predicción de la generación de energía en parques fotovoltaicos. 3. Recopilación de las mediciones del parque solar fotovoltaico y análisis profundo de las mismas. 3 4. Implementación del modelo de predicción en el software Matlab. 5. Entrenamiento y validación del modelo de predicción. Predicción de la generación de energía en el parque solar fotovoltaico en diferentes horizontes de tiempo y épocas del año. La principal contribución del trabajo radica en el desarrollo de una metodología sencilla pero efectivo para el logro del objetivo propuesto con el mínimo error posible, la cual resulta aplicable en cualquier parque solar fotovoltaico. La estructura del trabajo está compuesta por introducción, tres capítulos, conclusiones, recomendaciones, bibliografía y anexos. El primer capítulo aborda el estado del arte de los diferentes métodos predictivos utilizados a nivel mundial para la predicción de la generación de energía eléctrica en parques solares fotovoltaicos según la literatura internacional, así como los fundamentos de la generación de energía eléctrica mediante el empleo de módulos fotovoltaicos. El segundo capítulo corresponde al desarrollo de la red neuronal artificial mediante MATLAB. Se explica las principales características de las redes neuronales artificiales y deep lerning, así como Redes neuronales recurrentes del tipo LSTM y la metodología utilizada para la implementación y validación del modelo de predicción. En el tercer capítulo se describe el parque solar fotovoltaico escogido para realizar la predicción y los resultados obtenidos para diferentes épocas del año. 4 CAPÍTULO 1. ESTADO ACTUAL DE LA ENERGÍA SOLAR FOTOVOLTAICA Y LOS MÉTODOS DE PREDICCIÓN En este capítulo se analizan los principios y fundamentos de la energía solar fotovoltaica, así como lo correspondiente al estado del arte de los modelos de predicción de la producción eléctrica de los parques solares fotovoltaicos. Se describen algunos de los modelos referidos en artículos publicados en la literatura internacional, con las limitaciones de dichos modelos de predicción y sus resultados. 1.1 Comportamiento de la generación fotovoltaica en la actualidad a nivel mundial y en Cuba La energía solar fotovoltaica actualmente es la segunda fuente de energía renovable más actualizada o implementada en el mundo después de la Eólica. Los sistemas fotovoltaicos tienen una gran ventaja son de fácil instalación y si costo tiende a disminuir debido a que necesitan poco mantenimiento. La capacidad instalada de generación de energía solar fotovoltaica en el mundo para el año 2014 fue de 177 GW, en el año 2015 se incrementaron 50 GW respecto al año anterior logrando un valor histórico de 277 GW y un crecimiento del 25% de esta fuente renovable. Para el año 2030 se proyecta que el mix energético, la energía solar tenga una participación del 16,6%. Entre los años 2000 y 2020 se ha producido un crecimiento exponencial de la producción de energía fotovoltaica, duplicándose aproximadamente cada dos años (figura 1.1) Figura 1.1. Comportamiento de la potencia fotovoltaica instalada a nivel mundial en los últimos 20 años 5 Actualmente en Cuba se satisface alrededor del 96 % de las necesidades energéticas con combustibles fósiles y aproximadamente un 4 % con fuentes renovables. Constituye un programa de gobierno cambiar la matriz energética y producir alrededor de un 24 % de su energía con fuentes renovables para el año 2030. Para alcanzar esta meta, el país está montando parques eólicos y solares fotovoltaicos, así como plantas bioeléctricas [11]. En Cuba se desea para el 2030 que más del 30% de la generación de energía eléctrica provenga de fuentes renovables de energía. Donde se quiere que la energía fotovoltaica posea más del 3% de la producción del país. Con el llamado a acelerar este programa, principalmente en el sector de la energía solar fotovoltaica, se avanza muy rápido porque especialistas, ingenieros y técnicos de la UNE, han alcanzado una alta preparación y ya diseñan, construyen e instalan y operan, con facilidad, los sistemas fotovoltaicos. El país posee una fábrica de paneles solares, que es, la empresa de componentes electrónicos Ernesto Che Guevara de Pinar del Rio, la que produce módulos fotovoltaicos, con una capacidad de 15MW, estos paneles también se empezarán a fabricar para viviendas particulares[12]. 1.2 Principales variables meteorológicas que intervienen en la predicción de generación fotovoltaica Las entradas a los modelos de pronóstico tienen una influencia directa en la predicción. Precisión: Un factor clave para determinar el rendimiento del modelo. Generalmente, La selección de entrada imprudente puede causar errores de pronóstico que aumentan el tiempo, retraso, costo y complejidad computacional. Por lo tanto, la tasa de precisión baja podría aparecer en modelos de pronóstico de alta funcionalidad [13]. Los sistemas son principalmente parámetros meteorológicos: radiación solar, atmósfera temperatura esférica, temperatura del módulo, velocidad del viento y humedad[14],presión barométrica[15],[16],[17]y cambio de aerosoles [18],[19],[20],[21]; todos depende de las condiciones climáticas y la ubicación geográfica. Por eso, la correlación entre la producción fotovoltaica y las entradas meteorológicas varía y puede sea positivo o negativo; fuerte o débil [22]. Uso de datos secundarios: En Ref.[23], la influencia del horizonte de pronóstico en la precisión de PVPF fue estudiado utilizando datos meteorológicos pronosticados numéricamente a través de un vector de soporte regresión (RVS)[24]. comparó dos modelos ST-PVPF: PVPF analítico (APVF) y perceptrón multijugador PVPF (MPVF), con ambos modelos explotar datos meteorológicos pronosticados numéricamente y valores de horas pasadas para la producción de energía eléctrica fotovoltaica. Los valores de RMSE fueron similares; 6 variar pasando del 11,95% al 12,10%, con el horizonte de previsión siendo todo el día horas para predicciones de 24 h por delante. Uso de datos primarios: Alomari y col. [25] utilizó dos años de producción de energía fotovoltaica por hora datos de la planta de energía solar instalada en Applied Science Private University (ASU) en Amman, Jordania. Datos meteorológicos concurrentes medidos donde también se consideró la misma ubicación. Los datos se analizaron mediante ANN optimizado por el Levenberg-Marquardt (LM) y la Regularización Bayesiana algoritmos de aplicación (BR). Los modelos pudieron correlacionar la temperatura, irradiación solar y sincronización con energía fotovoltaica generada para tiempo real predicciones diarias. Finalmente, el modelo PVPF basado en BR ANN fue seleccionados sobre la base del rendimiento. Radiación solar: La irradiación solar es la energía radiante del Sol emitida en la forma de radiación electromagnética. Es directamente proporcional a la cantidad de energía solar que se puede invertir y tiene la mayor correlación con la producción de energía fotovoltaica. De Giorgi y col. [26]propuso un modelo de previsión de la red neuronal artificial (ANN) para analizar la correlaciones de insumos con el rendimiento del modelo. Los errores de pronóstico fueron (NRMSE) 12.57%, 12.60% y 10.91% para los vectores de entrada del histórico Salida fotovoltaica, irradiación solar y temperatura del módulo, respectivamente. Por tanto, el estudio de la correlación entre parámetros meteorológicos y La salida fotovoltaica es esencial para el diseño del modelo de pronóstico. La Fig.1.2 representa el patrón de irradiación solar y salida fotovoltaica para un día específico. El experimento se llevó a cabo en el techo de un instituto. edificio nacional de la Universidad de Malaya (latitud ¼ 03 09 0 N; longitud ¼ 101 41 0 E) Kuala Lumpur, Malasia [14]. La potencia fotovoltaica varió de 7 a. m. a 7 p. m. (desde el amanecer hasta el anochecer) y su magnitud siguió la tendencia de la intensidad de la irradiación solar. A medida que avanzaba el día, la salida fotovoltaica aumentó y alcanzó su punto máximo durante el mediodía; el momento en que la irradiación solar es más intenso. La figura.1.3 muestra una correlación positiva entre la salida de potencia fotovoltaica y irradiación solar para el mismo experimento. El coeficiente de correlación R 2 fue 0,988, lo que indica que la irradiación solar es una entrada más significativa para el pronóstico. Temperatura: La temperatura es una magnitud física que mide la intensidad de calor disponible en una sustancia, objeto o ambiente. Esta entrada parámetro es muy probable o poco https://translate.googleusercontent.com/translate_f#7 https://translate.googleusercontent.com/translate_f#8 7 probable es un coeficiente de generación de energía fotovoltaica. Algunos estudios de investigación indicaron que existe una inadecuada correlación entre la temperatura ambiente y la potencia de salida fotovoltaica. La fig.1.4 representa la correlación entre la temperatura atmosférica y producción fotovoltaica para el mismo trabajo de investigación. El coeficiente de correlación R 2 es menos significativo en 0.3776. Los investigadores también encontraron que no había correlación entre la temperatura atmosférica y la salida fotovoltaica durante anochecer; por obvias razones Fig. 1.2 Curva de irradiación solar y salida fotovoltaica para un día específico [22] Fig.1.3 Correlación entre la irradiación solar y la producción de energía fotovoltaica paneles [22] Fig.1.4 Correlación entre la temperatura atmosférica y la producción de energía fotovoltaica paneles [22] 8 Velocidad del viento y temperatura de la celda: La velocidad del viento es una entrada crucial en los modelos PVPF, pero debido a su interacción de naturaleza moderada, introduce importantes incertidumbres [27],[28]. Su principal función es la disipación de calor y la reducción de la temperatura de la celda fotovoltaica. Generalmente, la eficiencia de los fotovoltaicos depende de la temperatura del módulo, que aumenta durante el funcionamiento debido a cambios en la temperatura ambiente o debido a la radiación absorbida por él. Por lo tanto, tanto la temperatura del viento como la de la celda, los valores son importantes y están vinculados. En Ref. [29], los autores analizaron los datos de velocidad y dirección del viento de su sistema fotovoltaico solar ASU para construir su conjunto de ANN modelos para PVPF. Descubrieron que los datos de la dirección del viento a 36 m de altitud, donde se instaló su planta fotovoltaica, demostrado binario o constante valores durante los últimos 1,6 años; y, por lo tanto, fue excluido. Sin embargo, se incluyó la velocidad del viento y su modelo de conjunto fue superior a enfoques establecidos: persistencia inteligente y modelos RNA individuales. Marca de tiempo: La marca de tiempo del clima juega un papel importante en la precisión del modelo PVPF. En Ref. [29] la marca de tiempo actual (en horas comenzando desde el inicio de cada año, representado como T ( t , d )) fue optimizado por el método de prueba y error y se observó que el pasados i ¼ 5 días (utilizado como dimensión de inserción) tendía a proporcionar la PVPF diario más preciso. La marca de tiempo (hora del día estudiado) introduce incertidumbre en la previsión [29]que es significativo durante el mediodía (debido a una mayor variaciones climáticas) en comparación con las primeras horas o las últimas horas de la noche. Además, estas incertidumbres de las predicciones de poder cambian dependiendo en el lugar y la temporada. Por lo tanto, desarrollar un nuevo modelo PVPF para una nueva región, los datos de marca de tiempo deben optimizarse para obtener la período de tiempo óptimo requerido [29]. Se recomiendan las RNA [29]para este propósito de PVPF ya que estas redes Los trabajos pueden dilucidar las complejas relaciones de entrada / salida, como las marca de tiempo y datos meteorológicos históricos con salida fotovoltaica. En Ref. [25] el los autores también utilizaron la marca de tiempo (desde el comienzo del año actual Td ( t)) y vectores de entrada meteorológicos ( Wd ( t )) para el mismo tiempo ( t ), con el período pasados cinco días antes del día (d), para desarrollar dos PVPF basados en ANN modelos que utilizan algoritmos LM y BR 9 1.3 Predicción de la generación de energía en sistemas fotovoltaico Actualmente una de las características distintivas de la energía eléctrica generada en parques solares fotovoltaicos es su carácter no gestionable, debido fundamentalmente a un régimen de generación eléctrica con alta intermitencia en función de la evolución de las condiciones climatológicas, sobre todo de la cobertura de nubes que puede presentar importantes cambios en intervalos cortos de tiempo; imposibilidad de control de la producción eléctrica ya que se genera toda la energía eléctrica que el sol aporte, sin que sea posible aumentar esa energía eléctrica; y escasa fiabilidad en los valores futuros de la producción de energía eléctrica frente a los programas de la generación eléctrica de las centrales clásicas no obstante, los últimos avances científicos permiten simular el comportamiento de la atmósfera y el océano mediante modelos, que, junto con el incremento de la potencia de cálculo en las nuevas computadoras, logran realizar unas predicciones del tiempo cada vez más exactas. La predicción de la generación fotovoltaica permite llevar a cabo una planificación energética apropiada, lo que ayuda a realizar un cálculo de la reserva de generación, y por lo tanto tiene consecuencias económicas positivas. Además, otro de los motivos de la importancia de la predicción es poder dar solución a los problemas que pueden surgir en la red eléctrica. En los últimos diez años junto con el desarrollo de la energía solar fotovoltaica se han estudiado disímiles modelos de predicción, entre los que se destacan fundamentalmente el uso de modelos grises, redes neuronales artificiales, modelos atmosféricos, modelos difusos, modelos híbridos, modelos ARIMA, entre otros. 1.3.1 Ventajas de la predicción Los sistemas eléctricos de potencia presentan como problema característico la imposibilidad de poder almacenar energía eléctrica a gran escala. Además, la fiabilidad de un sistema eléctrico radica en asegurar el suministro continuo de la energía eléctrica a sus clientes con el mínimo de interrupciones posibles. Es evidente que desde la puesta en funcionamiento de los sistemas eléctricos se hace necesario disponer de métodos de predicción de valores futuros de la demanda de energía eléctrica. Precisamente una de las primeras variables que fue objeto de atención por los especialistas fue la demanda de energía eléctrica. La predicción de esta variable se utiliza para la planificación de la energía eléctrica producida, en las compras de combustibles para las centrales eléctricas, para la secuenciación de los períodos de 10 mantenimiento de los elementos del sistema eléctrico y para la planificación de las redes eléctricas. El creciente aumento de la interconexión de los parques solares fotovoltaicos a los sistemas eléctricos trae como consecuencia disponer de herramientas para la predicción de la generación eléctrica en parques solares fotovoltaicos, por las repercusiones económicas que un conocimiento de antemano de los valores de energía generada puede tener en la determinación de la programación de las centrales eléctricas clásicas, y en las unidades generadoras convencionales. Por lo tanto, existe una doble necesidad de predicción de la energía eléctrica producida en los parques solares fotovoltaicos: por una parte, el operador del sistema eléctrico necesita conocer de antemano la potencia eléctrica que se va a inyectar en el sistema para un período de programación sobre una base horaria; y, además, el operador necesita el nodo en el que se va a inyectar esa potencia eléctrica para poder realizar los análisis del funcionamiento previsto del sistema [30]. 1.3.2 Horizontes de predicción El horizonte de predicción se considera como el período de tiempo que determina el momento futuro para el que se realizan las predicciones, el cual se debe tomar en cuenta desde el primer momento de diseño para el desarrollo de cualquier modelo de predicción. No existe unanimidad en cuanto al horizonte de predicción que debe ser utilizado para el desarrollo de cualquier modelo de predicción, ya sea para la predicción de generación de potencia eléctrica en parques solares fotovoltaicos, como para otras aplicaciones. Según [30], se pueden clasificar en:  Predicción a muy corto plazo: el horizonte de predicción es de unas horas, no existe unanimidad en su valor, así, como en sus valores extremos. La referencia [31] propone cuatro horas, mientras la [32] propone nueve horas. Para el operador de la red eléctrica estas predicciones son de interés para el mantenimiento de la seguridad del sistema eléctrico.  Predicción a corto plazo: el horizonte de predicción abarca desde el límite con el de muy corto plazo hasta las 48 o 72 horas. Esta predicción es la de mayor interés para poder actuar en el mercado diario eléctrico [33].  Predicciones a largo plazo: corresponden a un horizonte por encima de las 48 ó 72 horas y llegan hasta un límite de siete días. Cuanto mayor sea el horizonte, mayores 11 son los errores de predicción, pues hoy en día resulta difícil realizar predicciones fiables de variables atmosféricas por encima de esos siete días. Estas predicciones pueden ser de interés en la programación del sistema de generación de centrales eléctricas convencionales, o en la programación de las labores de mantenimiento de esas centrales [33].  Algunas bibliografías como [32] proponen además un horizonte de predicción de mediano plazo que contempla los límites entre tres a cinco días principalmente para su uso en la programación del sistema de generación de centrales eléctricas convencionales. Dada la importante trascendencia económica del tema, la mayor parte de los trabajos publicados [30, 33-38] se han centrado en la predicción de la generación eléctrica a corto plazo, sobre todo para el día siguiente (24 horas) 1.3.3 Métricas para determinar la incertidumbre en la predicción Los modelos que se usan para las predicciones de la generación eléctrica pueden emplear como datos de entrada variables meteorológicas que influyan sobre el comportamiento de la producción del parque solar fotovoltaico que se analiza (radiación solar, temperatura ambiente, humedad relativa, cobertura de nubes, posición y altitud del sol, presión, entre otras). Estos datos meteorológicos se obtienen principalmente de las predicciones meteorológicas generadas por los modelos atmosféricos. Estos son, generalmente, propiedad de los institutos meteorológicos nacionales, que proporcionan las predicciones de los valores numéricos de las variables meteorológicas. A partir de estos valores numéricos, se calcula la predicción de la potencia eléctrica generada en un parque solar fotovoltaico mediante el uso de métodos estadísticos o simplemente algún modelo de predicción existente. Pero la predicción de la generación eléctrica de estos últimos modelos tiene una gran limitación: los modelos de predicción de la generación eléctrica no pueden mejorar las predicciones de los modelos atmosféricos. Las principales fuentes de error en los modelos atmosféricos pueden ser desde un deficiente modelado de la superficie del terreno, hasta condiciones iniciales incorrectas, consecuencia de errores en el proceso de medida o interpretación de las variables meteorológicas que define el estado de partida de la atmósfera. El error causado por un deficiente modelado de la superficie del terreno, puede ser corregido estadísticamente. El error por condiciones iniciales incorrectas no puede ser corregido de antemano y es responsable de diferencias importantes entre los valores de predicción y los reales [30]. 12 Por lo tanto, se puede decir que la predicción de la potencia eléctrica generada por un parque solar fotovoltaico constituye una tarea difícil, no exenta de importantes errores. Pero a pesar de su dificultad, resulta imprescindible, tanto desde el punto de vista técnico como económico. 1.4 Principales modelos de predicción que se utilizan actualmente Hasta el año 2010 la investigación y el desarrollo de modelos de predicción de generación fotovoltaica era mínima. La mayor parte de los modelos se basaban en la predicción de la radiación que incide sobre el parque solar fotovoltaico y se calculaba la potencia eléctrica producida a partir de dichos valores. Para esto generalmente se utiliza las curvas proporcionadas por el fabricante del panel solar fotovoltaico o una serie de ecuaciones o relaciones empíricas conocidas[39, 40].A partir del año 2011 la publicación de nuevos modelos de predicción fotovoltaicos ha crecido considerablemente debido al aumento exponencial en los últimos diez años de la energía solar fotovoltaica en todo el mundo, así como los estudios sobre las características de dicha fuente de energía. Hoy en día, gracias al desarrollo alcanzado por los diferentes modelos utilizados para la predicción se puede realizar varias clasificaciones que dependen del criterio que se tenga en cuenta. Algunos criterios consideran la linealidad del modelo y los clasifica en lineales y no lineales. Otros toman en cuenta el método utilizado para el desarrollo matemático del modelo y los clasifican en modelos basados en técnicas de inteligencia artificial o en modelos regresivos. Aunque la clasificación más adecuada según [30] para comparar los datos de forma apropiada es:  Modelos basados en valores pasados: utilizan como entrada únicamente valores pasados, que pueden ser únicamente de la variable a predecir o de la variable a predecir complementada con otras variables que puedan influir sobre la misma. Dentro de estas variables se pueden incluir no solo las correspondientes al instante de tiempo en que se dieron, sino que pueden tratarse de variables meteorológicas medidas localmente en dichos instantes pasados.  Modelos atmosféricos: estos modelos incorporan como entrada los valores de predicción de variables meteorológicas obtenidas por los programas de predicción numérica existentes en diferentes institutos meteorológicos, además, dichas entradas pueden estar complementadas por las indicadas en el grupo anterior. Los principales modelos de predicción que se utilizan actualmente son:  Modelos ARIMA [4]  Sistema de Interferencia difusa o fuzzy  Redes Neuronales Artificiales (ANN) 13  Modelos Híbridos  Existen muchos otros modelos de predicción de series temporales, utilizados en la predicción de energías renovables como la eólica y la solar fotovoltaica [30]. Ente ellos se encuentran los modelos grises, Máquina de vectores soporte (SVMs), Modelo de cielo claro (día claro) y Modelo de los k vecinos más próximos (k-NN) 1.5 Consideraciones finales del capitulo Mediante la revisión bibliográfica, se realiza un recorrido por el estado actual de desarrollo de la energía solar fotovoltaica, así como los métodos de predicción más utilizados a nivel mundial para la predicción de la generación de energía eléctrica en parques solares fotovoltaicos. Se pudo constatar que en los últimos años la inteligencia artificial, específicamente las redes neuronales artificiales, han ganado en popularidad en todas sus variantes. De ellas el perceptrón multicapa es muy popular por tener gran éxito como aproximador universal de funciones y en un gran número de aplicaciones. 14 CAPÍTULO II. PROGRAMA PARA LA PREDICCIÓN DE LA GENERACIÓN DE ENERGÍA MEDIANTE TÉCNICAS DE INTELIGENCIA ARTIFICIAL CON DEEP LEARNING En este capítulo se aborda todo lo relacionado con las redes neuronales artificiales y deep learning, así como las redes neuronales recurrentes y del tipo LSTM y por último se ve la metodología utilizada para la implementación y validación del modelo de predicción con la ayuda del MATLAB. 2.1 Principales características de las redes neuronales artificiales y deep learning Una red neuronal artificial (ANN) se define como un esquema de computación distribuida o computación en malla, que se inspira en la estructura del sistema nervioso de un ser humano. En su forma más básica, una red neuronal contiene múltiples procesadores elementales conectados, conocidos como neuronas, que forman un sistema adaptativo el cual mediante un algoritmo de aprendizaje es capaz de ajustar los pesos sinápticos1 para alcanzar los requerimientos de desempeño de un problema dado. El proceso mediante el cual la red neuronal ajusta los pesos sinápticos para lograr un determinado objetivo, se denomina entrenamiento o aprendizaje, y el procedimiento para llegar a este cometido se denomina algoritmo de aprendizaje o entrenamiento[41]: Cada neurona que forma una red, tiene cuatro elementos básicos:  Un conjunto de conexiones, pesos o sinapsis que determinan el comportamiento de la neurona.  Un sumador, el cual se encarga de sumar todos los pesos que han sido multiplicados por el valor de cada peso o sinapsis de la conexión.  Una función de activación no lineal, que permite limitar la amplitud de la señal de salida de cada neurona.  Y, un umbral que determina cuando se activa la neurona. 15 Fig. 2.1. Esquema de Modelo Neurona[41] Las ANN tienen la propiedad de aprender a partir de un conjunto de patrones o datos de entrenamiento, es decir, tienen la capacidad de encontrar un modelo que ajuste los datos. En esta etapa de aprendizaje, el modelo busca minimizar el error entre la salida obtenida por la red y la salida deseada por el usuario ante un conjunto de datos de entrenamiento. Este proceso de entrenamiento puede ser supervisado o no supervisado[42]:  El proceso de aprendizaje supervisado consiste en entrenar la red neuronal a partir de un conjunto de datos de entrada y sus respectivas salidas, el algoritmo de aprendizaje ajusta los parámetros de la red de tal manera que la salida generada por la ANN se ajuste a los datos de salida dada una cierta entrada. Se dice que es supervisado ya que se conoce desde el inicio cual es el patrón de salida.  El aprendizaje no supervisado, en cambio, solamente entrega a la ANN un conjunto de datos de entrada, y el objetivo del algoritmo de aprendizaje es ajustar los pesos de la red hasta que este encuentre alguna estructura de los datos de entrada. Las neuronas que conforman una red neuronal, forman distintas arquitecturas de conexión, que pueden clasificarse de la siguiente manera[41]:  Según el número de capas: 1-Monocapa, tiene una capa de neuronas que proyectan las entradas a una capa de neuronas de salida la cual realiza los diferentes cálculos. 2- Multicapa, una generalización de la anterior la cual posee un conjunto de capas intermedias entre la entrada y la salida, llamadas capas ocultas.  Según el tipo de conexiones: 1-No Recurrentes, en estas redes la propagación de las señales se realiza en un solo sentido, no existe retroalimentación. 16 2- Recurrentes, estas redes poseen lazos de retroalimentación que pueden ser entre neuronas de diferentes capas, de la misma capa o de la misma  Según el grado de conexión: 1- Totalmente conectadas, las neuronas de una capa tienen conexión total con las neuronas de la siguiente capa (no recurrente) o de la capa anterior (recurrente) 2- Parcialmente conectadas, no existe conexión total entre neuronas de las diferentes capas. 2.2 Redes neuronales recurrentes Como se observó anteriormente, las redes recurrentes son un tipo de red neuronal dinámica, ya que el cálculo de una entrada, en un paso determinado depende del paso anterior, y ciertos casos dependen de un paso futuro. Esencialmente este tipo de redes neuronales son utilizadas para el tratamiento de secuencias, análisis de trayectorias, predicciones no lineales y modelación de sistemas dinámicos [43]. Dependiendo del grado de conexión de las neuronas que conforman las redes recurrentes, estas pueden clasificarse en dos [43]:  Parcialmente recurrentes, donde las conexiones recurrentes son fijas. Conexiones que generalmente son hacia adelante, pero se incluye un conjunto de conexiones de retroalimentación.  Totalmente recurrentes, donde cada neurona puede estar conectada a cualquier otra neurona (full mesh) y las conexiones recurrentes son variables Fig. 2.2 Izquierda: Red Parcialmente Recurrente Derecha: Red Completamente recurrente 17 Tomando en cuenta solamente las redes parcialmente recurrentes [44], estas poseen dos tipos de modelos: la red simple recurrente de Elman (1990) y la red secuencial de Jordan (1986). Ambos tipos de son utilizados en la modelización de series temporales. Mientras que, en las redes totalmente recurrentes, se destacan los modelos: RTRL (Real- Time Recurrent Learning), TDRB (Time-Dependent Recurrent Back Propagation) y LSTM (Long short-term memory). Los dos primeros modelos antes mencionados son utilizados generalmente para aplicaciones que requieren aprendizaje en vivo, típicamente utilizados en el ámbito industrial. El modelo LSTM es una arquitectura particular de una red totalmente recurrente, propuesta por Hochreiter y Schmidhuber (1997), que surge para solventar algunas dificultades presentadas en las redes totalmente recurrentes RTRL y TDRB. Las RNN tienen dos métodos de entrenamiento: la retropropagación y el aprendizaje recurrente a tiempo real. El primer método es un algoritmo de aprendizaje en el cual, un conjunto de datos de entrada se propaga a través de la red neuronal hasta la capa de salida, una vez en este punto se calcula el error producido, y el error es transmitido hacia atrás a las neuronas de las capas ocultas, en base a este error la red neuronal cambia los pesos de las conexiones en cada neurona. Este método utiliza el gradiente descendiente para definir la función que proporciona el error que comete la red neuronal, ante un determinado conjunto de pesos sinápticos. El objetivo de este entrenamiento es encontrar la configuración de pesos sinápticos que corresponda al mínimo global de la función de error. El segundo método de entrenamiento tiene una complejidad de cálculo mucho mayor a la que presenta el primer método. Este método tiene la capacidad de ajustar los pesos sinápticos de la red en tiempo real, es decir, mientras la red continúa realizando su función de procesamiento. De manera general, este método hace uso del gradiente descendiente para calcular la función de error en cada instante del tiempo[45]. 2.3 Redes neuronales recurrentes del tipo LSTM Es un tipo específico de arquitectura de RNN, diseñado para modelar secuencias temporales en dependencias de largo alcance, más precisamente que las RNN convencionales. Las redes LSTM tienen unas unidades especiales llamadas bloques de memoria en la capa recurrente oculta. Cada uno de estos bloques de memoria contiene una celda de memoria con auto-conexiones que almacena el estado temporal de la red, además cuentan con unidades multiplicativas llamadas gates que controlan el flujo de información de la red. Cada bloque de memoria tiene un gate de entrada y de salida [46]. 18 Fig2.3. Bloque de memoria LSTM La arquitectura LTSM aborda el inconveniente que poseen las RNN convencionales en dependencias a largo plazo, debido a problemas con el gradiente de la red en cálculo del error. Este problema se produce ya que en redes profundas como las RNN, los gradientes de la red son calculados como un producto de diferenciales, entrenar estas redes a lo largo del tiempo, puede llevar al gradiente a desaparecer (Vanishing) o acumular grandes gradientes de error lo que dan como resultado actualizaciones de pesos muy grandes (Exploding)[47]. 2.4 Metodología utilizada para la implementación y validación del modelo de predicción En la fig.2.4 se muestra un resumen de la metodología de trabajo utilizada para realizar la predicción de la potencia generada en una instalación fotovoltaica. Fig.2.4 Metodología para la predicción de la generación fotovoltaica. 19 Se parte inicialmente de una base de datos del parque UCLV, esta base de datos contiene mediciones de varias variables (radiación solar, temperatura ambiente, temperatura de los módulos, velocidad y dirección del viento, potencia activa y reactiva) desde julio de 2018 hasta abril de 2021. El primer paso consiste en realizar una limpieza de datos atípicos (esto se conoce en la literatura como outliers, aquí puedes encontrar valores inconsistentes o sea que no se corresponden con los valores típicos de la serie de tiempo en la que se enmarcan). Entonces debemos eliminar estos valores para que el modelo de predicción que se desarrolle no se vea afectado negativamente. Después que se eliminan esos valores atípicos y otros valores erróneos que pueden ser valores no numéricos o inconsistentes, entonces se pasa al siguiente paso que es el análisis estadístico. En nuestro estudio analizamos la correlación de cada variable con respecto a la potencia activa generada que es nuestra variable objetivo, o sea lo que deseamos predecir. Las variables velocidad y dirección del viento al parecer tienen problemas en la base de datos y sus correlaciones no son adecuadas por lo tanto las excluimos del estudio. Entonces finalmente seleccionamos las variables de entrada y salida al modelo, en este caso: Variables de entrada: radiación solar, temperatura ambiente, temperatura de modulo y como es un modelo LSTM también se toma como entrad la potencia activa. Variables de salida: potencia activa generada. Modelo de predicción a utilizar: Se decide utilizar un modelo LSTM o Long Short Term Memory, este modelo es una red neuronal recurrente con aprendizaje profundo que utiliza, utiliza una celda de memoria que le permite aprender dependencias a largo plazo en comparación con las RNN simples. Todo esto hace que el LSTM sea un modelo robusto y que brinde resultados adecuados en la predicción de la generación PV. Normalizar los datos: Antes de entrenar el modelo con los datos disponibles es necesario que estos sean y normalizados, esto significa que todos se encuentren en el mismo rango, que bien pude ser entre 0 y 1 o entre -1 y +1. Paro esto existen varios criterios, pero se utilizó el siguiente: 20 Consiste en determinar la media y la desviación estándar de cada vector que forma las variables de entrada y de salida y luego aplicar la ecuación (1). 𝑎′ = 𝑎 − 𝑉𝑚𝑒𝑑𝑖𝑎 𝑉𝑠𝑡𝑑 (1) Donde: a: es el valor de la variable de entrada o salida. Vmedia y Vstd: son los valores de la media y la desviación estándar del vector de entrada o salida. Este método se recomienda en la bibliografía consultada [48][48] y garantiza que los valores de entrada y salida queden estandarizados en el intervalo [-1,1]. Además, al trabajar con parámetros estadísticos se obtiene mayor calidad en este proceso. El código utilizado es el siguiente Entrenar el modelo de predicción: Lo primero es definir la arquitectura del modelo LSTM, esto te lo muestro en la figura siguiente: Fig.2.5 Arquitectura del modelo LSTM 21 Los tres primeros parámetros corresponden a las entrad, las salidas y la cantidad de unidades ocultas del modelo LSTM. Lo demás son aspectos propios del modelo, como la cantidad de capas, la conexión entre las capaz y las opciones entrenamiento. Para el entrenamiento de la red se utiliza este código: Después de esto es cuando la programación se pone difícil, pues vienen unas cuantas líneas de código para que todo esto funcione y para obtener los resultados. Para validar el modelo se utilizan datos que no formaron parte del conjunto de datos de entrenamiento para validar. O sea, inicialmente los datos se dividen el 90 % para entrenamiento y el 10 % para la prueba, ese 10% es el que se utiliza para demostrar que el LSTM aprendió correctamente las relaciones y los patrones de los datos de entrada. Para determinar el error de predicción existen varias formas o métricas como también se les llama, en este caso se utilizaron las siguientes: La estimación del rendimiento es fundamental para evaluar la precisión de las previsiones de un modelo. Las herramientas comunes incluyen: Error absoluto medio (MAE), Error de porcentaje absoluto medio (MAPE) y Error cuadrático medio (RMSE). El MAE estima la significancia promedio de los errores en un conjunto de datos de pronósticos promediando las diferencias entre las observaciones reales y los resultados previstos de toda la muestra de prueba, dando a todas las discrepancias individuales el mismo peso. De manera similar, RMSE estima el valor medio del error utilizando la raíz cuadrada del promedio de las diferencias al cuadrado entre los valores pronosticados y las observaciones reales. Por lo tanto, es más robusto para tratar grandes desviaciones que son especialmente indeseables, lo que le da al investigador la capacidad de identificar y eliminar valores atípicos. Sin embargo, ambas métricas promedio (MAE y RMSE) pueden variar de cero a infinito. Por el contrario, MAPE es una técnica de predicción estándar que mide la precisión de la predicción y justifica la diversidad de predicciones para conjuntos de datos reales. Las ecuaciones de estas métricas son las siguientes: 𝑀𝐴𝐸 = 1 𝑁 ∑ |𝑦𝑗 − 𝑡𝑗|𝑁 𝑖=1 (7) 𝑅𝑀𝑆𝐸 = √1 𝑁 ∑ (𝑦𝑗 − 𝑡𝑗)𝑁 𝑖=1 2 (8) 𝑀𝐴𝑃𝐸 = 1 𝑁 ∑ |𝑦𝑗−𝑡𝑗| 𝑦𝑗 𝑁 𝑖=1 × 100% (9) 22 donde 𝑦𝑗 y 𝑡𝑗 son los valores medidos y pronosticados correspondientes de la potencia fotovoltaica y 𝑁 es el número de muestras de prueba 2.5 Consideraciones finales del capítulo A partir del análisis realizado en el presente capítulo se decide utilizar una red neuronal recurrente del tipo LSTM para realizar la predicción de la generación de energía eléctrica en el parque solar fotovoltaico de la UCLV en la provincia de Villa Clara. La red neuronal utiliza una celda de memoria que le permite aprender dependencias a largo plazo en comparación con las RNN simples. 23 CAPÍTULO III. RESULTADOS DE LAS PREDICCIONES REALIZADAS En este capítulo se realiza una pequeña descripción del parque solar fotovoltaico que se analiza, así como los resultados que se obtienen mediante la simulación de la red neuronal recurrente. En este proceso una de las opciones que mejor resultado aportó, fue la división de los datos en correspondencia con las estaciones del año. O sea, se toman las mediciones de un año de trabajo de la planta fotovoltaica y se dividen en períodos de tres meses de forma tal que cada período corresponda a una estación del año bajo estudio. 3.1 Descripción del parque solar fotovoltaico analizado El parque solar fotovoltaico de la UCLV, en la provincia de Villa Clara, posee una potencia nominal de 1.1 MW, fue puesto en marcha en el año 2019. Se encuentra ubicado en la zona suroeste de la Facultad de Ingeniería Eléctrica de la Universidad Central "Marta Abreu” de Las Villas, en los 22.4° de latitud norte y los 79.96° de longitud oeste. Se dispone de un amplio grupo de mediciones de las variables siguientes: radiación solar, temperatura ambiente, temperatura de los módulos fotovoltaicos y potencia generada. Figura3.: Parque solar fotovoltaico de la UCLV. 24 3.2 Resultados obtenidos para el período de tiempo analizado Análisis estadísticos de los datos: Se dispone de una base de datos que contiene mediciones de potencia activa generada, potencia reactiva, radiación solar, temperatura ambiente, temperatura de los módulos fotovoltaicos, velocidad y dirección del viento. Dichas mediciones fueron tomadas en intervalos de tiempo de una hora desde julio de 2018 hasta abril de 2021. La fig.3.2 muestra un fragmento de la base de datos. Fig.3.1: Fragmento de la base de datos del PFV de la UCLV [Fuente: Elaboración propia] Debe aclararse que con vistas a reducir la carga computacional de los modelos de predicción y reducir el tiempo de entrenamiento de los mismos se aplicó un proceso de filtrado de datos. En dicho proceso se removieron de la base de datos todas las mediciones correspondientes al horario nocturno donde la planta no está generando potencia activa. Por tanto, solo se analizan 14 mediciones en cada día, correspondientes con el horario de trabajo de la planta comprendido entre las 6:00 am y las 20:00 pm. En la tabla 1 se resumen los principales indicadores estadísticos para la variable potencia activa generada, aunque es válido señalar que dicho análisis se realizó para cada una de las variables presentes en la base de datos. 25 Tabla 1. Análisis estadístico de la potencia activa generada Año 2018 2019 2020 2021 Periodo Media 0.31 0.38 0.34 0.39 0.35 Desviación estándar 0.33 0.33 0.32 0.32 0.33 Mínimo 0 0 0 0 0 Media 0.19 0.30 0.34 0.31 0.37 Máximo 1.03 1.05 1.05 1.01 1.03 Un aspecto de gran importancia resulta el análisis de correlación de los datos, pues permite definir cuáles son las variables a tener en cuenta en un modelo de predicción. En el caso que se presenta se tiene una base de datos del parque UCLV que contiene series de tiempo de varias variables por un período de tiempo cercano a los 3 años. La variable que se desea predecir es la potencia activa generada en la instalación. Por tanto, en el análisis de correlación se analiza cada una de las variables con respecto a la potencia activa generada. Para las variables velocidad del viento y dirección del viento no se muestra el resultado del análisis de correlación, pues las mediciones de estas variables presentaban una gran cantidad de errores que provocaron que sus valores de correlación se encontraran totalmente fuera de rango. En el caso de la variable potencia reactiva no se analiza su correlación con respecto a la potencia activa generada pues la potencia reactiva depende de la potencia activa y no tendría sentido utilizarla como una entrada al modelo de predicción. En la tabla 2 se muestran los valores de correlación de las diferentes variables presentes en la base de datos respecto a la potencia activa generada. Como se observa en la tabla anterior la mayor correlación con respecto a la potencia activa generada la presenta la variable radiación solar, seguida por la temperatura de los módulos y la temperatura ambiente. Estos valores de correlación se encuentran en el rango establecido por la referencia [38], lo que permite que estas variables se puedan considerar como entradas al modelo de predicción. 26 Tabla 2. Valores del coeficiente de correlación con respecto a la potencia activa generada Valores del coeficiente de correlación de las diferentes variables respecto a la potencia activa generada Años analizados 2018 2019 2020 2021 Radiación solar 0.9968 0.9966 0.9968 0.9975 Temperatura de los módulos 0.7898 0.7781 0.7752 0.7819 Temperatura ambiente 0.7242 0.6840 0.6683 0.6890 Resultados de la predicción mediante el modelo LSTM Como se explicó en el inicio del trabajo, el modelo de predicción seleccionado para realizar el pronóstico de la generación fotovoltaica es el LSTM, recomendado actualmente en un número considerable de publicaciones, debido a sus ventajas y a su probada efectividad para aprender dependencias a largo plazo en comparación con las RNN simples. En este caso se dispone de una amplia base de datos de una instalación fotovoltaica. En el proceso de trabajo y entrenamiento del modelo LSTM se probaron un gran número de variantes posibles de división de la base de datos. En este proceso una de las opciones que mejor resultado aportó, fue la división de los datos en correspondencia con las estaciones del año. O sea, se toman las mediciones de un año de trabajo de la planta fotovoltaica y se dividen en períodos de tres meses de forma tal que cada período corresponda a una estación del año bajo estudio. Para el entrenamiento del modelo LSTM se toma el 90 % de los datos de la estación y el 10% restante se utiliza para probar su desempeño. Debe señalarse que la ventaja de este modelo radica en que basado en los datos históricos de la instalación fotovoltaica es capaz de realizar predicciones para horizontes de tiempo futuros con una exactitud adecuada y sin necesidad de depender de predicciones de otros modelos meteorológicos o físicos. 27 Para analizar el desempeño del modelo propuesto se presentan las predicciones realizadas para la potencia activa generada en la instalación fotovoltaica para tres días de diferente comportamiento (día soleado, día nublado y día con sol y algunas nubes). En este caso se realiza una predicción a corto plazo (para las 14 horas del día siguiente). Esto se puede observar en las figuras 3.2 y 3.3 respectivamente. En dichas figuras también se muestra el comportamiento del error de predicción a lo largo del día, en este caso el RMSE. Fig. 3.2 : Predicción a corto plazo de generación PV para un día soleado. [Fuente: Elaboración propia] 28 Fig.3.4: Predicción a corto plazo de generación PV para un día nublado. [Fuente: Elaboración propia] Fig.3.5: Predicción a corto plazo de generación PV para un día con sol y algunas nubes. [Fuente: Elaboración propia] Como se puede observar en las figuras anteriores las predicciones realizadas en los tres casos analizados son acertadas. El mejor resultado se obtiene para el día soleado como era de esperar, seguido del día con sol y algunas nubes y por último del día nublado. Este comportamiento en las predicciones se debe fundamentalmente al efecto de la radiación solar y de la nubosidad que incide sobre la planta fotovoltaica. En la medida que aumenta la nubosidad incidente sobre la planta fotovoltaica, se produce una mayor variación e intermitencia en la radiación solar incidente y por ende en la potencia generada. La alta variabilidad hace que la predicción de la generación sea más difícil y que presente mayores errores en comparación con días de comportamiento más estable. En la tabla 3 se muestran los errores de predicción para cada día analizado, utilizando tres métricas fundamentales descritas en la literatura especializada para este fin. 29 Tabla 3. Valores del error de predicción en días con diferente comportamiento. [Fuente: Elaboración propia] Predicciones de generación PV para un horizonte de corto plazo en días con diferente comportamiento Métricas utilizadas para evaluar el error de predicción RMSE MAE MAPE (kW) % (kW) % % Día soleado 20.61 2.24 16.89 1.81 2.32 Día nublado 37.45 11.31 31.32 9.46 16.11 Día con sol y algunas nubes 27.12 3.22 26.31 2.79 6.48 Según se observa en la tabla anterior los valores del error de predicción (expresados en kW y en %) para cada métrica utilizada y para cada día analizado son pequeños, lo que demuestra que la predicción realizada es acertada. Además, estos resultados se corresponden con los resultados propuestos en la bibliografía internacional que ha abordado esta temática. 3.3 Consideraciones finales del capítulo A partir de datos históricos que no forman parte del entrenamiento, se realiza la validación de la red neuronal recurrente del tipo LSTM para comprobar el nivel de generalización que alcanza la misma, utilizándose para una predicción a corto plazo de la potencia activa generada por la instalación fotovoltaica en tres días con diferente comportamiento (día soleado, día nublado y día con sol y algunas nubes), obteniéndose buenos resultados en todos los casos, con pequeños valores del error de predicción. 30 CONCLUSIONES Los resultados de este trabajo permiten arribar a las conclusiones siguientes:  Al consultar diferentes bibliografías internacionales se pudo contactar que la mayoría de los trabajos recomiendan el uso de las redes neuronales recurrentes para realizar este tipo de estudio, principalmente las redes del tipo LSTM por ser considerado un modelo robusto y que brinda resultados adecuados a la predicción de generación PV.  Se diseña una red neuronal recurrente del tipo LSTM o Long Short Term Memory mediante el MATLAB. Dicha red utiliza como variables de entrada las mediciones históricas de la radiación solar, la temperatura ambiente y la temperatura en los módulos fotovoltaicos y como variable de salida la potencia generada en la instalación fotovoltaica en diferentes épocas del año.  El modelo se entrena con datos históricos obtenidos de la planta fotovoltaica de la UCLV, dichos datos se analizan estadísticamente y se preparan con el objetivo de lograr predicciones más exactas y con mayor rapidez  La principal contribución del trabajo radica en el desarrollo de una metodología sencilla pero efectiva para el logro del objetivo propuesto, la cual resulta aplicable en cualquier parque solar fotovoltaico. No obstante, deben analizarse otros modelos de deep learning y comparar sus resultados con el modelo propuesto para seleccionar el más adecuado según el tipo de predicción que se presente. 31 RECOMENDACIONES  Continuar la validación de la red neuronal recurrente con datos pertenecientes a otros parques solares fotovoltaicos del país.  Incorporar al trabajo otras técnicas de inteligencia artificial como algoritmos genéticos y lógica difusa, para combinarlas con las redes neuronales recurrentes y lograr predicciones más exactas y de mayor calidad.  Aplicar este método para predecir la generación de energía eléctrica con otras fuentes de energía renovable, como la energía eólica. 32 BIBLIOGRAFÌA [1] O. Aldoshina and D. Van Tai, "Evaluation and prediction of solar radiation for energy management based on neural networks," in Journal of Physics: Conference Series, 2017, p. 012036. [2] L. F. Cachipuendo Amagua, "Estimación de la potencia producida por módulos fotovoltaicos en base a Redes Neuronales Artificiales y comparación con metodologías basadas en Regresiones Múltiples," Quito, 2016., 2016. [3] O. Kärner, "ARIMA representation for daily solar irradiance and surface air temperature time series," Journal of Atmospheric and Solar-Terrestrial Physics, vol. 71, pp. 841-847, 2009. [4] Y. Li, Y. Su, and L. Shu, "An ARMAX model for forecasting the power output of a grid connected photovoltaic system," Renewable Energy, vol. 66, pp. 78-89, 2014. [5] Z. Li, S. Rahman, R. Vega, and B. Dong, "A hierarchical approach using machine learning methods in solar photovoltaic energy production forecasting," Energies, vol. 9, p. 55, 2016. [6] L. Llano, G. Zapata, and D. Ovalle, "Sistema de inferencia difuso para identificar eventos de falla en tiempo real del STE usando registros SOE," Avances en Sistemas e Informática, vol. 4, 2007. [7] D. Masa Bote, "Contribución a integración de sistemas fotovoltaicos conectados a la red: recurso solar y predicción de la generación," Telecomunicacion, 2014. [8] C. Moehrlen, "Uncertainty in wind energy forecasting," University College Cork, 2004. [9] C. E. MORATIEL, "Estudio de viabilidad sobre la previsión horaria de la producción de energía solar fotovoltaica mediante técnicas de redes neuronales," Proyecto Fin de Carrera, Ingeniería Industrial, Escuela Técnica Superior de Ingeniería, Universidad Pontificia Comillas, Madrid, 2009. [10] F. Rodríguez Paler, "Predicción mediante redes neuronales de la producción de energía de un parque fotovoltaico," 2017. [11] M. A. GómezRodríguez, J. R. Gómez Sarduy, J. V. Lorenzo Ginori, R. Fonte González, and Z. García Sánchez, "Pronóstico de la generación eléctrica de sistemas fotovoltaicos. Un inicio en Cuba desde la universidad," Revista Universidad y Sociedad, vol. 13, pp. 253-265, 2021. [12] L. A. I. Carrera, N. A. C. Perdomo, and E. B. Valuca, "La energía fotovoltaica y sus particularidades en Cuba," Revista Mapa, vol. 5, 2021. [13] M. Q. Raza, M. Nadarajah, and C. Ekanayake, "On recent advances in PV output power forecast," Solar Energy, vol. 136, pp. 125-144, 2016. [14] U. K. Das, K. S. Tey, M. Seyedmahmoudian, M. Y. Idna Idris, S. Mekhilef, B. Horan, et al., "SVR-based model to forecast PV power generation under different weather conditions," Energies, vol. 10, p. 876, 2017. [15] F. Wang, Z. Zhen, Z. Mi, H. Sun, S. Su, and G. Yang, "Solar irradiance feature extraction and support vector machines based weather status pattern recognition model for short-term photovoltaic power forecasting," Energy and Buildings, vol. 86, pp. 427-438, 2015. 33 [16] F. Wang, Z. Zhen, B. Wang, and Z. Mi, "Comparative study on KNN and SVM based weather classification models for day ahead short term solar PV power forecasting," Applied Sciences, vol. 8, p. 28, 2018. [17] F. J. Lima, F. R. Martins, E. B. Pereira, E. Lorenz, and D. Heinemann, "Forecast for surface solar irradiance at the Brazilian Northeastern region using NWP model and artificial neural networks," Renewable Energy, vol. 87, pp. 807-818, 2016. [18] F. Kasten and G. Czeplak, "Solar and terrestrial radiation dependent on the amount and type of cloud," Solar energy, vol. 24, pp. 177-189, 1980. [19] S. Nann and C. Riordan, "Solar spectral irradiance under clear and cloudy skies: Measurements and a semiempirical model," Journal of Applied Meteorology and Climatology, vol. 30, pp. 447-462, 1991. [20] D. Kaskaoutis, H. Kambezidis, C. Jacovides, and M. Steven, "Modification of solar radiation components under different atmospheric conditions in the Greater Athens Area, Greece," Journal of Atmospheric and Solar-Terrestrial Physics, vol. 68, pp. 1043-1052, 2006. [21] Y. Sun, F. Wang, B. Wang, Q. Chen, N. Engerer, and Z. Mi, "Correlation feature selection and mutual information theory based quantitative research on meteorological impact factors of module temperature for solar photovoltaic systems," Energies, vol. 10, p. 7, 2017. [22] U. K. Das, K. S. Tey, M. Seyedmahmoudian, S. Mekhilef, M. Y. I. Idris, W. Van Deventer, et al., "Forecasting of photovoltaic power generation and model optimization: A review," Renewable and Sustainable Energy Reviews, vol. 81, pp. 912-928, 2018. [23] J. G. da Silva Fonseca, T. Oozeki, T. Takashima, G. Koshimizu, Y. Uchida, and K. Ogimoto, "Photovoltaic power production forecasts with support vector regression: A study on the forecast horizon," in 2011 37th IEEE photovoltaic specialists conference, 2011, pp. 002579-002583. [24] C. Monteiro, L. A. Fernandez-Jimenez, I. J. Ramirez-Rosado, A. Muñoz-Jimenez, and P. M. Lara-Santillan, "Short-term forecasting models for photovoltaic plants: Analytical versus soft-computing techniques," Mathematical problems in engineering, vol. 2013, 2013. [25] O. Younis, "A predictive model for solar photovoltaic power using the Levenberg- Marquardt and Bayesian regularization algorithms and real-time weather data," International Journal of Advanced Computer Science and Applications, vol. 9, 2018. [26] M. G. De Giorgi, P. M. Congedo, and M. Malvoni, "Photovoltaic power forecasting using statistical methods: impact of weather data," IET Science, Measurement & Technology, vol. 8, pp. 90-97, 2014. [27] S. S. Reddy, "Optimal scheduling of thermal-wind-solar power system with storage," Renewable energy, vol. 101, pp. 1357-1368, 2017. [28] S. S. Reddy and P. Bijwe, "Real time economic dispatch considering renewable energy resources," Renewable Energy, vol. 83, pp. 1215-1226, 2015. [29] S. Al-Dahidi, O. Ayadi, M. Alrbai, and J. Adeeb, "Ensemble approach of optimized artificial neural networks for solar photovoltaic power prediction," IEEE Access, vol. 7, pp. 81741-81758, 2019. [30] A. M. Jimenes., "Modelos de predicción a corto plaso de la generacíon eléctrica en instalaciones fotovoltaicas.," Tesis doctoral, Ingeniería Eléctrica., Escuela Técnica Superior de Ingeniería Industrial, Univercidad de Rioja., 2014. 34 [31] J. Usaola, O. Ravelo, G. González, F. Soto, M. C. Dávila, and B. Díaz–Guerra, "Benefits for wind energy in electricity markets from using short term wind power prediction tools; a simulation study," Wind Engineering, vol. 28, pp. 119-127, 2004. [32] C. Mörklen, "Uncertainty in win energy forecasting," Universidad de Cork, Irlanda, 2004. [33] A. F. R. Granda, "Predicción de la potencia activa a corto plaso de un parque fotovoltaico utilizando una red neuronal artificial," Tesis de fin de año, Facultad de Ingeniería Eléctrica y Electrónica, Escuela Politécnica Nacional, Quito,mayo 2017. [34] R. Mellit, I. Koprinska, and V. G. Agelidis, "Univariate and multivariate methods for very short-term solar photovoltaic power forecasting," Energy Conversion and Management, vol. 121, pp. 280-390, 2016. [35] A. Rashkovska, J. Novljan, M. Smolnikar, M. Mohorcic, and C. Fortuna, "Online short-term forecasting of photovoltaic energy production," presented at the IEEE Power and Society Innovative Smart Grid Technologies Conference, 2015. [36] A. Muñoz-Jiménez, P. Zorzano-Santamaría, L. A. Fernández-Jiménes, E. Zorzano- Alba, A. Yanguas-Peña, and E. García-Garrido, "Modelos de Predicción a corto plazo para sistemas fotovoltaicos," Conferencia Hispano-Lusa de Ingeniería Eléctrica, julio 2009. [37] M. S. T. Olarte, "Nuevos modelos de predicción a corto plazo de la generación eléctrica en plantas basadas en energía solar fotovoltaica," Tesis doctoral, Ingeniería Eléctrica, Universidad de la Rioja, 2017. [38] c. R. Ahmed a, *, V. Sreeram a, Y. Mishra a,b, M.D. Arif c, "A review and evaluation of the state-of-the-art in PV solar power forecasting: Techniques and optimization," http://www.elsevier.com/locate/rser, p. 26, 2020. [39] A. Muñoz-Jiménez, P. Zorzano-Santamaría, L. Fernández-Jiménez, E. Zorzano- Alba, A. Yanguas-Peña, and E. García-Garrido, "Modelos de Predicción a corto plazo para sistemas fotovoltaicos," in Conferencia Hispano-Lusa de Ingeniería Eléctrica, 2009. [40] M. S. T. Olarte, "Nuevos modelos de predicción a corto plazo de la generación eléctrica en plantas basadas en energía solar fotovoltaica," Universidad de La Rioja, 2017. [41] A. Serrano, E. Soria, and J. Martín, "Redes Neuronales Artificiales, Escuela Técnica Superior de Ingeniería," Tesis de Licenciatura, 2009. [42] R. Salas, "Redes neuronales artificiales," Universidad de Valparaıso. Departamento de Computación, vol. 1, pp. 1-7, 2004. [43] I. B. Cruz, S. S. Martínez, A. R. Abed, R. G. Ábalo, and M. M. G. Lorenzo, "Redes neuronales recurrentes para el análisis de secuencias," Revista Cubana de Ciencias Informáticas, vol. 1, pp. 48-57, 2007. [44] C.-T. Lin and C. G. Lee, Neural fuzzy systems: a neuro-fuzzy synergism to intelligent systems: Prentice hall, 1996. [45] K. S. Thampatty, M. Nandakumar, and E. P. Cheriyan, "RTRL Algorithm Based Adaptive Controller for Non-linear Multivariable Systems," International Journal of Computer Applications, vol. 975, p. 8887, 2010. [46] S. Liu, X. Hu, and W. Wang, "Deep reinforcement learning based dynamic channel allocation algorithm in multibeam satellite systems," IEEE Access, vol. 6, pp. 15733- 15742, 2018. http://www.elsevier.com/locate/rser 35 [47] R. Grosse, "Lecture 15: Exploding and vanishing gradients," University of Toronto Computer Science, 2017. [48] B. M. d. Brio and A. S. Molina, Redes neuronales y Sistemas difusos, Segunda edición ed., marzo 2001.