, -- de ----- del 2021 

Título: “Predicción de generación fotovoltaica mediante técnicas de inteligencia artificial con deep 

learning”. 

 
Autor: Alejandro González Isidor 

 Tutores: Dra. Lesyani Leon Viltres 

               M.sc. Reinier Herrera Casanova 

 
Departamento de Electroenergética 


, junio 2018 

 
Title: Prediction of photovoltaic generation using artificial intelligence techniques with deep learning 

Author: Alejandro González Isidor  

Thesis Director: Dra. Lesyani Leon Viltres 

               M.sc. Reinier Herrera Casanova 

 
, … …, 2021 

Electroenergetic Department 

 
Este documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de 

Las Villas, y se encuentra depositado en los fondos de la Biblioteca Universitaria 

“Chiqui Gómez Lubian” subordinada a la Dirección de Información Científico Técnica 

de la mencionada casa de altos estudios. 

Se autoriza su utilización bajo la licencia siguiente: 

Atribución- No Comercial- Compartir Igual  

 
Para cualquier información contacte con: 

Dirección de Información Científico Técnica. Universidad Central “Marta Abreu” de Las 

Villas. Carretera a Camajuaní. Km 5½. Santa Clara. Villa Clara. Cuba. CP. 54 830 

Teléfonos.: +53 01 42281503-1419 

 
PENSAMIENTO 
 

“Nunca consideres el estudio como una obligación, sino como la oportunidad para 

penetrar en el bello y maravilloso mundo del saber.”  

Albert Einstein (1879-1955) 

 
DEDICATORIA 
 

A mis padres y mi hermano, sin ellos nada de esto hubiese sido posible por todo lo que 

pasamos juntos y por el apoyo incondicional que me dieron. Y en especial a los ya no están 

conmigo mi abuela Juana y mi tío Felin. 

 
AGRADECIMIENTOS 

 
A mis tutores Reinier y Lesyani desde el primer momento me brindaron toda su ayuda, a 

mis padres por estar ahí cada día apoyándome. 

Gracias a los magníficos Profesores que tuve en esto 5 años. 

A mis compañeros por vivir los mejores años de mi vida junto a ellos, por saber estar en 

las buenas y en las malas y brindarme su ayuda cada día. 

En fin, a todas aquellas personas que me dieron su mano que los tengo en mente, pero 

son tantos que no podría mencionarlos a todos.  

Gracias a todos. 

 
RESUMEN 
 
 
La energía solar constituye actualmente una fuente de energía muy utilizada por el hombre. 

Sin embargo, presenta un comportamiento que en ocasiones resulta extremadamente 

difícil de prever. Debido a esto deben realizarse varios análisis con el fin de determinar la 

expectativa real de generación de los parques solares fotovoltaicos. La predicción de la 

energía que se produce en un parque solar fotovoltaico presenta una gran cantidad de 

aplicaciones, sobre todo en lo referente a la planificación y operación del sistema eléctrico. 

En el siguiente trabajo se implementa un algoritmo de predicción de generación fotovoltaica 

para el parque solar fotovoltaico de la UCLV basado en técnicas de inteligencia artificial 

con deep learning con la utilización del software MATLAB, con el objetivo de realizar la 

predicción de la energía eléctrica de dicho parque con el menor error posible. Los 

resultados que se obtienen muestran que las predicciones realizadas para diferentes 

períodos de tiempo y épocas del año son correctas, lo que demuestra la efectividad del 

método de predicción utilizado. 

 
Palabras Clave: Parque Solar Fotovoltaico; Redes Neuronales Artificiales; Predicción. 

 
ÍNDICE 

 
INTRODUCCIÓN .............................................................................................................. 1 

CAPÍTULO 1. ESTADO ACTUAL DE LA ENERGÍA SOLAR FOTOVOLTAICA Y LOS 

MÉTODOS DE PREDICCIÓN .......................................................................................... 4 

1.1 Comportamiento de la generación fotovoltaica en la actualidad a nivel mundial y 

en Cuba ........................................................................................................................ 4 

1.2 Principales variables meteorológicas que intervienen en la predicción de 

generación fotovoltaica ................................................................................................. 5 

1.3 Predicción de la generación de energía en sistemas fotovoltaico ....................... 9 

1.3.1 Ventajas de la predicción ............................................................................. 9 

1.3.2 Horizontes de predicción ............................................................................10 

1.3.3 Métricas para determinar la incertidumbre en la predicción ........................11 

1.4 Principales modelos de predicción que se utilizan actualmente .........................12 

1.5 Consideraciones finales del capitulo ..................................................................13 

CAPÍTULO II. PROGRAMA PARA LA PREDICCIÓN DE LA GENERACIÓN DE ENERGÍA 

MEDIANTE TÉCNICAS DE INTELIGENCIA ARTIFICIAL CON DEEP LEARNING..........14 

2.1 Principales características de las redes neuronales artificiales y deep learning......14 

2.2 Redes neuronales recurrentes ...............................................................................16 

2.3 Redes neuronales recurrentes del tipo LSTM .........................................................17 

2.4 Metodología utilizada para la implementación y validación del modelo de predicción

 .....................................................................................................................................18 

2.5 Consideraciones finales del capítulo ......................................................................22 

CAPÍTULO III. RESULTADOS DE LAS PREDICCIONES REALIZADAS .........................23 

3.1 Descripción del parque solar fotovoltaico analizado ...............................................23 

3.2 Resultados obtenidos para el período de tiempo analizado ....................................24 

3.3 Consideraciones finales del capítulo ......................................................................29 

CONCLUSIONES ............................................................................................................30 

RECOMENDACIONES ....................................................................................................31 

BIBLIOGRAFIA ................................................................................................................32 

 
1 
 

INTRODUCCIÓN 

Actualmente el planeta muestra un incremento de las necesidades energéticas, 

impulsadas por el desarrollo tecnológico y económico de la sociedad. Uno de los grandes 

problemas de la humanidad es su dependencia de los combustibles fósiles, ya que 

provocan un fuerte impacto ambiental, además de diversos cambios en el ámbito 

económico.  

El reto está en conseguir que las energías alternativas y renovables sustituyan 

paulatinamente a los combustibles fósiles tradicionales. La principal ventaja de las 

energías renovables es la de su menor impacto ambiental, ya que, reducen el número de 

contaminantes a la atmósfera, además de su distribución territorial menos concentrada. 

Son fuentes continuas e inagotables de energía, por lo que son la alternativa del futuro.  

Los sistemas fotovoltaicos conectados a las redes eléctricas constituyen una de las 

tecnologías de la generación distribuida de mayor impacto y crecimiento en los últimos 

años. Estos sistemas en los circuitos de distribución ofrecen beneficios ya que reducen 

las pérdidas en las redes e incrementan la confiabilidad y la calidad del suministro de 

energía eléctrica. Uno de los factores fundamentales que incide en las fluctuaciones de la 

tensión es la aparición de los huecos de generación (intervalos de tiempo donde la 

generación disminuye debido principalmente a variables atmosféricas), ocasionados por 

la nubosidad, este y otros problemas todavía no se resuelven satisfactoriamente con las 

fuentes de energía renovables, especialmente con altos niveles de generación.  

Bajo estos conceptos varios análisis tienen que ser realizados con el fin de determinar la 

expectativa real de generación de las plantas fotovoltaicas. Uno de los motivos de la 

importancia que adquieren los diferentes modelos de predicción fotovoltaica es que la 

capacidad anual de energía solar fotovoltaica en el mundo se ha incrementado 

exponencialmente en los últimos diez años. Hoy en día, se trata del tipo de energía más 

barata en un gran número de países debido a que se han abaratado sustancialmente los 

costos de producción de módulos fotovoltaicos [1] 

La predicción de la energía producida por un parque fotovoltaico presenta una gran 

cantidad de aplicaciones tanto para la planificación como para la instalación de plantas 

fotovoltaicas. En este sentido, la aplicación de algoritmos de predicción que dan una 

aproximación de la generación prevista, representa un reto para los ingenieros eléctricos. 

 
2 
 

En algunos trabajos [2] se realiza la predicción de la generación fotovoltaica mediante 

técnicas estadísticas y modelos de regresión. Otros trabajos [3] y [4] emplean modelos 

ARIMA para realizar dicha predicción. Un gran número de publicaciones[5-10]  utilizan las 

técnicas de inteligencia artificial para este fin, fundamentalmente las redes neuronales 

artificiales basadas en MLP (perceptrón multicapa). 

Cuba actualmente cuenta con 72 parque solares fotovoltaicos (PSF) sincronizados al SEN 

y se prevé que para el año 2030, las fuentes renovables de energía representen el 24 % 

de la matriz energética. Por lo que deben incrementarse el número de instalaciones 

fotovoltaicas en todo el país. 

El parque solar fotovoltaico de la UCLV, en la provincia de Villa Clara, posee una potencia 

nominal de 1.1 MW, fue puesto en marcha en el año 2019. Se encuentra ubicado en la 

zona suroeste de la Facultad de Ingeniería Eléctrica de la Universidad Central "Marta 

Abreu” de Las Villas, en los 22.4° de latitud norte y los 79.96° de longitud oeste. Se dispone 

de un amplio grupo de mediciones de las variables siguientes: radiación solar, temperatura 

ambiente, temperatura de los módulos fotovoltaicos y potencia generada. Por lo tanto, se 

tienen los elementos necesarios para realizar el estudio en este parque solar fotovoltaico. 

A partir de todo lo anterior, se plantea como problema de investigación: ¿Cómo predecir la 

generación de energía eléctrica en el parque solar fotovoltaico de la UCLV?  

De acuerdo al problema de investigación, se traza como objetivo general: 

Implementar un algoritmo de predicción de generación fotovoltaica para el parque solar 

fotovoltaico de la UCLV basado en técnicas de inteligencia artificial con deep learning. 

Para dar cumplimiento al mismo, se declaran como objetivos específicos: 

1. Describir los métodos utilizados para la predicción de la generación de energía en 

parques fotovoltaicos. 

2. Analizar estadísticamente de la base de datos para eliminar valores atípicos. 

3. Implementar el modelo de predicción mediante deep learning. 

4. Entrenar el modelo a través de los datos disponibles. 

5. Realizar la predicción de la generación de energía en el parque solar fotovoltaico 

en diferentes horizontes de pronóstico. 

Las tareas científicas que contribuyen al cumplimiento de los objetivos específicos son: 

1. Realización de una búsqueda bibliográfica sobre el tema. 

2. Análisis de los principales métodos utilizados para la predicción de la generación 

de energía en parques fotovoltaicos. 

3. Recopilación de las mediciones del parque solar fotovoltaico y análisis profundo de 

las mismas. 


3 
 

4. Implementación del modelo de predicción en el software Matlab. 

5. Entrenamiento y validación del modelo de predicción. 

Predicción de la generación de energía en el parque solar fotovoltaico en diferentes 

horizontes de tiempo y épocas del año. 

La principal contribución del trabajo radica en el desarrollo de una metodología sencilla 

pero efectivo para el logro del objetivo propuesto con el mínimo error posible, la cual resulta 

aplicable en cualquier parque solar fotovoltaico.  

La estructura del trabajo está compuesta por introducción, tres capítulos, conclusiones, 

recomendaciones, bibliografía y anexos.  

El primer capítulo aborda el estado del arte de los diferentes métodos predictivos utilizados 

a nivel mundial para la predicción de la generación de energía eléctrica en parques solares 

fotovoltaicos según la literatura internacional, así como los fundamentos de la generación 

de energía eléctrica mediante el empleo de módulos fotovoltaicos.  

El segundo capítulo corresponde al desarrollo de la red neuronal artificial mediante 

MATLAB. Se explica las principales características de las redes neuronales artificiales y 

deep lerning, así como Redes neuronales recurrentes del tipo LSTM y la metodología 

utilizada para la implementación y validación del modelo de predicción.  

En el tercer capítulo se describe el parque solar fotovoltaico escogido para realizar la 

predicción y los resultados obtenidos para diferentes épocas del año. 

 
4 
 

CAPÍTULO 1. ESTADO ACTUAL DE LA ENERGÍA SOLAR FOTOVOLTAICA Y 

LOS MÉTODOS DE PREDICCIÓN 

En este capítulo se analizan los principios y fundamentos de la energía solar fotovoltaica, 

así como lo correspondiente al estado del arte de los modelos de predicción de la 

producción eléctrica de los parques solares fotovoltaicos. Se describen algunos de los 

modelos referidos en artículos publicados en la literatura internacional, con las limitaciones 

de dichos modelos de predicción y sus resultados. 

1.1 Comportamiento de la generación fotovoltaica en la actualidad a nivel 

mundial y en Cuba  

La energía solar fotovoltaica actualmente es la segunda fuente de energía renovable 

más actualizada o implementada en el mundo después de la Eólica. Los sistemas 

fotovoltaicos tienen una gran ventaja son de fácil instalación y si costo tiende a disminuir 

debido a que necesitan poco mantenimiento. 

La capacidad instalada de generación de energía solar fotovoltaica en el mundo para 

el año 2014 fue de 177 GW, en el año 2015 se incrementaron 50 GW respecto al año 

anterior logrando un valor histórico de 277 GW y un crecimiento del 25% de esta fuente 

renovable. Para el año 2030 se proyecta que el mix energético, la energía solar tenga 

una participación del 16,6%. 

Entre los años 2000 y 2020 se ha producido un crecimiento exponencial de la 

producción de energía fotovoltaica, duplicándose aproximadamente cada dos años 

(figura 1.1)  

 
Figura 1.1. Comportamiento de la potencia fotovoltaica instalada a nivel mundial en los últimos 

20 años  


5 
 

Actualmente en Cuba se satisface alrededor del 96 % de las necesidades energéticas 

con combustibles fósiles y aproximadamente un 4 % con fuentes renovables. 

Constituye un programa de gobierno cambiar la matriz energética y producir alrededor 

de un 24 % de su energía con fuentes renovables para el año 2030. Para alcanzar esta 

meta, el país está montando parques eólicos y solares fotovoltaicos, así como plantas 

bioeléctricas [11]. En Cuba se desea para el 2030 que más del 30% de la generación 

de energía eléctrica provenga de fuentes renovables de energía. Donde se quiere que 

la energía fotovoltaica posea más del 3% de la producción del país. Con el llamado a 

acelerar este programa, principalmente en el sector de la energía solar fotovoltaica, se 

avanza muy rápido porque especialistas, ingenieros y técnicos de la UNE, han 

alcanzado una alta preparación y ya diseñan, construyen e instalan y operan, con 

facilidad, los sistemas fotovoltaicos. El país posee una fábrica de paneles solares, que 

es, la empresa de componentes electrónicos Ernesto Che Guevara de Pinar del Rio, la 

que produce módulos fotovoltaicos, con una capacidad de 15MW, estos paneles 

también se empezarán a fabricar para viviendas particulares[12].  

 
1.2 Principales variables meteorológicas que intervienen en la predicción 

de generación fotovoltaica  

Las entradas a los modelos de pronóstico tienen una influencia directa en la predicción. 

Precisión: 

Un factor clave para determinar el rendimiento del modelo. Generalmente, La selección 

de entrada imprudente puede causar errores de pronóstico que aumentan el tiempo, 

retraso, costo y complejidad computacional. Por lo tanto, la tasa de precisión baja 

podría aparecer en modelos de pronóstico de alta funcionalidad [13]. 

Los sistemas son principalmente parámetros meteorológicos: radiación solar, 

atmósfera temperatura esférica, temperatura del módulo, velocidad del viento y 

humedad[14],presión barométrica[15],[16],[17]y cambio de aerosoles [18],[19],[20],[21]; 

todos depende de las condiciones climáticas y la ubicación geográfica. Por eso, la 

correlación entre la producción fotovoltaica y las entradas meteorológicas varía y puede 

sea positivo o negativo; fuerte o débil [22]. 

 Uso de datos secundarios: 

En Ref.[23], la influencia del horizonte de pronóstico en la precisión de PVPF fue 

estudiado utilizando datos meteorológicos pronosticados numéricamente a través de 

un vector de soporte regresión (RVS)[24]. comparó dos modelos ST-PVPF: PVPF 

analítico (APVF) y perceptrón multijugador PVPF (MPVF), con ambos modelos explotar 

datos meteorológicos pronosticados numéricamente y valores de horas pasadas para 

la producción de energía eléctrica fotovoltaica. Los valores de RMSE fueron similares; 


6 
 

variar pasando del 11,95% al 12,10%, con el horizonte de previsión siendo todo el día 

horas para predicciones de 24 h por delante.  

 Uso de datos primarios: 

Alomari y col. [25] utilizó dos años de producción de energía fotovoltaica por hora datos 

de la planta de energía solar instalada en Applied Science Private University (ASU) en 

Amman, Jordania. Datos meteorológicos concurrentes medidos donde también se 

consideró la misma ubicación. Los datos se analizaron mediante ANN optimizado por 

el Levenberg-Marquardt (LM) y la Regularización Bayesiana algoritmos de aplicación 

(BR). Los modelos pudieron correlacionar la temperatura, irradiación solar y 

sincronización con energía fotovoltaica generada para tiempo real predicciones diarias. 

Finalmente, el modelo PVPF basado en BR ANN fue seleccionados sobre la base del 

rendimiento. 

 
 Radiación solar: 

La irradiación solar es la energía radiante del Sol emitida en la forma de radiación 

electromagnética. Es directamente proporcional a la cantidad de energía solar que se 

puede invertir y tiene la mayor correlación con la producción de energía fotovoltaica. 

De Giorgi y col. [26]propuso un modelo de previsión de la red neuronal artificial (ANN) 

para analizar la correlaciones de insumos con el rendimiento del modelo. Los errores 

de pronóstico fueron (NRMSE) 12.57%, 12.60% y 10.91% para los vectores de entrada 

del histórico Salida fotovoltaica, irradiación solar y temperatura del módulo, 

respectivamente. Por tanto, el estudio de la correlación entre parámetros 

meteorológicos y La salida fotovoltaica es esencial para el diseño del modelo de 

pronóstico. La Fig.1.2 representa el patrón de irradiación solar y salida fotovoltaica para 

un día específico. El experimento se llevó a cabo en el techo de un instituto. 

edificio nacional de la Universidad de Malaya (latitud ¼ 03 09 0 N; longitud ¼ 101 41 0 

E) Kuala Lumpur, Malasia [14]. La potencia fotovoltaica varió de 7 a. m. a 7 p. m. (desde 

el amanecer hasta el anochecer) y su magnitud siguió la tendencia de la intensidad de 

la irradiación solar. A medida que avanzaba el día, la salida fotovoltaica aumentó y 

alcanzó su punto máximo durante el mediodía; el momento en que la irradiación solar 

es más intenso. 

La figura.1.3 muestra una correlación positiva entre la salida de potencia fotovoltaica y 

irradiación solar para el mismo experimento. El coeficiente de correlación R 2 fue 0,988, 

lo que indica que la irradiación solar es una entrada más significativa para el pronóstico. 

Temperatura: 

La temperatura es una magnitud física que mide la intensidad de calor disponible en 

una sustancia, objeto o ambiente. Esta entrada parámetro es muy probable o poco 

https://translate.googleusercontent.com/translate_f#7
https://translate.googleusercontent.com/translate_f#8


7 
 

probable es un coeficiente de generación de energía fotovoltaica. Algunos estudios de 

investigación indicaron que existe una inadecuada correlación entre la temperatura 

ambiente y la potencia de salida fotovoltaica. La fig.1.4 representa la correlación entre 

la temperatura atmosférica y producción fotovoltaica para el mismo trabajo de 

investigación. El coeficiente de correlación R 2 es menos significativo en 0.3776. Los 

investigadores también encontraron que no había correlación entre la temperatura 

atmosférica y la salida fotovoltaica durante anochecer; por obvias razones 

 
Fig. 1.2 Curva de irradiación solar y salida fotovoltaica para un día específico [22] 

 
Fig.1.3 Correlación entre la irradiación solar y la producción de energía fotovoltaica 
paneles [22] 
 

Fig.1.4 Correlación entre la temperatura atmosférica y la producción de energía fotovoltaica 
paneles [22] 

 
8 
 

Velocidad del viento y temperatura de la celda: 

La velocidad del viento es una entrada crucial en los modelos PVPF, pero debido a su 

interacción de naturaleza moderada, introduce importantes incertidumbres [27],[28]. Su 

principal función es la disipación de calor y la reducción de la temperatura de la celda 

fotovoltaica. Generalmente, la eficiencia de los fotovoltaicos depende de la temperatura 

del módulo, que aumenta durante el funcionamiento debido a cambios en la temperatura 

ambiente o debido a la radiación absorbida por él. Por lo tanto, tanto la temperatura del 

viento como la de la celda, los valores son importantes y están vinculados. 

En Ref. [29], los autores analizaron los datos de velocidad y dirección del viento de su 

sistema fotovoltaico solar ASU para construir su conjunto de ANN modelos para PVPF. 

Descubrieron que los datos de la dirección del viento a 36 m de altitud, donde se instaló 

su planta fotovoltaica, demostrado binario o constante valores durante los últimos 1,6 

años; y, por lo tanto, fue excluido. Sin embargo, se incluyó la velocidad del viento y su 

modelo de conjunto fue superior a enfoques establecidos: persistencia inteligente y 

modelos RNA individuales. 

Marca de tiempo: 

La marca de tiempo del clima juega un papel importante en la precisión del modelo 

PVPF. En Ref. [29] la marca de tiempo actual (en horas comenzando desde el inicio de 

cada año, representado como T ( t , d )) fue optimizado por el método de prueba y error y 

se observó que el pasados i ¼ 5 días (utilizado como dimensión de inserción) tendía a 

proporcionar la PVPF diario más preciso. 

La marca de tiempo (hora del día estudiado) introduce incertidumbre en 

la previsión [29]que es significativo durante el mediodía (debido a una mayor 

variaciones climáticas) en comparación con las primeras horas o las últimas horas de la 

noche. 

Además, estas incertidumbres de las predicciones de poder cambian dependiendo en el 

lugar y la temporada. Por lo tanto, desarrollar un nuevo modelo PVPF para 

una nueva región, los datos de marca de tiempo deben optimizarse para obtener la 

período de tiempo óptimo requerido [29]. 

Se recomiendan las RNA [29]para este propósito de PVPF ya que estas redes 

Los trabajos pueden dilucidar las complejas relaciones de entrada / salida, como las 

marca de tiempo y datos meteorológicos históricos con salida fotovoltaica. En Ref. [25] el 

los autores también utilizaron la marca de tiempo (desde el comienzo del año actual  

Td ( t)) y vectores de entrada meteorológicos ( Wd ( t )) para el mismo tiempo ( t ), con el 

período 

pasados cinco días antes del día (d), para desarrollar dos PVPF basados en ANN 

modelos que utilizan algoritmos LM y BR 


9 
 

1.3 Predicción de la generación de energía en sistemas fotovoltaico 

Actualmente una de las características  distintivas de la energía eléctrica generada en 

parques solares fotovoltaicos es su carácter no gestionable, debido fundamentalmente 

a un régimen de generación eléctrica con alta intermitencia en función de la evolución 

de las condiciones climatológicas, sobre todo de la cobertura de nubes que puede 

presentar importantes cambios en intervalos cortos de tiempo; imposibilidad de control 

de la producción eléctrica ya que se genera toda la energía  eléctrica que el sol aporte, 

sin que sea posible aumentar esa energía eléctrica; y escasa fiabilidad en los valores 

futuros de la producción de energía eléctrica frente a los programas de la generación 

eléctrica de las centrales clásicas no obstante, los últimos avances científicos permiten 

simular el comportamiento de la atmósfera y el océano mediante modelos, que, junto 

con el incremento de la potencia de cálculo en las nuevas computadoras, logran realizar 

unas predicciones del tiempo cada vez más exactas. 

La predicción de la generación fotovoltaica permite llevar a cabo una planificación 

energética apropiada, lo que ayuda a realizar un cálculo de la reserva de generación, 

y por lo tanto tiene consecuencias económicas positivas. Además, otro de los motivos 

de la importancia de la predicción es poder dar solución a los problemas que pueden 

surgir en la red eléctrica. En los últimos diez años junto con el desarrollo de la energía 

solar fotovoltaica se han estudiado disímiles modelos de predicción, entre los que se 

destacan fundamentalmente el uso de modelos grises, redes neuronales artificiales, 

modelos atmosféricos, modelos difusos, modelos híbridos, modelos ARIMA, entre 

otros. 

 
1.3.1 Ventajas de la predicción 

Los sistemas eléctricos de potencia presentan como problema característico la 

imposibilidad de poder almacenar energía eléctrica a gran escala. Además, la fiabilidad 

de un sistema eléctrico radica en asegurar el suministro continuo de la energía 

eléctrica a sus clientes con el mínimo de interrupciones posibles. Es evidente que 

desde la puesta en funcionamiento de los sistemas eléctricos se hace necesario 

disponer de métodos de predicción de valores futuros de la demanda de energía 

eléctrica. Precisamente una de las primeras variables que fue objeto de atención por 

los especialistas fue la demanda de energía eléctrica. La predicción de esta variable 

se utiliza para la planificación de la energía eléctrica producida, en las compras de 

combustibles para las centrales eléctricas, para la secuenciación de los períodos de 


10 
 

mantenimiento de los elementos del sistema eléctrico y para la planificación de las 

redes eléctricas. 

El creciente aumento de la interconexión de los parques solares fotovoltaicos a los 

sistemas eléctricos trae como consecuencia disponer de herramientas para la 

predicción de la generación eléctrica en parques solares fotovoltaicos, por las 

repercusiones económicas que un conocimiento de antemano de los valores de 

energía generada puede tener en la determinación de la programación de las centrales 

eléctricas clásicas, y en las unidades generadoras convencionales. 

Por lo tanto, existe una doble necesidad de predicción de la energía eléctrica producida 

en los parques solares fotovoltaicos: por una parte, el operador del sistema eléctrico 

necesita conocer de antemano la potencia eléctrica que se va a inyectar en el sistema 

para un período de programación sobre una base horaria; y, además, el operador 

necesita el nodo en el que se va a inyectar esa potencia eléctrica para poder realizar 

los análisis del funcionamiento previsto del sistema [30]. 

1.3.2 Horizontes de predicción 

El horizonte de predicción se considera como el período de tiempo que determina el 

momento futuro para el que se realizan las predicciones, el cual se debe tomar en 

cuenta desde el primer momento de diseño para el desarrollo de cualquier modelo de 

predicción. 

No existe unanimidad en cuanto al horizonte de predicción que debe ser utilizado para 

el desarrollo de cualquier modelo de predicción, ya sea para la predicción de 

generación de potencia eléctrica en parques solares fotovoltaicos, como para otras 

aplicaciones.   

Según [30],  se pueden clasificar en: 

 Predicción a muy corto plazo: el horizonte de predicción es de unas horas, no existe 

unanimidad en su valor, así, como en sus valores extremos. La referencia [31] 

propone cuatro horas, mientras  la [32] propone nueve horas. Para el operador de 

la red eléctrica estas predicciones son de interés para el mantenimiento de la 

seguridad del sistema eléctrico.  

 Predicción a corto plazo: el horizonte de predicción abarca desde el límite con el de 

muy corto plazo hasta las 48 o 72 horas. Esta predicción es la de mayor interés 

para poder actuar en el mercado diario eléctrico [33].  

 Predicciones a largo plazo: corresponden a un horizonte por encima de las 48 ó 72 

horas y llegan hasta un límite de siete días. Cuanto mayor sea el horizonte, mayores 


11 
 

son los errores de predicción, pues hoy en día resulta difícil realizar predicciones 

fiables de variables atmosféricas por encima de esos siete días. Estas predicciones 

pueden ser de interés en la programación del sistema de generación de centrales 

eléctricas convencionales, o en la programación de las labores de mantenimiento 

de esas centrales [33]. 

 Algunas bibliografías como [32] proponen además un horizonte de predicción de 

mediano plazo que contempla los límites entre tres a cinco días principalmente para 

su uso en la programación del sistema de generación de centrales eléctricas 

convencionales.   

Dada la importante trascendencia económica del tema, la mayor parte de los 

trabajos publicados [30, 33-38] se han centrado en la predicción de la generación 

eléctrica a corto plazo, sobre todo para el día siguiente (24 horas) 

1.3.3 Métricas para determinar la incertidumbre en la predicción 

Los modelos que se usan para las predicciones de la generación eléctrica pueden 

emplear como datos de entrada variables meteorológicas que influyan sobre el 

comportamiento de la producción del parque solar fotovoltaico que se analiza 

(radiación solar, temperatura ambiente, humedad relativa, cobertura de nubes, 

posición y altitud del sol, presión, entre otras). Estos datos meteorológicos se obtienen 

principalmente de las predicciones meteorológicas generadas por los modelos 

atmosféricos. Estos son, generalmente, propiedad de los institutos meteorológicos 

nacionales, que proporcionan las predicciones de los valores numéricos de las 

variables meteorológicas. A partir de estos valores numéricos, se calcula la predicción 

de la potencia eléctrica generada en un parque solar fotovoltaico mediante el uso de 

métodos estadísticos o simplemente algún modelo de predicción existente. Pero la 

predicción de la generación eléctrica de estos últimos modelos tiene una gran 

limitación: los modelos de predicción de la generación eléctrica no pueden mejorar las 

predicciones de los modelos atmosféricos. 

Las principales fuentes de error en los modelos atmosféricos pueden ser desde un 

deficiente modelado de la superficie del terreno, hasta condiciones iniciales 

incorrectas, consecuencia de errores en el proceso de medida o interpretación de las 

variables meteorológicas que define el estado de partida de la atmósfera. El error 

causado por un deficiente modelado de la superficie del terreno, puede ser corregido 

estadísticamente. El error por condiciones iniciales incorrectas no puede ser corregido 

de antemano y es responsable de diferencias importantes entre los valores de 

predicción y los reales [30]. 


12 
 

Por lo tanto, se puede decir que la predicción de la potencia eléctrica generada por un 

parque solar fotovoltaico constituye una tarea difícil, no exenta de importantes errores. 

Pero a pesar de su dificultad, resulta imprescindible, tanto desde el punto de vista 

técnico como económico. 

1.4 Principales modelos de predicción que se utilizan actualmente 

Hasta el año 2010 la investigación y el desarrollo de modelos de predicción de 

generación fotovoltaica era mínima. La mayor parte de los modelos se basaban en 

la predicción de la radiación que incide sobre el parque solar fotovoltaico y se 

calculaba la potencia eléctrica producida a partir de dichos valores. Para esto 

generalmente se utiliza las curvas proporcionadas por el fabricante del panel solar 

fotovoltaico o una serie de ecuaciones o relaciones empíricas conocidas[39, 40].A 

partir del año 2011 la publicación de nuevos modelos de predicción fotovoltaicos ha 

crecido considerablemente debido al aumento exponencial en los últimos diez años 

de la energía solar fotovoltaica en todo el mundo, así como los estudios sobre las 

características de dicha fuente de energía. 

Hoy en día, gracias al desarrollo alcanzado por los diferentes modelos utilizados 

para la predicción se puede realizar varias clasificaciones que dependen del criterio 

que se tenga en cuenta. Algunos criterios consideran la linealidad del modelo y los 

clasifica en lineales y no lineales. Otros toman en cuenta el método utilizado para el 

desarrollo matemático del modelo y los clasifican en modelos basados en técnicas 

de inteligencia artificial o en modelos regresivos. Aunque la clasificación más 

adecuada según [30] para comparar los datos de forma apropiada es:  

 Modelos basados en valores pasados: utilizan como entrada únicamente valores 

pasados, que pueden ser únicamente de la variable a predecir o de la variable a 

predecir complementada con otras variables que puedan influir sobre la misma. 

Dentro de estas variables se pueden incluir no solo las correspondientes al instante 

de tiempo en que se dieron, sino que pueden tratarse de variables meteorológicas 

medidas localmente en dichos instantes pasados. 

 Modelos atmosféricos: estos modelos incorporan como entrada los valores de 

predicción de variables meteorológicas obtenidas por los programas de predicción 

numérica existentes en diferentes institutos meteorológicos, además, dichas 

entradas pueden estar complementadas por las indicadas en el grupo anterior. 

Los principales modelos de predicción que se utilizan actualmente son: 

 Modelos ARIMA [4] 

 Sistema de Interferencia difusa o fuzzy  

 Redes Neuronales Artificiales (ANN)  


13 
 

 Modelos Híbridos 

 Existen muchos otros modelos de predicción de series temporales, utilizados en la 

predicción de energías renovables como la eólica y la solar fotovoltaica [30]. Ente 

ellos se encuentran los modelos grises, Máquina de vectores soporte (SVMs), 

Modelo de cielo claro (día claro) y Modelo de los k vecinos más próximos (k-NN) 

 
1.5 Consideraciones finales del capitulo  

Mediante la revisión bibliográfica, se realiza un recorrido por el estado actual de 

desarrollo de la energía solar fotovoltaica, así como los métodos de predicción más 

utilizados a nivel mundial para la predicción de la generación de energía eléctrica en 

parques solares fotovoltaicos. Se pudo constatar que en los últimos años la 

inteligencia artificial, específicamente las redes neuronales artificiales, han ganado 

en popularidad en todas sus variantes. De ellas el perceptrón multicapa es muy 

popular por tener gran éxito como aproximador universal de funciones y en un gran 

número de aplicaciones.  

 
14 
 

CAPÍTULO II. PROGRAMA PARA LA PREDICCIÓN DE LA 

GENERACIÓN DE ENERGÍA MEDIANTE TÉCNICAS DE 

INTELIGENCIA ARTIFICIAL CON DEEP LEARNING 

 
En este capítulo se aborda todo lo relacionado con las redes neuronales artificiales 

y deep learning, así como las redes neuronales recurrentes y del tipo LSTM y por 

último se ve la metodología utilizada para la implementación y validación del modelo 

de predicción con la ayuda del MATLAB. 

 
2.1 Principales características de las redes neuronales artificiales y deep 

learning 

Una red neuronal artificial (ANN) se define como un esquema de computación 

distribuida o computación en malla, que se inspira en la estructura del sistema 

nervioso de un ser humano. En su forma más básica, una red neuronal contiene 

múltiples procesadores elementales conectados, conocidos como neuronas, que 

forman un sistema adaptativo el cual mediante un algoritmo de aprendizaje es capaz 

de ajustar los pesos sinápticos1 para alcanzar los requerimientos de desempeño de 

un problema dado. El proceso mediante el cual la red neuronal ajusta los pesos 

sinápticos para lograr un determinado objetivo, se denomina entrenamiento o 

aprendizaje, y el procedimiento para llegar a este cometido se denomina algoritmo 

de aprendizaje o entrenamiento[41]:  

Cada neurona que forma una red, tiene cuatro elementos básicos:  

  Un conjunto de conexiones, pesos o sinapsis que determinan el comportamiento de 

la neurona.  

 Un sumador, el cual se encarga de sumar todos los pesos que han sido multiplicados 

por el valor de cada peso o sinapsis de la conexión. 

 Una función de activación no lineal, que permite limitar la amplitud de la señal de 

salida de cada neurona.  

 Y, un umbral que determina cuando se activa la neurona. 

 
15 
 

Fig. 2.1. Esquema de Modelo Neurona[41] 

 
Las ANN tienen la propiedad de aprender a partir de un conjunto de patrones o datos de 

entrenamiento, es decir, tienen la capacidad de encontrar un modelo que ajuste los datos. 

En esta etapa de aprendizaje, el modelo busca minimizar el error entre la salida obtenida 

por la red y la salida deseada por el usuario ante un conjunto de datos de entrenamiento. 

Este proceso de entrenamiento puede ser supervisado o no supervisado[42]:  

 El proceso de aprendizaje supervisado consiste en entrenar la red neuronal a partir 

de un conjunto de datos de entrada y sus respectivas salidas, el algoritmo de 

aprendizaje ajusta los parámetros de la red de tal manera que la salida generada 

por la ANN se ajuste a los datos de salida dada una cierta entrada. Se dice que es 

supervisado ya que se conoce desde el inicio cual es el patrón de salida.  

 El aprendizaje no supervisado, en cambio, solamente entrega a la ANN un 

conjunto de datos de entrada, y el objetivo del algoritmo de aprendizaje es ajustar 

los pesos de la red hasta que este encuentre alguna estructura de los datos de 

entrada.  

Las neuronas que conforman una red neuronal, forman distintas arquitecturas de 

conexión, que pueden clasificarse de la siguiente manera[41]:  

 Según el número de capas:  

1-Monocapa, tiene una capa de neuronas que proyectan las entradas a una capa de 

neuronas de salida la cual realiza los diferentes cálculos.  

2- Multicapa, una generalización de la anterior la cual posee un conjunto de capas 

intermedias entre la entrada y la salida, llamadas capas ocultas.  

 Según el tipo de conexiones: 

1-No Recurrentes, en estas redes la propagación de las señales se realiza en un solo 

sentido, no existe retroalimentación.  


16 
 

2- Recurrentes, estas redes poseen lazos de retroalimentación que pueden ser entre 

neuronas de diferentes capas, de la misma capa o de la misma  

 Según el grado de conexión:  

1- Totalmente conectadas, las neuronas de una capa tienen conexión total con las 

neuronas de la siguiente capa (no recurrente) o de la capa anterior (recurrente)  

2- Parcialmente conectadas, no existe conexión total entre neuronas de las diferentes 

capas.  

 
2.2 Redes neuronales recurrentes 

Como se observó anteriormente, las redes recurrentes son un tipo de red neuronal 

dinámica, ya que el cálculo de una entrada, en un paso determinado depende del paso 

anterior, y ciertos casos dependen de un paso futuro.  

Esencialmente este tipo de redes neuronales son utilizadas para el tratamiento de 

secuencias, análisis de trayectorias, predicciones no lineales y modelación de sistemas 

dinámicos [43].  

Dependiendo del grado de conexión de las neuronas que conforman las redes 

recurrentes, estas pueden clasificarse en dos [43]: 

 Parcialmente recurrentes, donde las conexiones recurrentes son fijas. Conexiones 

que generalmente son hacia adelante, pero se incluye un conjunto de conexiones 

de retroalimentación. 

 Totalmente recurrentes, donde cada neurona puede estar conectada a cualquier 

otra neurona (full mesh) y las conexiones recurrentes son variables 

 
Fig. 2.2 Izquierda: Red Parcialmente Recurrente Derecha: Red Completamente recurrente  


17 
 

Tomando en cuenta solamente las redes parcialmente recurrentes [44], estas poseen dos 

tipos de modelos: la red simple recurrente de Elman (1990) y la red secuencial de Jordan 

(1986). Ambos tipos de son utilizados en la modelización de series temporales.  

Mientras que, en las redes totalmente recurrentes, se destacan los modelos: RTRL (Real-

Time Recurrent Learning), TDRB (Time-Dependent Recurrent Back Propagation) y LSTM 

(Long short-term memory). Los dos primeros modelos antes mencionados son utilizados 

generalmente para aplicaciones que requieren aprendizaje en vivo, típicamente utilizados 

en el ámbito industrial.  

El modelo LSTM es una arquitectura particular de una red totalmente recurrente, 

propuesta por Hochreiter y Schmidhuber (1997), que surge para solventar algunas 

dificultades presentadas en las redes totalmente recurrentes RTRL y TDRB.  

Las RNN tienen dos métodos de entrenamiento: la retropropagación y el aprendizaje 

recurrente a tiempo real. El primer método es un algoritmo de aprendizaje en el cual, un 

conjunto de datos de entrada se propaga a través de la red neuronal hasta la capa de 

salida, una vez en este punto se calcula el error producido, y el error es transmitido hacia 

atrás a las neuronas de las capas ocultas, en base a este error la red neuronal cambia los 

pesos de las conexiones en cada neurona. Este método utiliza el gradiente descendiente 

para definir la función que proporciona el error que comete la red neuronal, ante un 

determinado conjunto de pesos sinápticos. El objetivo de este entrenamiento es encontrar 

la configuración de pesos sinápticos que corresponda al mínimo global de la función de 

error.  

El segundo método de entrenamiento tiene una complejidad de cálculo mucho mayor a la 

que presenta el primer método. Este método tiene la capacidad de ajustar los pesos 

sinápticos de la red en tiempo real, es decir, mientras la red continúa realizando su función 

de procesamiento. De manera general, este método hace uso del gradiente descendiente 

para calcular la función de error en cada instante del tiempo[45]. 

 
2.3 Redes neuronales recurrentes del tipo LSTM 

Es un tipo específico de arquitectura de RNN, diseñado para modelar secuencias 

temporales en dependencias de largo alcance, más precisamente que las RNN 

convencionales. Las redes LSTM tienen unas unidades especiales llamadas bloques de 

memoria en la capa recurrente oculta. Cada uno de estos bloques de memoria contiene 

una celda de memoria con auto-conexiones que almacena el estado temporal de la red, 

además cuentan con unidades multiplicativas llamadas gates que controlan el flujo de 

información de la red. Cada bloque de memoria tiene un gate de entrada y de salida [46]. 


18 
 

Fig2.3. Bloque de memoria LSTM  

La arquitectura LTSM aborda el inconveniente que poseen las RNN convencionales en 

dependencias a largo plazo, debido a problemas con el gradiente de la red en cálculo del 

error. Este problema se produce ya que en redes profundas como las RNN, los 

gradientes de la red son calculados como un producto de diferenciales, entrenar estas 

redes a lo largo del tiempo, puede llevar al gradiente a desaparecer (Vanishing) o 

acumular grandes gradientes de error lo que dan como resultado actualizaciones de 

pesos muy grandes (Exploding)[47]. 

2.4 Metodología utilizada para la implementación y validación del modelo de 

predicción 

En la fig.2.4 se muestra un resumen de la metodología de trabajo utilizada para realizar la 

predicción de la potencia generada en una instalación fotovoltaica.  

 
Fig.2.4 Metodología para la predicción de la generación fotovoltaica. 


19 
 

Se parte inicialmente de una base de datos del parque UCLV, esta base de datos contiene 

mediciones de varias variables (radiación solar, temperatura ambiente, temperatura de los 

módulos, velocidad y dirección del viento, potencia activa y reactiva) desde julio de 2018 

hasta abril de 2021. 

El primer paso consiste en realizar una limpieza de datos atípicos (esto se conoce en la 

literatura como outliers, aquí puedes encontrar valores inconsistentes o sea que no se 

corresponden con los valores típicos de la serie de tiempo en la que se enmarcan). 

Entonces debemos eliminar estos valores para que el modelo de predicción que se 

desarrolle no se vea afectado negativamente. 

Después que se eliminan esos valores atípicos y otros valores erróneos que pueden ser 

valores no numéricos o inconsistentes, entonces se pasa al siguiente paso que es el 

análisis estadístico. 

En nuestro estudio analizamos la correlación de cada variable con respecto a la potencia 

activa generada que es nuestra variable objetivo, o sea lo que deseamos predecir. Las 

variables velocidad y dirección del viento al parecer tienen problemas en la base de datos 

y sus correlaciones no son adecuadas por lo tanto las excluimos del estudio. 

Entonces finalmente seleccionamos las variables de entrada y salida al modelo, en este 

caso: 

Variables de entrada: radiación solar, temperatura ambiente, temperatura de modulo y 

como es un modelo LSTM también se toma como entrad la potencia activa. 

Variables de salida: potencia activa generada. 

 
Modelo de predicción a utilizar: Se decide utilizar un modelo LSTM o Long Short Term 

Memory, este modelo es una red neuronal recurrente con aprendizaje profundo que utiliza, 

utiliza una celda de memoria que le permite aprender dependencias a largo plazo en 

comparación con las RNN simples. Todo esto hace que el LSTM sea un modelo robusto y 

que brinde resultados adecuados en la predicción de la generación PV. 

 Normalizar los datos: Antes de entrenar el modelo con los datos disponibles es necesario 

que estos sean y normalizados, esto significa que todos se encuentren en el mismo rango, 

que bien pude ser entre 0 y 1 o entre -1 y +1. Paro esto existen varios criterios, pero se 

utilizó el siguiente: 


20 
 

Consiste en determinar la media y la desviación estándar de cada vector que forma las 

variables de entrada y de salida y luego aplicar la ecuación (1). 

𝑎′ =
𝑎 − 𝑉𝑚𝑒𝑑𝑖𝑎

𝑉𝑠𝑡𝑑
     (1) 

Donde: 

a: es el valor de la variable de entrada o salida. 

Vmedia y Vstd: son los valores de la media y la desviación estándar del vector de entrada o 

salida. 

Este método se recomienda en la bibliografía consultada [48][48] y garantiza que los 

valores de entrada y salida queden estandarizados en el intervalo [-1,1]. Además, al 

trabajar con parámetros estadísticos se obtiene mayor calidad en este proceso. 

El código utilizado es el siguiente 

 
Entrenar el modelo de predicción:  

Lo primero es definir la arquitectura del modelo LSTM, esto te lo muestro en la figura 

siguiente: 

 
Fig.2.5 Arquitectura del modelo LSTM 

 
21 
 

Los tres primeros parámetros corresponden a las entrad, las salidas y la cantidad de 

unidades ocultas del modelo LSTM. 

Lo demás son aspectos propios del modelo, como la cantidad de capas, la conexión entre 

las capaz y las opciones entrenamiento. 

Para el entrenamiento de la red se utiliza este código: 

 
Después de esto es cuando la programación se pone difícil, pues vienen unas cuantas 

líneas de código para que todo esto funcione y para obtener los resultados. 

Para validar el modelo se utilizan datos que no formaron parte del conjunto de datos de 

entrenamiento para validar.  O sea, inicialmente los datos se dividen el 90 % para 

entrenamiento y el 10 % para la prueba, ese 10% es el que se utiliza para demostrar que 

el LSTM aprendió correctamente las relaciones y los patrones de los datos de entrada. 

Para determinar el error de predicción existen varias formas o métricas como también 

se les llama, en este caso se utilizaron las siguientes: 

La estimación del rendimiento es fundamental para evaluar la precisión de las previsiones 

de un modelo. Las herramientas comunes incluyen: Error absoluto medio (MAE), Error de 

porcentaje absoluto medio (MAPE) y Error cuadrático medio (RMSE). El MAE estima la 

significancia promedio de los errores en un conjunto de datos de pronósticos promediando 

las diferencias entre las observaciones reales y los resultados previstos de toda la muestra 

de prueba, dando a todas las discrepancias individuales el mismo peso. De manera similar, 

RMSE estima el valor medio del error utilizando la raíz cuadrada del promedio de las 

diferencias al cuadrado entre los valores pronosticados y las observaciones reales. Por lo 

tanto, es más robusto para tratar grandes desviaciones que son especialmente 

indeseables, lo que le da al investigador la capacidad de identificar y eliminar valores 

atípicos. Sin embargo, ambas métricas promedio (MAE y RMSE) pueden variar de cero a 

infinito. Por el contrario, MAPE es una técnica de predicción estándar que mide la precisión 

de la predicción y justifica la diversidad de predicciones para conjuntos de datos reales. 

Las ecuaciones de estas métricas son las siguientes: 

𝑀𝐴𝐸 =
1

𝑁
∑ |𝑦𝑗 − 𝑡𝑗|𝑁

𝑖=1            (7) 

𝑅𝑀𝑆𝐸 = √1

𝑁
∑ (𝑦𝑗 − 𝑡𝑗)𝑁

𝑖=1

2
          (8) 

𝑀𝐴𝑃𝐸 =
1

𝑁
∑

|𝑦𝑗−𝑡𝑗|

𝑦𝑗

𝑁
𝑖=1 × 100%     (9) 


22 
 

donde 𝑦𝑗 y 𝑡𝑗 son los valores medidos y pronosticados correspondientes de la potencia 

fotovoltaica y 𝑁 es el número de muestras de prueba 

 
2.5 Consideraciones finales del capítulo 

A partir del análisis realizado en el presente capítulo se decide utilizar una red neuronal 

recurrente del tipo LSTM para realizar la predicción de la generación de energía eléctrica 

en el parque solar fotovoltaico de la UCLV en la provincia de Villa Clara. La red neuronal   

utiliza una celda de memoria que le permite aprender dependencias a largo plazo en 

comparación con las RNN simples.  

 
23 
 

CAPÍTULO III. RESULTADOS DE LAS PREDICCIONES 

REALIZADAS 

En este capítulo se realiza una pequeña descripción del parque solar fotovoltaico que se 

analiza, así como los resultados que se obtienen mediante la simulación de la red neuronal 

recurrente. En este proceso una de las opciones que mejor resultado aportó, fue la división 

de los datos en correspondencia con las estaciones del año. O sea, se toman las 

mediciones de un año de trabajo de la planta fotovoltaica y se dividen en períodos de tres 

meses de forma tal que cada período corresponda a una estación del año bajo estudio. 

 
3.1 Descripción del parque solar fotovoltaico analizado 

 
El parque solar fotovoltaico de la UCLV, en la provincia de Villa Clara, posee una potencia 

nominal de 1.1 MW, fue puesto en marcha en el año 2019. Se encuentra ubicado en la 

zona suroeste de la Facultad de Ingeniería Eléctrica de la Universidad Central "Marta 

Abreu” de Las Villas, en los 22.4° de latitud norte y los 79.96° de longitud oeste. Se dispone 

de un amplio grupo de mediciones de las variables siguientes: radiación solar, temperatura 

ambiente, temperatura de los módulos fotovoltaicos y potencia generada. 

 
Figura3.: Parque solar fotovoltaico de la UCLV. 

 
24 
 

3.2 Resultados obtenidos para el período de tiempo analizado 

 
Análisis estadísticos de los datos:  

Se dispone de una base de datos que contiene mediciones de potencia activa generada, 

potencia reactiva, radiación solar, temperatura ambiente, temperatura de los módulos 

fotovoltaicos, velocidad y dirección del viento. Dichas mediciones fueron tomadas en 

intervalos de tiempo de una hora desde julio de 2018 hasta abril de 2021. La fig.3.2 muestra 

un fragmento de la base de datos. 

 
Fig.3.1: Fragmento de la base de datos del PFV de la UCLV [Fuente: Elaboración propia] 

 
Debe aclararse que con vistas a reducir la carga computacional de los modelos de 

predicción y reducir el tiempo de entrenamiento de los mismos se aplicó un proceso de 

filtrado de datos. En dicho proceso se removieron de la base de datos todas las mediciones 

correspondientes al horario nocturno donde la planta no está generando potencia activa. 

Por tanto, solo se analizan 14 mediciones en cada día, correspondientes con el horario 

de trabajo de la planta comprendido entre las 6:00 am y las 20:00 pm.  

En la tabla 1 se resumen los principales indicadores estadísticos para la variable potencia 

activa generada, aunque es válido señalar que dicho análisis se realizó para cada una de 

las variables presentes en la base de datos.  

 
25 
 

Tabla 1. Análisis estadístico de la potencia activa generada 

Año 2018 2019 2020 2021 Periodo 

Media 0.31 0.38 0.34 0.39 0.35 

Desviación 
estándar 

0.33 0.33 0.32 0.32 0.33 

Mínimo  
0 0 0 0 0 

Media 0.19 0.30 0.34 0.31 0.37 

Máximo  1.03 1.05  1.05 1.01 1.03 

 
Un aspecto de gran importancia resulta el análisis de correlación de los datos, pues permite 

definir cuáles son las variables a tener en cuenta en un modelo de predicción. En el caso 

que se presenta se tiene una base de datos del parque UCLV que contiene series de tiempo 

de varias variables por un período de tiempo cercano a los 3 años. La variable que se 

desea predecir es la potencia activa generada en la instalación. Por tanto, en el análisis de 

correlación se analiza cada una de las variables con respecto a la potencia activa 

generada. 

Para las variables velocidad del viento y dirección del viento no se muestra el resultado del 

análisis de correlación, pues las mediciones de estas variables presentaban una gran 

cantidad de errores que provocaron que sus valores de correlación se encontraran 

totalmente fuera de rango. 

En el caso de la variable potencia reactiva no se analiza su correlación con respecto a la 

potencia activa generada pues la potencia reactiva depende de la potencia activa y no 

tendría sentido utilizarla como una entrada al modelo de predicción. 

En la tabla 2 se muestran los valores de correlación de las diferentes variables presentes 

en la base de datos respecto a la potencia activa generada. 

Como se observa en la tabla anterior la mayor correlación con respecto a la potencia 

activa generada la presenta la variable radiación solar, seguida por la temperatura de los 

módulos y la temperatura ambiente. Estos valores de correlación se encuentran en el 

rango establecido por la referencia [38], lo que permite que estas variables se puedan 

considerar como entradas al modelo de predicción.  


26 
 

Tabla 2. Valores del coeficiente de correlación con respecto a la potencia activa generada 

Valores del coeficiente de 
correlación de las diferentes 
variables respecto a la 
potencia activa generada  

 
Años analizados  

 
2018  

 
2019 2020 2021 

Radiación solar 
0.9968  

 
0.9966  

 
0.9968  

 
0.9975  

 
Temperatura de los módulos  

 
0.7898  

 
0.7781  

 
0.7752  

 
0.7819  

 
Temperatura ambiente  

 
0.7242  

 
0.6840  

 
0.6683  

 
0.6890  

 
Resultados de la predicción mediante el modelo LSTM  

Como se explicó en el inicio del trabajo, el modelo de predicción seleccionado para 

realizar el pronóstico de la generación fotovoltaica es el LSTM, recomendado 

actualmente en un número considerable de publicaciones, debido a sus ventajas y a su 

probada efectividad para aprender dependencias a largo plazo en comparación con las 

RNN simples.  

En este caso se dispone de una amplia base de datos de una instalación fotovoltaica. En 

el proceso de trabajo y entrenamiento del modelo LSTM se probaron un gran número de 

variantes posibles de división de la base de datos. En este proceso una de las opciones 

que mejor resultado aportó, fue la división de los datos en correspondencia con las 

estaciones del año. O sea, se toman las mediciones de un año de trabajo de la planta 

fotovoltaica y se dividen en períodos de tres meses de forma tal que cada período 

corresponda a una estación del año bajo estudio.  

Para el entrenamiento del modelo LSTM se toma el 90 % de los datos de la estación y el 

10% restante se utiliza para probar su desempeño. Debe señalarse que la ventaja de 

este modelo radica en que basado en los datos históricos de la instalación fotovoltaica es 

capaz de realizar predicciones para horizontes de tiempo futuros con una exactitud 

adecuada y sin necesidad de depender de predicciones de otros modelos meteorológicos 

o físicos.  


27 
 

Para analizar el desempeño del modelo propuesto se presentan las predicciones realizadas 

para la potencia activa generada en la instalación fotovoltaica para tres días de diferente 

comportamiento (día soleado, día nublado y día con sol y algunas nubes). En este caso se 

realiza una predicción a corto plazo (para las 14 horas del día siguiente). Esto se puede 

observar en las figuras 3.2 y 3.3 respectivamente. En dichas figuras también se muestra el 

comportamiento del error de predicción a lo largo del día, en este caso el RMSE. 

 
Fig. 3.2 : Predicción a corto plazo de generación PV para un día soleado. [Fuente: Elaboración 

propia] 

 
28 
 

Fig.3.4: Predicción a corto plazo de generación PV para un día nublado. [Fuente: Elaboración 

propia] 

 
Fig.3.5: Predicción a corto plazo de generación PV para un día con sol y algunas nubes.  
[Fuente: Elaboración propia] 

Como se puede observar en las figuras anteriores las predicciones realizadas en los tres 

casos analizados son acertadas. El mejor resultado se obtiene para el día soleado como 

era de esperar, seguido del día con sol y algunas nubes y por último del día nublado. 

Este comportamiento en las predicciones se debe fundamentalmente al efecto de la 

radiación solar y de la nubosidad que incide sobre la planta fotovoltaica. En la medida 

que aumenta la nubosidad incidente sobre la planta fotovoltaica, se produce una mayor 

variación e intermitencia en la radiación solar incidente y por ende en la potencia 

generada. La alta variabilidad hace que la predicción de la generación sea más difícil y 

que presente mayores errores en comparación con días de comportamiento más estable.  

En la tabla 3 se muestran los errores de predicción para cada día analizado, utilizando 

tres métricas fundamentales descritas en la literatura especializada para este fin.  

 
29 
 

Tabla 3. Valores del error de predicción en días con diferente comportamiento. [Fuente: 

Elaboración propia]                                          

Predicciones de generación PV para un 
horizonte de corto plazo en días con 
diferente comportamiento  

 
Métricas utilizadas para evaluar el 

error de predicción 

RMSE  

 
MAE  

 
MAPE  

 
(kW)  

 
%  

 
(kW)  

 
%  

 
%  

 
Día soleado  

 
20.61  

 
2.24  

 
16.89  

 
1.81  

 
2.32 

Día nublado  

 
37.45  

 
11.31  

 
31.32  

 
9.46 16.11  

 
Día con sol y algunas nubes  

 
27.12  

 
3.22  

 
26.31  

 
2.79  

 
6.48  

 
Según se observa en la tabla anterior los valores del error de predicción (expresados en 

kW y en %) para cada métrica utilizada y para cada día analizado son pequeños, lo que 

demuestra que la predicción realizada es acertada. Además, estos resultados se 

corresponden con los resultados propuestos en la bibliografía internacional que ha 

abordado esta temática. 

3.3 Consideraciones finales del capítulo 

A partir de datos históricos que no forman parte del entrenamiento, se realiza la validación 

de la red neuronal recurrente del tipo LSTM para comprobar el nivel de generalización que 

alcanza la misma, utilizándose para  una predicción a corto plazo de la potencia activa 

generada por la instalación fotovoltaica en tres días con diferente comportamiento (día 

soleado, día nublado y día con sol y algunas nubes), obteniéndose buenos resultados en 

todos los casos, con pequeños valores del error de predicción. 

 
30 
 

CONCLUSIONES 

Los resultados de este trabajo permiten arribar a las conclusiones siguientes: 

 Al consultar diferentes bibliografías internacionales se pudo contactar que la 

mayoría de los trabajos recomiendan el uso de las redes neuronales recurrentes 

para realizar este tipo de estudio, principalmente las redes del tipo LSTM por ser 

considerado un modelo robusto y que brinda resultados adecuados a la predicción 

de generación PV. 

 Se diseña una red neuronal recurrente del tipo LSTM o Long Short Term Memory 

mediante el MATLAB. Dicha red utiliza como variables de entrada las mediciones 

históricas de la radiación solar, la temperatura ambiente y la temperatura en los 

módulos fotovoltaicos y como variable de salida la potencia generada en la 

instalación fotovoltaica en diferentes épocas del año.  

 El modelo se entrena con datos históricos obtenidos de la planta fotovoltaica de la 

UCLV, dichos datos se analizan estadísticamente y se preparan con el objetivo de 

lograr predicciones más exactas y con mayor rapidez 

 La principal contribución del trabajo radica en el desarrollo de una metodología 

sencilla pero efectiva para el logro del objetivo propuesto, la cual resulta aplicable 

en cualquier parque solar fotovoltaico. No obstante, deben analizarse otros modelos 

de deep learning y comparar sus resultados con el modelo propuesto para 

seleccionar el más adecuado según el tipo de predicción que se presente. 

 
31 
 

RECOMENDACIONES 

 
 Continuar la validación de la red neuronal recurrente con datos pertenecientes a 

otros parques solares fotovoltaicos del país. 

 Incorporar al trabajo otras técnicas de inteligencia artificial como algoritmos 

genéticos y lógica difusa, para combinarlas con las redes neuronales recurrentes y 

lograr predicciones más exactas y de mayor calidad.  

 Aplicar este método para predecir la generación de energía eléctrica con otras 

fuentes de energía renovable, como la energía eólica.  

 
32 
 

BIBLIOGRAFÌA 

 
[1] O. Aldoshina and D. Van Tai, "Evaluation and prediction of solar radiation for energy 
management based on neural networks," in Journal of Physics: Conference Series, 
2017, p. 012036. 

[2] L. F. Cachipuendo Amagua, "Estimación de la potencia producida por módulos 
fotovoltaicos en base a Redes Neuronales Artificiales y comparación con 
metodologías basadas en Regresiones Múltiples," Quito, 2016., 2016. 

[3] O. Kärner, "ARIMA representation for daily solar irradiance and surface air 
temperature time series," Journal of Atmospheric and Solar-Terrestrial Physics, vol. 
71, pp. 841-847, 2009. 

[4] Y. Li, Y. Su, and L. Shu, "An ARMAX model for forecasting the power output of a 
grid connected photovoltaic system," Renewable Energy, vol. 66, pp. 78-89, 2014. 

[5] Z. Li, S. Rahman, R. Vega, and B. Dong, "A hierarchical approach using machine 
learning methods in solar photovoltaic energy production forecasting," Energies, vol. 
9, p. 55, 2016. 

[6] L. Llano, G. Zapata, and D. Ovalle, "Sistema de inferencia difuso para identificar 
eventos de falla en tiempo real del STE usando registros SOE," Avances en 
Sistemas e Informática, vol. 4, 2007. 

[7] D. Masa Bote, "Contribución a integración de sistemas fotovoltaicos conectados a 
la red: recurso solar y predicción de la generación," Telecomunicacion, 2014. 

[8] C. Moehrlen, "Uncertainty in wind energy forecasting," University College Cork, 
2004. 

[9] C. E. MORATIEL, "Estudio de viabilidad sobre la previsión horaria de la producción 
de energía solar fotovoltaica mediante técnicas de redes neuronales," Proyecto Fin 
de Carrera, Ingeniería Industrial, Escuela Técnica Superior de Ingeniería, 
Universidad Pontificia Comillas, Madrid, 2009. 

[10] F. Rodríguez Paler, "Predicción mediante redes neuronales de la producción de 
energía de un parque fotovoltaico," 2017. 

[11] M. A. GómezRodríguez, J. R. Gómez Sarduy, J. V. Lorenzo Ginori, R. Fonte 
González, and Z. García Sánchez, "Pronóstico de la generación eléctrica de 
sistemas fotovoltaicos. Un inicio en Cuba desde la universidad," Revista 
Universidad y Sociedad, vol. 13, pp. 253-265, 2021. 

[12] L. A. I. Carrera, N. A. C. Perdomo, and E. B. Valuca, "La energía fotovoltaica y sus 
particularidades en Cuba," Revista Mapa, vol. 5, 2021. 

[13] M. Q. Raza, M. Nadarajah, and C. Ekanayake, "On recent advances in PV output 
power forecast," Solar Energy, vol. 136, pp. 125-144, 2016. 

[14] U. K. Das, K. S. Tey, M. Seyedmahmoudian, M. Y. Idna Idris, S. Mekhilef, B. Horan, 
et al., "SVR-based model to forecast PV power generation under different weather 
conditions," Energies, vol. 10, p. 876, 2017. 

[15] F. Wang, Z. Zhen, Z. Mi, H. Sun, S. Su, and G. Yang, "Solar irradiance feature 
extraction and support vector machines based weather status pattern recognition 
model for short-term photovoltaic power forecasting," Energy and Buildings, vol. 86, 
pp. 427-438, 2015. 


33 
 

[16] F. Wang, Z. Zhen, B. Wang, and Z. Mi, "Comparative study on KNN and SVM based 
weather classification models for day ahead short term solar PV power forecasting," 
Applied Sciences, vol. 8, p. 28, 2018. 

[17] F. J. Lima, F. R. Martins, E. B. Pereira, E. Lorenz, and D. Heinemann, "Forecast for 
surface solar irradiance at the Brazilian Northeastern region using NWP model and 
artificial neural networks," Renewable Energy, vol. 87, pp. 807-818, 2016. 

[18] F. Kasten and G. Czeplak, "Solar and terrestrial radiation dependent on the amount 
and type of cloud," Solar energy, vol. 24, pp. 177-189, 1980. 

[19] S. Nann and C. Riordan, "Solar spectral irradiance under clear and cloudy skies: 
Measurements and a semiempirical model," Journal of Applied Meteorology and 
Climatology, vol. 30, pp. 447-462, 1991. 

[20] D. Kaskaoutis, H. Kambezidis, C. Jacovides, and M. Steven, "Modification of solar 
radiation components under different atmospheric conditions in the Greater Athens 
Area, Greece," Journal of Atmospheric and Solar-Terrestrial Physics, vol. 68, pp. 
1043-1052, 2006. 

[21] Y. Sun, F. Wang, B. Wang, Q. Chen, N. Engerer, and Z. Mi, "Correlation feature 
selection and mutual information theory based quantitative research on 
meteorological impact factors of module temperature for solar photovoltaic 
systems," Energies, vol. 10, p. 7, 2017. 

[22] U. K. Das, K. S. Tey, M. Seyedmahmoudian, S. Mekhilef, M. Y. I. Idris, W. Van 
Deventer, et al., "Forecasting of photovoltaic power generation and model 
optimization: A review," Renewable and Sustainable Energy Reviews, vol. 81, pp. 
912-928, 2018. 

[23] J. G. da Silva Fonseca, T. Oozeki, T. Takashima, G. Koshimizu, Y. Uchida, and K. 
Ogimoto, "Photovoltaic power production forecasts with support vector regression: 
A study on the forecast horizon," in 2011 37th IEEE photovoltaic specialists 
conference, 2011, pp. 002579-002583. 

[24] C. Monteiro, L. A. Fernandez-Jimenez, I. J. Ramirez-Rosado, A. Muñoz-Jimenez, 
and P. M. Lara-Santillan, "Short-term forecasting models for photovoltaic plants: 
Analytical versus soft-computing techniques," Mathematical problems in 
engineering, vol. 2013, 2013. 

[25] O. Younis, "A predictive model for solar photovoltaic power using the Levenberg-
Marquardt and Bayesian regularization algorithms and real-time weather data," 
International Journal of Advanced Computer Science and Applications, vol. 9, 2018. 

[26] M. G. De Giorgi, P. M. Congedo, and M. Malvoni, "Photovoltaic power forecasting 
using statistical methods: impact of weather data," IET Science, Measurement & 
Technology, vol. 8, pp. 90-97, 2014. 

[27] S. S. Reddy, "Optimal scheduling of thermal-wind-solar power system with storage," 
Renewable energy, vol. 101, pp. 1357-1368, 2017. 

[28] S. S. Reddy and P. Bijwe, "Real time economic dispatch considering renewable 
energy resources," Renewable Energy, vol. 83, pp. 1215-1226, 2015. 

[29] S. Al-Dahidi, O. Ayadi, M. Alrbai, and J. Adeeb, "Ensemble approach of optimized 
artificial neural networks for solar photovoltaic power prediction," IEEE Access, vol. 
7, pp. 81741-81758, 2019. 

[30] A. M. Jimenes., "Modelos de predicción a corto plaso de la generacíon eléctrica en 
instalaciones fotovoltaicas.," Tesis doctoral, Ingeniería Eléctrica., Escuela Técnica 
Superior de Ingeniería Industrial, Univercidad de Rioja., 2014. 


34 
 

[31] J. Usaola, O. Ravelo, G. González, F. Soto, M. C. Dávila, and B. Díaz–Guerra, 
"Benefits for wind energy in electricity markets from using short term wind power 
prediction tools; a simulation study," Wind Engineering, vol. 28, pp. 119-127, 2004. 

[32] C. Mörklen, "Uncertainty in win energy forecasting," Universidad de Cork, Irlanda, 
2004. 

[33] A. F. R. Granda, "Predicción de la potencia activa a corto plaso de un parque 
fotovoltaico utilizando una red neuronal artificial," Tesis de fin de año, Facultad de 
Ingeniería Eléctrica y Electrónica, Escuela Politécnica Nacional, Quito,mayo 2017. 

[34] R. Mellit, I. Koprinska, and V. G. Agelidis, "Univariate and multivariate methods for 
very short-term solar photovoltaic power forecasting," Energy Conversion and 
Management, vol. 121, pp. 280-390, 2016. 

[35] A. Rashkovska, J. Novljan, M. Smolnikar, M. Mohorcic, and C. Fortuna, "Online 
short-term forecasting of photovoltaic energy production," presented at the IEEE 
Power and Society Innovative Smart Grid Technologies Conference, 2015. 

[36] A. Muñoz-Jiménez, P. Zorzano-Santamaría, L. A. Fernández-Jiménes, E. Zorzano-
Alba, A. Yanguas-Peña, and E. García-Garrido, "Modelos de Predicción a corto 
plazo para sistemas fotovoltaicos," Conferencia Hispano-Lusa de Ingeniería 
Eléctrica, julio 2009. 

[37] M. S. T. Olarte, "Nuevos modelos de predicción a corto plazo de la generación 
eléctrica en plantas basadas en energía solar fotovoltaica," Tesis doctoral, 
Ingeniería Eléctrica, Universidad de la Rioja, 2017. 

[38] c. R. Ahmed a, *, V. Sreeram a, Y. Mishra a,b, M.D. Arif c, "A review and evaluation 
of the state-of-the-art in PV solar power 

forecasting: Techniques and optimization," http://www.elsevier.com/locate/rser, p. 26, 
2020. 

[39] A. Muñoz-Jiménez, P. Zorzano-Santamaría, L. Fernández-Jiménez, E. Zorzano-
Alba, A. Yanguas-Peña, and E. García-Garrido, "Modelos de Predicción a corto 
plazo para sistemas fotovoltaicos," in Conferencia Hispano-Lusa de Ingeniería 
Eléctrica, 2009. 

[40] M. S. T. Olarte, "Nuevos modelos de predicción a corto plazo de la generación 
eléctrica en plantas basadas en energía solar fotovoltaica," Universidad de La Rioja, 
2017. 

[41] A. Serrano, E. Soria, and J. Martín, "Redes Neuronales Artificiales, Escuela Técnica 
Superior de Ingeniería," Tesis de Licenciatura, 2009. 

[42] R. Salas, "Redes neuronales artificiales," Universidad de Valparaıso. Departamento 
de Computación, vol. 1, pp. 1-7, 2004. 

[43] I. B. Cruz, S. S. Martínez, A. R. Abed, R. G. Ábalo, and M. M. G. Lorenzo, "Redes 
neuronales recurrentes para el análisis de secuencias," Revista Cubana de 
Ciencias Informáticas, vol. 1, pp. 48-57, 2007. 

[44] C.-T. Lin and C. G. Lee, Neural fuzzy systems: a neuro-fuzzy synergism to intelligent 
systems: Prentice hall, 1996. 

[45] K. S. Thampatty, M. Nandakumar, and E. P. Cheriyan, "RTRL Algorithm Based 
Adaptive Controller for Non-linear Multivariable Systems," International Journal of 
Computer Applications, vol. 975, p. 8887, 2010. 

[46] S. Liu, X. Hu, and W. Wang, "Deep reinforcement learning based dynamic channel 
allocation algorithm in multibeam satellite systems," IEEE Access, vol. 6, pp. 15733-
15742, 2018. 

http://www.elsevier.com/locate/rser


35 
 

[47] R. Grosse, "Lecture 15: Exploding and vanishing gradients," University of Toronto 
Computer Science, 2017. 

[48] B. M. d. Brio and A. S. Molina, Redes neuronales y Sistemas difusos, Segunda 
edición ed., marzo 2001.