MINISTERIO DE EDUCACIÓN SUPERIOR 
 

UNIVERSIDAD CENTRAL “MARTA ABREU” DE LAS 
VILLAS 

FACULTAD DE MATEMÁTICA FÍSICA Y COMPUTACIÓN 
CENTRO DE ESTUDIOS DE INFORMÁTICA 

DEPARTAMENTO DE CIENCIAS DE LA COMPUTACIÓN 
 

Trabajo para optar por el grado de Doctor en Ciencias 
Técnicas 

 
Un modelo para el aprendizaje y la clasificación 
automática basado en técnicas de softcomputing 

 
Autor: Pedro Yobanis Piñero Pérez 
 

Tutor: Prof. Titular, Dra. María Matilde García Lorenzo 
 

UNIVERSIDAD CIENCIAS INFORMATICAS, 2005 


Dedicatoria 
 
 
A mi familia por todo el tiempo que les he robado especialmente a: 
 

Mi esposa Esther Cristina 
Mis hijos Pedro Enrique y Carlos Manuel 

Mis padres Pedro y Ana 
Mi hermana Yadenis 

 
Ningún resultado que obtenga podrá devolverles a ellos todo el tiempo que les he robado. 

Con palabras no se puede expresar el significado de familia y seres queridos 

 
Toda obra grande cuando comienza es pequeña, lo que hay es que 
tener valor para hacerla crecer 

R.A.H.L. 


Agradecimientos 
 

Agradezco a todos los que de alguna forma han contribuido a mi formación 
especialmente agradezco: 

A la Revolución que sin ella nada de esto fuera posible  
A mi tutora Marilin por su ayuda durante toda la tesis 

 Al señor Rolando Alfredo y su esposa Sayda por toda la ayuda y el apoyo que 
me han brindado 

A Leticia, Isis y Yaile por su colaboración en cada momento 

A Zoila Zenaida García por su ayuda constante y desinteresada  

A los muchachos del proyecto especialmente a Raykenler, Alfredo y Rene por su 
colaboración y muestras de confianza 

A William por toda la ayuda prestada que me ha brindado en cada momento 

A Rafael Bello, Ricardo Grau y Daniel Gálvez por ayudar a formarme y la 
ayuda que me ha brindado 

A los señores José E. Medina Pagola y Juan Pedro Febles por sus magníficas 
oponencias durante la predefensa, que fueron de gran ayuda  

Al señor Alberto Ochoa por su asesoría en el tema de EDA 

 
Resumen 
En esta tesis se investiga acerca de las técnicas del softcomputing y sus potencialidades en 
el aprendizaje automático y en la resolución de complejos problemas de ayuda a la toma de 
decisiones y la clasificación. Se presenta en ella un nuevo modelo que permite aprender y 
generalizar en forma de reglas borrosas el conocimiento implícito en bases de casos y que 
posibilita además la clasificación de nuevos casos tomando como base la explotación de un 
sistema de inferencia borroso del tipo Sugeno grado cero. Como parte del modelo 
desarrollado se presentan nuevos criterios de selección de rasgos y los algoritmos MLRUL y 
GENRUL para la generación de reglas borrosas. Se desarrollan además algoritmos para la 
optimización de bases de reglas borrosas tomando como base la aplicación de heurísticas y 
algoritmos evolutivos. Para lograr la explotación del modelo se desarrollaron un grupo de 
bibliotecas básicas que permiten una fácil adaptación a disímiles situaciones donde se 
presenten problemas de toma de decisiones. Se muestra la aplicación del modelo 
desarrollado sobre bases de datos internacionales utilizando el sistema MLCLASSIF y se 
comparan los resultados con otros sistemas y modelos para la clasificación. Finalmente se 
presenta la adaptación del modelo a la resolución del problema de la construcción de 
hipnogramas del sueño a través del sistema SICES. 

 
Abstract 
In this thesis softcomputing techniques for machine learning, classification and making 
decision are discussed. We propose a new model to classify and to learn from data. This 
thesis systematically presents learning algorithms, which can be used to create fuzzy 
systems from data. The algorithms are especially designed for their capability to produce 
interpretable Sugeno grade cero fuzzy systems. Two algorithms to optimize fuzzy rules are 
proposed too. The first one inspired by the neural networks and the second based on 
estimation of distribution algorithms. The algorithms are presented in such a way that they 
can readily be used for implementations. As examples for neuro-fuzzy solutions using our 
model, the classification systems MLClassif 1.0 and SICES 1.0 are discussed. We compare 
our model (MLClassif 1.0) with different classifiers and use some medical databases 
published in the UCI Machine Learning Repository to obtain the results. We apply our model 
to solve the sleep stage classification problem and compare the SICES 1.0 results with other 
system. 


INDICE 

INTRODUCCIÓN.................................................................................................................................................. 1 

ACTUALIDAD DEL TEMA ....................................................................................................................................... 1 
FORMULACIÓN DEL PROBLEMA............................................................................................................................. 2 
HIPÓTESIS ............................................................................................................................................................. 3 
OBJETIVOS............................................................................................................................................................ 3 
VARIABLES ........................................................................................................................................................... 3 
TAREAS DE INVESTIGACIÓN CONCRETAS............................................................................................................... 4 
MÉTODOS Y TÉCNICAS A UTILIZAR ....................................................................................................................... 4 
NOVEDAD CIENTÍFICA........................................................................................................................................... 5 
VALOR PRÁCTICO ................................................................................................................................................. 5 
PUBLICACIONES Y EVENTOS CIENTÍFICOS RELACIONADOS CON EL TEMA DE LA TESIS ........................................... 6 
ESTRUCTURA DEL TRABAJO .................................................................................................................................. 9 

ANÁLISIS DEL ESTADO DEL ARTE DE ESTRATEGIAS PARA EL APRENDIZAJE Y LA 

CLASIFICACIÓN BASADOS EN LA LÓGICA BORROSA ......................................................................... 10 

1.1 ¿QUÉ ES EL APRENDIZAJE AUTOMATIZADO? ................................................................................................. 10 
1.2 DIFERENTES ENFOQUES EMPLEADOS EN EL APRENDIZAJE Y LA CLASIFICACIÓN ............................................ 13 

1.2.1 Estrategias estadísticas........................................................................................................................ 14 
1.2.2 Algoritmos Lógico-Combinatorios para Reconocimiento de Patrones ............................................... 14 
1.2.3 Estrategias basadas en árboles de decisión......................................................................................... 15 
1.2.4 Sistemas basados en el conocimiento de la Inteligencia Artificial ...................................................... 16 
1.2.4.1 Los sistemas de inferencia borrosos y neuroborrosos ...................................................................... 17 
1.2.4.2 Interpretabilidad versus predicción en los sistemas basados en el conocimiento............................ 20 
1.2.5 Conclusiones del epígrafe .................................................................................................................... 21 

1.3 GENERACIÓN DE REGLAS BORROSAS............................................................................................................. 21 
1.3.1 Diferentes enfoques en la construcción de funciones de pertenencia.................................................. 23 
1.3.2 Estrategia de generación de la base de reglas duras y transformación en reglas borrosas ............... 26 
1.3.3 Estrategia de generación de la base de reglas borrosas candidatas y refinamiento........................... 27 
1.3.4 Estrategia de generación de reglas borrosas a partir de la optimización de la base de reglas.......... 29 
1.3.4.1 Estrategia de pesado de reglas ......................................................................................................... 30 
1.3.4.2 Estrategia basada en la modificación de las funciones de pertenencia y la base de reglas............. 31 

1.4 CONCLUSIONES DEL CAPÍTULO...................................................................................................................... 35 


MODELO DE APRENDIZAJE Y CLASIFICACIÓN AUTOMÁTICA BASADO EN TÉCNICAS DE 

SOFTCOMPUTING ............................................................................................................................................ 37 

2.1 MÓDULO DE APRENDIZAJE ............................................................................................................................ 37 
2.1.1 Algoritmo MLRul ................................................................................................................................. 38 
2.1.2 Algoritmo GenRul5 .............................................................................................................................. 54 

2.2 MÓDULO OPTIMIZACIÓN DE LA BASE DE REGLAS BORROSAS......................................................................... 57 
2.2.1 Optimización de una base de reglas una estrategia basada en redes neuronales............................... 57 
2.2.2 Optimización de una base de reglas utilizando algoritmos con estimación de distribuciones............ 63 
2.2.2.1 Diseño de un UMDA para la optimización de conjuntos borrosos .................................................. 63 
2.2.2.2 Diseño de una variante distribuida del EMNAglobal para la optimización de conjuntos borrosos.... 64 

2.3 MÓDULO DE CONSTRUCCIÓN DEL SISTEMA DE INFERENCIA NEURO-BORROSO............................................... 67 
2.4 CONCLUSIONES DEL CAPÍTULO Y EVALUACIÓN CRÍTICA DEL MODELO .......................................................... 68 

EXPERIMENTACIÓN Y DESARROLLO DE APLICACIONES A PARTIR DEL MODELO................. 71 

3.1 DOS BIBLIOTECAS DE COMPONENTES DE APOYO AL APRENDIZAJE Y LA CLASIFICACIÓN................................ 71 
3.1.1 Biblioteca GACom versión 2.0............................................................................................................. 71 
3.1.2 Paquete de componentes FuzzyPack versión 1.0 ................................................................................. 72 

3.2 SISTEMA MLCLASSIF VERSIÓN 1.0 ............................................................................................................... 72 
3.2.1 Resultados experimentales ................................................................................................................... 73 

3.3 SISTEMA PARA LA CLASIFICACIÓN DE ETAPAS DEL SUEÑO (SICES VERSIÓN 1.0).......................................... 81 
3.3.1 Planteamiento general del estudio del sueño....................................................................................... 81 
3.3.2 Tendencias y evolución en la clasificación automática de etapas del sueño....................................... 82 
3.3.3 Implementación de los módulos del sistema SICES versión 1.0 .......................................................... 84 
3.3.4 Resultados experimentales ................................................................................................................... 89 

3.5 CONCLUSIONES DEL CAPÍTULO...................................................................................................................... 91 

CONCLUSIONES ................................................................................................................................................ 95 

RECOMENDACIONES ...................................................................................................................................... 96 

BIBLIOGRAFÍA .................................................................................................................................................. 97 

ANEXOS ............................................................................................................................................................. 111 

ANEXO 1 AGRUPACIÓN DE DIFERENTES TIPOS DE MÉTODOS DE CLASIFICACIÓN ............................................... 111 
ANEXO 2 DIAGRAMAS QUE REPRESENTAN EL PROCESO DE CLASIFICACIÓN BASADO EN EL DISCRIMINANTE. .... 112 
ANEXO 3 DIFERENTES TIPOS DE SISTEMAS BASADOS EN EL CONOCIMIENTO ..................................................... 112 


ANEXO 4 EJEMPLO DE VARIABLE LINGÜÍSTICA EJEMPLIFICADO CON LA TEMPERATURA ................................... 113 
ANEXO 5 GRÁFICAS QUE REPRESENTAN FUNCIONES DE PERTENENCIA ............................................................. 113 
ANEXO 6 FUNCIONAMIENTO DE LOS SISTEMAS DE INFERENCIA BORROSOS ....................................................... 114 
ANEXO 7 TOPOLOGÍAS DE LAS REDES NEURONALES ......................................................................................... 117 
ANEXO 8 TOPOLOGÍAS DE SISTEMAS NEUROBOROSOS ...................................................................................... 118 
ANEXO 9 REPRESENTACIÓN DE FUNCIONES DE PERTENENCIA BASADAS EN MODELOS PROBABILÍSTICOS.......... 118 
ANEXO 10 PROCESO DE CORRECCIÓN QUE APLICAN LOS ALGORITMOS DE NAUCK ........................................... 119 
ANEXO 11: CÁLCULO DE LOS CONJUNTOS APROXIMADOS SUPERIOR E INFERIOR. ............................................. 120 
ANEXO 12. ALGORITMO RSREDUCT................................................................................................................. 120 
ANEXO 13 ALGORITMOS CON ESTIMACIÓN DE DISTRIBUCIONES ...................................................................... 121 
ANEXO 14 ESTRUCTURA DEL CROMOSOMA PARA REPRESENTAR LA BASE DE REGLAS ...................................... 122 
ANEXO 15 SISTEMA BORROSO TIPO SUGENO GRADO CERO, TOPOLOGÍA RED DE 5 CAPAS ORIENTADA A NODOS122 
ANEXO 15 SISTEMA BORROSO TIPO SUGENO GRADO CERO, TOPOLOGÍA RED DE 5 CAPAS ORIENTADA A NODOS123 
ANEXO 16 INFORMACIÓN SOBRE BASES DE DATOS UTILIZADAS EN LA EXPERIMENTACIÓN,.............................. 123 
ANEXO 17 ALGUNAS TABLAS PRUEBAS BUSCANDO EL MEJOR K PARA KNN .................................................... 123 
ANEXO 18 ALGUNAS TABLAS COMPARACIÓN ALGORITMOS BASE DATOS, HEART .......................................... 125 
ANEXO 19 ALGUNAS TABLAS COMPARACIÓN ALGORITMOS BASE DATOS, TYROIDS ...................................... 126 
ANEXO 20 ALGUNAS TABLAS COMPARACIÓN ALGORITMOS BASE DATOS, BREAST CANCER ....................... 127 
ANEXO 21 MÓDULO DE PARAMETRIZACIÓN DEL SISTEMA SICES 1.0............................................................... 129 
ANEXO 22: FICHERO DE ENTRADA AL MÓDULO DE APRENDIZAJE (.DATA) ........................................................ 129 
ANEXO 23 FICHERO DE ENTRADA AL MÓDULO DE INFERENCIA Y SALIDA DEL MÓDULO DE APRENDIZAJE (.RUL)132 
ANEXO 25 FICHERO DE EVALUACIÓN GENERADO POR EL MÓDULO DE INFERENCIA (.EVAL).............................. 134 
ANEXO 26 FICHERO DE SALIDA DEL MÓDULO DE INFERENCIA (.CLASS) ............................................................ 137 
ANEXO 27 RELACIÓN DE REGLAS UTILIZADAS DURANTE LA CORRECCIÓN DE LA CLASIFICACIÓN..................... 137 
ANEXO 28 RELACIÓN DE ETAPAS POR PACIENTES ANALIZADOS EN EL ESTUDIO. ............................................... 139 
ANEXO 29 ADICIÓN DE NUEVOS CASOS AL MÓDULO CORRECTOR DEL SISTEMA SICES 1.0 .............................. 140 
ANEXO 30 MUESTRA DE HIPNOGRAMAS RESULTANTES DEL PROCESO DE CLASIFICACIÓN ................................ 141 
ANEXO 31 DISTRIBUCIÓN DE ETAPAS POR PARTICIONES PARA LA PRUEBA DE SICES 1.0 ................................. 143 
ANEXO 32 MUESTRA DE FICHERO DE EVALUACIÓN DE SALIDA AL PROCESAR UN CASO DEL CONJUNTO DE 

ENTRENAMIENTO DE LA PARTICIÓN 1................................................................................................................ 144 
ANEXO 33 RESULTADOS DE COMPARACIÓN DE SISTEMAS SICES Y DREAM HUNTER ....................................... 145 
ANEXO 34 COMPARACIÓN DEL USO DEL MÓDULO CORRECTOR CONTRA NO USARLO. ....................................... 146 


1 

Introducción 

Actualidad del tema  

El aprendizaje automático aparece frecuentemente como un paso necesario para la 
resolución de complejos problemas de clasificación y para la ayuda a la toma de decisiones. 
Entre las ramas que más han aportado a la resolución de esta problemática se encuentran: 
la estadística, la inteligencia artificial, el enfoque lógico combinatorio del reconocimiento de 
patrones entre otras. 

Las técnicas de aprendizaje basadas en la estadística tienen como base modelos 
probabilísticos [1, 2]. Tendencias actuales, muestran su uso en combinación con otros 
métodos o como parte de sistemas multiclasificadores [3] y generalmente presentes en las 
primeras capas de estos sistemas.  

Los algoritmos y técnicas que se agrupan en el enfoque Lógico-Combinatorio para 
Reconocimiento de Patrones parten de la evaluación de los objetos haciendo uso de 
diferentes métricas y algoritmos [4-9].  

Dentro de la inteligencia artificial hay dos ramas que se destacan por sus aportes en el 
aprendizaje y la clasificación: los algoritmos de aprendizaje basados en árboles de decisión 
[10-13] y los sistemas basados en el conocimiento [11, 14-17]. Como parte de los sistemas 
basados en el conocimiento la aplicación de técnicas basadas en la lógica borrosa tales 
como los sistemas de inferencia borrosos y neuroborrosos  han ganado popularidad [18-23]. 
Estas técnicas constituyen el pilar de las técnicas del softcomputing donde la teoría de la 
lógica borrosa, las redes neuronales y los algoritmos evolutivos se funden para ganar en: 
robustez, eficiencia, adaptabilidad y equilibrio adecuado entre predicción e interpretabilidad 
[24-26]. 

En el desarrollo de técnicas basadas en el softcomputing juega un importante papel la 
generación de reglas borrosas. Tendencia actuales [17, 19, 21, 27-30] muestran tres 
enfoques fundamentales utilizados en el aprendizaje y la optimización de las reglas borrosas: 
generar reglas duras y transformar estas reglas en reglas borrosas, generar una base de 
reglas borrosas candidatas, luego refinarla y como tercer opción generar una base de reglas 
borrosas inicial a partir de los datos, someterla a un proceso de optimización. De estos tres 
enfoques el más utilizado es el que se concentra en la optimización de la base de reglas.  

En la estrategia basada en la optimización se perciben tres líneas fundamentales: la 
aplicación de algoritmos derivados de redes neuronales basados en el gradiente [3, 16, 23, 
29, 31, 32], algoritmos de derivados de redes neuronales basados en heurísticas que no 
usan el gradiente [24, 33] y el empleo de los algoritmos evolutivos [34-38]. Cada una de 
estas líneas tiene potencialidades y limitantes en su aplicación a diferentes problemas. En el 
caso del uso de los algoritmos evolutivos hay que destacar su facilidad de aplicación y las 


INTRODUCCIÓN 

2 

pocas restricciones que imponen a los problemas, destacándose en este sentido el uso de 
los algoritmos genéticos [19, 21, 34].  

No obstante la popularidad en el uso de los algoritmos genéticos, resulta interesante que 
conociéndose la dificultad de los mismos en el manejo de datos correlacionados, no se 
reporten trabajos donde se exploten los algoritmos con estimación de distribuciones [39-44], 
que si resuelven esta dificultad. 

Formulación del problema 

Existen numerosos métodos para el aprendizaje, la clasificación y la ayuda a la toma de 
decisiones cada uno con sus peculiaridades. Pero aún quedan muchas preguntas por 
resolver sobre todo en la aplicación de las técnicas de aprendizaje y clasificación en la 
resolución de problemas reales donde aparecen elementos como el ruido, la incertidumbre, 
la incompletitud de los datos y la vaguedad en los límites de los conceptos. Particularmente 
en campos como el diagnóstico médico especializado se torna difícil encontrar soluciones 
teniendo en cuenta además el necesario equilibrio que se debe mantener entre predicción e 
interpretabilidad de los resultados, veamos un ejemplo de problema donde se manifiesta 
esta dificultad. 

En la construcción automática de hipnogramas del sueño a partir de registros 
electrofisiológicos donde se pretende ayudar a los médicos en el análisis del sueño de 
pacientes se presenta la dificultad de que no existen estándares para la construcción de 
hipnogramas o los que existen presentan reconocidas dificultades [45, 46]. Esta situación 
propicia la aparición de múltiples criterios basados muchas veces en la subjetividad y la 
experiencia de los expertos. Por otra parte la lectura de los registros electrofisiológicos se 
produce a partir de equipos donde los procedimientos de acoplamiento, de lectura y la propia 
calibración de los equipos constituyen fuentes de error en las mediciones. En la resolución 
de este problema el empleo de técnicas de aprendizaje automático y clasificación que 
posibiliten descubrir conocimiento y explotar el conocimiento aún cuando se presenten 
imprecisiones, incompletitud de los datos y vaguedad en los límites de los conceptos, 
pueden resultar de notable ayuda para la toma de decisiones. 

En otros campos del diagnóstico médico especializado se presentan situaciones similares 
donde el empleo de técnicas apropiadas favorece el trabajo de los especialistas médicos. En 
el repositorio de aprendizaje automático de la Universidad de California [47] se concentran 
fuentes de datos suministradas por hospitales y proyectos que permiten validar los modelos 
computacionales para la resolución de diversos problemas de clasificación y diagnóstico 
médico especializado. 

Una vez mostrada la situación a que nos enfrentamos y luego de hacer un breve análisis del 
estado del arte estamos en condiciones de plantearnos nuestro problema científico. 


INTRODUCCIÓN 

3 

• No disponer de un modelo basado en novedosos elementos del softcomputing para 
aprender, generalizar y explotar en forma de reglas borrosas el conocimiento 
encontrado en casos de estudio, afecta la ayuda en la toma de decisiones en la 
construcción automática de hipnogramas del sueño y en el uso potencial de técnicas 
de aprendizaje y clasificación basadas en softcomputing en el diagnóstico médico 
especializado y otros problemas de clasificación. 

Hipótesis 

Si se desarrolla un modelo basado en técnicas del softcomputing que permita aprender, 
generalizar y explotar el conocimiento de conjuntos de casos, en forma de reglas borrosas, 
que resuelva las limitantes de los modelos propuestos en la bibliografía se obtendrán 
mejores resultados en la construcción automática de hipnogramas del sueño y 
potencialmente se podrán resolver otros problemas de clasificación, relacionados con la 
ayuda a la toma de decisiones, como los que se presentan en el diagnóstico médico 
especializado. 

Objetivos 

El objetivo general de este trabajo es desarrollar un modelo que permita el aprendizaje de 
reglas borrosas a partir de casos y la clasificación automática, basado en las técnicas del 
softcomputing, para la ayuda a la toma de decisiones en: la construcción automática de 
hipnogramas del sueño y en el uso potencial en otros problemas de clasificación supervisada 
tales como el diagnóstico médico especializado. 

Para lograr este objetivo se plantean los siguientes objetivos específicos: 

1. Desarrollar un modelo basado en técnicas de softcomputing que permita la 
construcción de reglas borrosas a partir de casos, la optimización de bases de reglas 
borrosas y su explotación en problemas de clasificación. 

2. Implementar y validar el modelo desarrollado a partir de su aplicación en la solución 
del problema de la construcción automática de hipnogramas el sueño y de otros 
problemas de clasificación relacionados con el diagnóstico médico. 

Variables 

Variables independientes: algoritmos para el aprendizaje y la optimización de bases de 
reglas borrosas, modelo para el aprendizaje y la clasificación 
basado en técnicas de softcomputing y el desarrollo de 
herramientas de software que permitan la resolución de 
problemas específicos de diagnóstico médico especializado 

Variables dependientes: construcción automática de hipnogramas del sueño de pacientes y 
el uso potencial de técnicas basadas en el softcomputing en la 


INTRODUCCIÓN 

4 

resolución otros problemas relacionados con el diagnóstico médico 
especializado.  

Tareas de investigación concretas 

• Realizar un análisis del estado del arte que permita dejar definida la posición del 
investigador respecto al uso de técnicas basadas en softcomputing. 

• Desarrollar algoritmos que permitan el aprendizaje automatizado de reglas borrosas a 
partir de casos estudio 

• Desarrollar algoritmos que permitan el refinamiento y la optimización de bases de 
reglas borrosas 

• Desarrollar un modelo que permita haciendo uso de los algoritmos y herramientas 
desarrollados aprender reglas borrosas a partir casos y explotar el conocimiento 
extraído para la clasificación y la ayuda a la toma de decisiones.  

• Encapsular el modelo desarrollado en bibliotecas que permitan la reutilización del 
código y el desarrollo rápido de aplicaciones para el aprendizaje y la clasificación. 

• Desarrollar el sistema SICES 1.0 que posibilite la construcción automática de 
hipnogramas del sueño de pacientes.  

• Desarrollar el sistema MLClassif 1.0 que permita aprender reglas borrosas a partir de 
casos y explotar el conocimiento extraído en la resolución de problemas de 
clasificación. 

• Evaluar los algoritmos y aplicaciones desarrolladas en el diagnóstico médico a partir 
de se uso en bases de datos publicadas en el UCI repository for machine learning y 
en bases de casos de pacientes del Centro de Neurociencias de Cuba 

Métodos y Técnicas a utilizar 

Entre las estrategias de investigación que utilizamos están la exploratoria y la explicativa. 
Exploramos diferentes técnicas y tendencias en el estudio del sueño y en el aprendizaje y la 
clasificación basados en técnicas de softcomputing con vistas a desarrollar un modelo 
computacional novedoso y que resuelva las deficiencias de otros reportados en la 
bibliografía. 

Métodos teóricos: Histórico lógico, Hipotético deductivo, Sistémico 

En cada caso nos plateamos el problema como un todo, donde los datos tomados de 
pacientes en el caso del sueño o de bases de datos internacionales, la propia dinámica del 
estudio del sueño y de cada uno de los problemas que resolvimos y las técnicas 
computacionales que desarrollamos para la ayuda a la toma de decisiones se funden en un 
sistema sostenible e integral. Enfocamos las problemáticas del aprendizaje automático, la 


INTRODUCCIÓN 

5 

clasificación, el diagnóstico y la toma de decisiones en general desde un enfoque histórico 
lógico, en la primera parte de nuestra investigación desarrollamos un estudio del estado del 
arte de la problemática analizada; revisamos las bondades y deficiencias de cada uno de los 
métodos y las tendencias en la resolución de esta problemática. Nuestra investigación sigue 
además un método hipotético deductivo porque a partir del problema concreto nos plantemos 
objetivos específicos e hipótesis que en el transcurso de la investigación son resueltas 
siguiendo métodos científicamente bien fundamentados.  

Método empírico: Experimentación, Medición   

Además de seguir métodos teóricos seguimos métodos empíricos basando nuestra 
investigación en la experimentación con datos provenientes de situaciones reales 
suministrados por las siguientes fuentes: 

1. Heart suministrada por el European Statlog project, Strathclyde University [47] 

2. Thyroids suministrada por el Garvan Institute of Medical Research, Sydney [47] 

3. Breast Cancer suministrada por University of Wisconsin Hospitals, Madison [47] 

4. Datos tomados de pacientes del Centro de Neurociencias de Cuba [48] 

Aplicamos pruebas estadísticas bien fundamentadas para analizar la capacidad de 
generalización del modelo desarrollado y la calidad de las respuestas finales. Se 
establecieron estadígrafos e indicadores adecuados que permiten realizar correctas 
mediciones de los resultados.  

Novedad científica 

La novedad científica del presente trabajo se resume en los puntos siguientes: 

• Se desarrollan dos nuevos algoritmos para la generación y optimización de reglas 
borrosas a partir de casos basados en técnicas de softcomputing [49-59].  

• Se elabora un modelo para el aprendizaje y la clasificación y se logra adaptar para la 
construcción automática de hipnogramas del sueño de pacientes y se muestra su uso 
potencial en la resolución de otros problemas de diagnóstico médico especializado 
[60-79]. 

Valor práctico 

El modelo para el aprendizaje y la clasificación propuesto en la tesis tiene un alto valor 
práctico que se manifiesta en su aplicación: 

• En la construcción automática de hipnogramas de sueño mejorando 
significativamente los resultados reportados por el módulo automático del sistema 
Dream Hunter [62, 64, 66, 76, 80] 


INTRODUCCIÓN 

6 

• En el desarrollo de módulos inteligentes del Sistema Hyperweb para el diagnóstico, 
control, tratamiento y seguimiento de pacientes con Hipertensión Arterial [74, 75, 78, 
79]. 

• En el desarrollo del sistemas y herramientas básicas potenciando: el desarrollo 
rápido de sistemas y plataformas para la ayuda a la toma de decisiones [57, 67, 68, 
77, 81, 82] 

• En el desarrollo de herramientas para el diseño de experimentos con mezclas [67, 70, 
72]. 

Se pretende proveer a los médicos y otros especialistas de herramientas complementarias 
para la clasificación y el aprendizaje automatizado que con frecuencia aparecen en su 
trabajo cotidiano. Estas herramientas no están diseñadas para sustituir a expertos humanos 
sino para la ayuda a la toma de decisiones de estos. 

Publicaciones y eventos científicos relacionados con el tema de la tesis 

Publicaciones en revistas, libros y monografías  

1. Piñero, P., M. García, et al. (2004a). "Sleep stage classification using fuzzy sets and 
machine learning techniques." Neurocomputing 58-60: 1137-1143  

2. Bello, R., L. Arco, et al. (2004). Modelos y procedimientos de aprendizaje basados en 
Soft-Computing. Optimización inteligente. Técnicas de Inteligencia Computacional 
para Optimización. G. Joya, M. Atencia, A. Ochoa and S. Allende. Málaga, SPICUM e 
ISTANET. 1: 413-452 

3. Piñero, P., L. Arco, et al., Two New Metrics for Feature Selection in Pattern 
Recognition. A. Sanfeliu, J. Ruiz-Shulcloper ed. Lecture Notes in Computer Science, 
ed. G. Goos, J. Hartmanis, and J.v. Leeuwen. Vol. 2905. 2003, Berlin: Springer-
Verlag. 488-497. 

4. Piñero, P., L. Arco, et al. (2003b). "Algoritmos Genéticos en la construcción de 
funciones de pertenencia borrosas." Revista Iberoamericana de Inteligencia Artificial 
18: 45-54. 

5. Del-Pino, U., D. Gálvez, et al. (2002). "Analysis of Mixture Experiments Using Genetic 
Algorithms." The Mathematic Preprints Server: p. 18 

6. Piñero, P., M. García, et al. (2001). "Máquina de aprendizaje para la generación de 
reglas borrosas." Controle & Automacao 12: 241-252 

7. Piñero, P., Biblioteca de componentes COM, DCOM para el trabajo con Algoritmos 
Genéticos, in Departamento de Ciencias de la Computación. 2000, Universidad 
Central "Marta Abreu" de Las Villas: Santa Clara. p. 107. 

Publicaciones en memorias de eventos  


INTRODUCCIÓN 

7 

1. Piñero, P., et al. Sistema Inteligente para la Clasificación de Etapas de Sueño (SISES 
1.0). in VIII Iberoamerican Conference on Artificial Intelligence Workshop 
"Bioinformatics and Artificial Intelligence". 2002a. Sevilla, Spain. 

2. Piñero, P., et al. Two Machine Learning Algorithms. in X Convención Internacional y 
Feria Informática 2004. 2004b. Ciudad de la Habana. 

3. Piñero, P., Z. Z. García, et al. (2004). Plataforma inteligente de ayuda a la toma de 
decisiones y el diagnóstico. XV Forum Provincial de Ciencia y Técnica, Premio 
Relevante Distinguido Especial, Ciudad de la Habana, Comisión Provincial Forum 
Ciencia y Técnica. 

4. Caballero, Y., et al. Selección de rasgos relevantes para el análisis de datos a través 
de los conjuntos aproximados. in X Convención Internacional y Feria Informática 
2004. 2004. Ciudad de la Habana: CITMATEL. 

5. Piñero, P., et al. Discovering Patterns in Sleep Stage Classification Problems Using 
Fuzzy Sets. in VIII Congreso Iberoamericano de Reconocimiento de Patrones CIARP 
2003. 2003d. La Habana 

6. Piñero, P., et al. SICES: Sistema Inteligente para la clasificación de etapas del sueño. 
in IV Congreso Internacional de Informática Médica de la Habana. Informática 2003. 
2003d. Palacio de las convenciones. La Habana Cuba. 

7. Piñero, P., M.M. García, and L. Arco Plataforma para el desarrollo de sistemas de 
ayuda al diagnóstico y la clasificación. in Conferencia de la Sociedad de Matemática 
y Computación COMPUMAT2003. 2003. Sancti Spiritus: Sociedad de Matemática y 
Computación, Cuba. 

8. Piñero, P., et al. Sistema para la ayuda al diagnóstico y la construcción de 
hipnogramas. in Congreso cubano de matemática y computación COMPUMAT 2003. 
2003b. Sancti Spíritus: Sociedad Cubana de Matemática y Computación.  

9. Piñero, P., et al. Sleep Stage Classification using Fuzzy Sets and Machine Learning 
Techniques. In Twelfth Annual Computational Neuroscience Meeting. 2003a. Alicante, 
Spain. 

10. Piñero, P., et al. Sistema de ayuda al diagnóstico y la clasificación automatizada 
(MLClassif  1.0). in IV Congreso Internacional de Informática Médica de la Habana. 
Informática 2003. 2003a. Palacio de las convenciones. La Habana Cuba. 

11. Piñero, P., et al. Diferentes enfoques en la construcción de funciones de membresía 
de los conjuntos borrosos. Aplicación potencial en Bioinformática. in I Congreso 
Internacional de Tecnologías y Contenidos Multimedia en Ambientes digitales. 
Informática 2002. 2002c. Palacio de las convenciones, La Habana cuba. 

12. Piñero, P., et al. Aprendizaje de reglas borrosas a partir de Casos  para la 
clasificación automatizada. Aplicación potencial en Bioinformática. in I Congreso 


INTRODUCCIÓN 

8 

Internacional de Tecnologías y Contenidos Multimedia en Ambientes digitales. 
Informática 2002. 2002b. Palacio de las convenciones, La Habana Cuba.  

13. Piñero, P., et al. Computational Tools for Bioinformatics. In British-Cuban 
Bioinformatics Workshop. 2002. University of Havana.  

14. Arco, L. and P. Piñero. Algoritmos genéticos en la construcción de funciones de 
membresía. Aplicaciones en Bioinformática. in Memorias VIII Encuentro Internacional 
de Informática de la Habana Informática 2002. 2002. La Habana.  

15. Piñero, P. GACOM Biblioteca de Componentes de Algoritmos Genéticos. in COMAT 
2001. 2001. Matanzas, Cuba: Universidad de Matanzas. 

16. Piñero, P.-Y., et al. Un modelo para el aprendizaje y la clasificación basado en 
técnicas de softcomputing. in I Taller de Inteligencia Artificial de la UCI, Conferencia 
Científica UCiencia 2005. 2005. Universidad Ciencias Informáticas, Ciudad de la 
Habana: Universidad de Ciencias Informáticas. 

17. Yzquierdo, R., et al. Un modelo basado en técnicas de Inteligencia Artificial para el 
desarrollo de sistemas para l diagnóstico, control y seguimiento de la hipertensión 
arterial. in I Taller de Inteligencia Artificial de la UCI. Conferencia Científica UCiencia 
2005. 2005. Universidad de Ciencias Informáticas, Ciudad de la Habana: Universidad 
de Ciencias Informáticas. 

18. Morales, A., et al. Sistema para la ayuda a la toma de decisiones en el diagnóstico, 
evaluación, control y seguimiento de pacientes con hipertensión arterial. in I Taller de 
Software para la Salud, Conferencia Científica UCiencia 2005. 2005. Universidad de 
Ciencias Informáticas, Ciudad de la Habana: Universidad de Ciencias Informáticas. 

19. Medina, E., et al. Hyperweb un sistema para el diagnóstico, tratamiento y seguimiento 
de pacientes con hipertensión arterial. in TECBIOMED 05. 2005: Instituto Central de 
Investigaciones Digitales. 

20. Piñero-Pérez, P., et al. Un modelo para la ayuda a la toma de decisiones basado en 
técnicas de softcomputing. Uso potencial en el diagnóstico médico especializado. in 
TECBIOMED 05. 2005: Instituto Central de Investigaciones Digitales. 

21. Yzquierdo, R., et al. Combinación de un Sistema Basado en Reglas y Técnicas de 
Softcomputing para el tratamiento de la HTA. in TECBIOMED 05. 2005: Instituto 
Central de Investigaciones Digitales. 

Registros de software 

1. García, M. and P. Piñero, Easy Simulation: Plataforma para  el desarrollo de 
simulaciones estocásticas discretas versión 2.0. 2002, 010917-10917: Cuba. p. 22 

2. Piñero, P., et al., FuzzyPack: Plataforma para el desarrollo rápido de sistemas de 
inferencia borrosos versión 1.0. 2002, 010915-10915: Cuba. p. 25 


INTRODUCCIÓN 

9 

3. Piñero, P., U. Del-Pino, and D. Gálvez, GASMIX: Algoritmos Genéticos para mezclas 
versión 1.0. 2002, 09356-9356: Cuba. p. 30 

4. Piñero, P., GACOM Biblioteca de Componentes para el trabajo con Algoritmos 
Genéticos versión 2.0. 2002, 09357-9357: Cuba. p. 28 

Estructura del trabajo 

La tesis está conformada por tres capítulos. El primer capítulo discute las ideas básicas y las 
diferentes estrategias utilizadas en el aprendizaje y la clasificación. Se hace una evaluación 
crítica de las ventajas y desventajas de diferentes enfoques resaltando en cada momento 
cuando debe usarse cada uno de ellos. Se hace un análisis del estado del arte relacionado 
con diferentes estrategias para la generación y la optimización de las bases de reglas 
borrosas. 

En el capítulo 2 se presenta un modelo basado en técnicas de softcomputing con aplicación 
potencial en la resolución de problemas aprendizaje, clasificación y de ayuda a la toma de 
decisiones y que integra técnicas para el aprendizaje, la optimización y la explotación de 
bases de reglas borrosas. Se presentan los algoritmos MLRul y GENRUL5 para la 
generación de reglas borrosas a partir de datos numéricos y simbólicos. Se presenta un 
algoritmo que permite la optimización de una base de reglas borrosas utilizando estrategias 
heurísticas inspiradas en las redes neuronales. Se presentan dos diseños de algoritmos para 
la optimización de reglas borrosas basados en la aplicación de los algoritmos de estimación 
de distribuciones UMDA y EMNAglobal. 

En el capítulo 3 se describen la instrumentación del modelo en los sistemas: “Sistema 
Inteligente para la Clasificación de Etapas de Sueño” (SICES) [66] y “Machine Learning and 
Classification” (MLClassif) [65]. Se presenta la validación los sistemas desarrollados en la 
prueba con datos suministrados por el Centro de Neurociencias de Cuba, caso de SICES, y 
en bases de datos internacionales de aprendizaje automático en el caso de MLClassif. 
Finalmente se presentan las conclusiones y recomendaciones de esta tesis. 


10 

Análisis del estado del arte de estrategias para el aprendizaje y 
la clasificación basados en la lógica borrosa  
Los procesos de aprendizaje con frecuencia son aplicados de forma previa o se muestran 
embebidos en procesos de clasificación, esta es la principal razón por lo que generalmente 
el aprendizaje y la clasificación son tratados juntos y no de forma aislada. 

En este capítulo se abordan temas como el aprendizaje automatizado (machine learning) 
como paso necesario para la resolución de complejos problemas de clasificación. Se 
discuten varios enfoques de aprendizaje y clasificación, sus principales ventajas y 
desventajas y se demuestran las potencialidades de usar técnicas basadas en el 
softcomputing. Se aborda la temática de la generación de bases de reglas borrosas, como 
paso indispensable en la construcción de los sistemas borrosos y neuroborrosos 
discutiéndose diferentes estrategias y tendencias actuales. Finalmente se presentan las 
conclusiones del capítulo.   

1.1 ¿Qué es el aprendizaje automatizado? 

La definición de aprendizaje (Learning) en el diccionario deriva frases tales como “para ganar 
conocimiento o entendimiento”, “habilidad en el estudio de instrucciones”, “ganar en 
experiencia” y “modificación de la tendencia situacional por la experiencia”. Zoologistas y 
psicólogos históricamente han estudiado el aprendizaje en animales y humanos y 
ciertamente muchas técnicas actuales del aprendizaje automatizado se derivan de sus 
esfuerzos para esclarecer aspectos del aprendizaje biológico a partir de modelos 
computacionales. 

Tom Mitchell plateó: “el aprendizaje automatizado implica la búsqueda en un gran espacio de 
posibles hipótesis para determinar una que sea la que mejor satisfaga los datos observados 
y algún conocimiento previo del aprendiz” [83].  

Otra definición de aprendizaje automatizado es planteada por Oliver G. Selfridge [84] donde 
se presenta el aprendizaje como la capacidad de los sistemas de integrar y adquirir 
conocimiento a partir de la experiencia y la observación analítica. Esta capacidad permite 
que los sistemas estén continuamente en un proceso de mejora incrementando su eficiencia 
y efectividad. 

Para mejor comprensión del concepto de aprendizaje introduciremos la siguiente notación y  
nuestras consideraciones iniciales. 

Notación  

Consideramos un universo U = (A, C) formado por un conjunto de objetos o casos w ∈ U. Tal 
que existe un conjunto de nd atributos  } n, 2, 1,  i /  B  A di …={=  y un conjunto de nc clases 

} n, 2, 1,  i / c  C ci …={= . Entonces B = B1 x B2 x… dnB constituye el espacio nd 

1


ESTADO DEL ARTE EN LOS MODELOS DE APRENDIZAJE Y CLASIFICACIÓN BASADOS EN LA LÓGICA BORROSA  

11 

dimensional de rasgos cubierto por los atributos y cada objeto w de nuestro universo U está 
caracterizado por un vector a ∈ B.  

Utilizando la notación introducida y las definiciones de aprendizaje mostradas con 
anterioridad; consideramos el aprendizaje como el problema de búsqueda en el espacio de 
las posibles hipótesis, que describen el comportamiento de los objetos del universo U, hasta 
encontrar aquella hipótesis que mejor describa y se adapte a los objetos de dicho universo . 
Además el aprendizaje debe garantizar ganar conocimiento que nos permita generalizar 
satisfactoriamente las leyes que rigen el comportamiento de los objetos de U más allá del 
alcance de estos objetos. En esencia podemos decir que el aprendizaje automatizado 
investiga los mecanismos por los cuales el conocimiento es adquirido a través de la 
experiencia y se muestra como un campo interdisciplinario donde intervienen: la estadística, 
la lógica, las matemáticas, las estructuras neuronales, la información teórica, la psicología, la 
biología y las técnicas de inteligencia artificial.  

Considerando lo anterior, mostramos el aprendizaje como un proceso dividido en dos 
importantes fases [85] como describe la siguiente fórmula: 

La primera fase tiene como primer objetivo la valoración, exploración, prueba y evaluación 
críticas de los modelos para tomar el más apropiado dependiendo del problema concreto a 
resolver y de la naturaleza de los datos. Este primer paso persigue convertir los datos en 
información que pueda ser utilizada para el proceso posterior de extracción de conocimiento, 
en este contexto se asume que los datos están en un nivel menor que la información [24]. Su 
segundo objetivo es la preparación de las fuentes de datos y la selección de las mismas; hay 
que tener en cuenta que en las fuentes de datos se concentra gran parte de la 
responsabilidad en la eficiencia de los mecanismos de aprendizaje y clasificación. Algunas 
de las técnicas que se aplican para garantizar el segundo objetivo son las siguientes: 
limpieza de datos donde se analiza el tratamiento de valores ausentes y el tratamiento de 
datos con ruido [86, 87] la integración y transformación de datos que persigue la detección y 
solución de conflictos en los valores de los datos [88], la reducción de datos que permite 
reducir la dimensión del espacio de búsqueda concentrándose en eliminar o seleccionar 
instancias o casos [89-91] y finalmente la selección de atributos, que es un método 
alternativo a la reducción y persigue los mismos objetivos que esta pero ataca el problema 
concentrándose en la determinación de los atributos relevantes [5-7, 50, 58, 92]. Hay que 
señalar que el segundo objetivo de esta primera etapa muchas veces se trata combinado 
con la segunda etapa y las técnicas se aplican de forma empotradas dentro de los modelos.  

La segunda fase es el proceso del cálculo de resúmenes y valores derivados. En esta etapa 
se perfeccionan constantemente las técnicas y algoritmos que se encargan de extraer y 

Aprendizaje  = Análisis inteligente de 
fuentes de datos y 

selección 

Adaptación y extracción 
de conocimiento 

+ 


ESTADO DEL ARTE EN LOS MODELOS DE APRENDIZAJE Y CLASIFICACIÓN BASADOS EN LA LÓGICA BORROSA  

12 

representar el conocimiento de forma adecuada en dependencia de nuestros intereses. Se 
combinan técnicas potenciando las ventajas de cada una y atenuando sus debilidades. En la 
segunda subsección de este capítulo se analizan algunas estrategias y técnicas de 
aprendizaje y clasificación que se usan en esta etapa del aprendizaje.  

Teniendo en cuenta diferentes formas de selección y adaptación algunos autores [85] 
clasifican las estrategias de aprendizaje en: aprendizaje deductivo, aprendizaje analítico, 
aprendizaje analógico, aprendizaje inductivo y aprendizaje mediante descubrimiento. Otra 
posible clasificación de los métodos de aprendizaje considerando el tipo de estrategia y las 
ayudas que recibe un sistema de aprendizaje [83, 84] es: supervisado, aprendizaje parcial o 
semisupervisado y no supervisado. 

En esta tesis se trata el problema del aprendizaje inductivo supervisado para la resolución de 
problemas de aprendizaje y clasificación. Se aprende a partir de un universo de objetos o 
ejemplos dados como entrada, y agrupados en un número determinado de clases. A partir de 
la muestra de objetos se induce nuevo conocimiento y el dilema consiste en, dado un nuevo 
objeto, poder establecer sus relaciones con cada una de dichas clases. De forma auxiliar se 
utiliza en la construcción de los conjuntos borrosos un algoritmo basado en un aprendizaje 
no supervisado. 

Dada la gran variedad de algoritmos relacionados con el aprendizaje inductivo supervisado 
se podría pensar que todo está resuelto y que solo bastaría escoger alguno de ellos. Pero el 
hecho es que aún los modelos son insuficientes. Cuando nos enfrentamos a situaciones 
reales con frecuencia aparecen elementos tales como: el ruido, la ambigüedad, la 
incertidumbre, la incompletitud, la inconsistencia y la imprecisión; elementos negativos que 
generalmente son evitados por los modelos clásicos de aprendizaje y clasificación pero que 
no pueden ser ignorados. Los problemas de incompletitud y la falta de información 
generalmente son tratados con técnicas de lógica no monotónica, los problemas de 
inconsistencia y datos contradictorios con frecuencia son atacados usando conjuntos 
aproximados (rough sets), la incertidumbre en la veracidad de las afirmaciones usualmente 
se maneja usando modelos basados en probabilidades y finalmente elementos relacionados 
con la vaguedad que parece cuando los conceptos no están bien definidos, cuando no hay 
límites entre los conceptos y la imprecisión que surge como resultado de errores en 
procesos de medición son generalmente tratados con técnicas basadas en la lógica borrosa 
[93, 94]. Una posible solución al tratamiento de estos elementos negativos de forma 
simultánea aparece con la aplicación de técnicas de softcomputing.  

El término softcomputing lo introduce Zadeh para denotar una aproximación al razonamiento 
humano que deliberadamente hace uso de la tolerancia humana a imprecisiones y 
vaguedades para obtener soluciones razonables que son fáciles de manipular. Bajo este 
principio, los sistemas borrosos, las redes neuronales, la computación evolutiva, el 
razonamiento probabilístico y las combinaciones de dichas técnicas son consideradas como 
softcomputing [26]. En general existen un grupo de propiedades que caracterizan a las 


ESTADO DEL ARTE EN LOS MODELOS DE APRENDIZAJE Y CLASIFICACIÓN BASADOS EN LA LÓGICA BORROSA  

13 

técnicas y sistemas basados en softcomputing y que pueden ayudarnos a identificar los 
límites de este campo [28, 94] como mostramos a continuación:  

• Es lo opuesto al hard computing, no es prescriptivo en la solución de un problema, en 
este campo no hay soluciones programadas para cada posible situación. 

• Sus técnicas son robustas ante entornos con entradas ruidosas y tienen una alta 
tolerancia a la imprecisión de los datos con los que opera. 

• Es una necesidad cuando la información de que disponemos es imprecisa; y segundo 
cuando existe una tolerancia a la imprecisión que podría ser explotada para ganar 
robustez, en soluciones de bajo costo y en mayor capacidad de modelación.  

Ante los objetivos propuestos en esta tesis y teniendo en cuenta lo anteriormente explicado 
en la próxima subsección discutiremos brevemente algunos enfoques utilizados en el 
aprendizaje y la clasificación y analizaremos ventajas y desventajas de los mismos. 
Mostraremos además que ante las situaciones problémicas a resolver en el capítulo 3 
necesitamos aplicar las técnicas de softcomputing.  

1.2 Diferentes enfoques empleados en el aprendizaje y la clasificación  

Comenzamos esta sección discutiendo que entendemos por clasificación puesto que ya 
discutimos con anterioridad el término aprendizaje.  

La clasificación se puede entender como el proceso de reconstrucción o predicción de clases 
cw de un objeto w dado su vector característico xw  [19]. Un clasificador puede ser definido 
como una función g: A→ C. Podemos decir que el objeto de estudio del aprendizaje y la 
clasificación es el descubrimiento de modelos, familias de funciones, que permitan 
representar g apropiadamente para diferentes problemas así como el desarrollo de 
algoritmos que permitan aprender estos modelos a partir de datos.  

En general consideramos que todos los métodos de aprendizaje y clasificación son 
extensiones de técnicas clásicas tales como: el análisis de discriminante, los métodos 
basados en árboles de decisión como la técnica estadística CHAID: Chi-square Automatic 
Interaction Detector, los métodos de estimación de densidades (KNN: k-nearest neighbors) o 
las técnicas jerárquicas de formación de grupos; procedimientos clásicos que constituyen 
prototipos y que han sido refinados y extendidos de diversas formas [53]. Los métodos de 
aprendizaje y clasificación pueden ser organizados atendiendo a su naturaleza en métodos 
estadísticos, modelos o algoritmos matemáticos para el reconocimiento de patrones (RP), 
estrategias basadas en árboles de decisión, sistemas basados en el conocimiento (SBC) 
entre otras ver Anexo 1 


ESTADO DEL ARTE EN LOS MODELOS DE APRENDIZAJE Y CLASIFICACIÓN BASADOS EN LA LÓGICA BORROSA  

14 

1.2.1 Estrategias estadísticas  

Las técnicas estadísticas se caracterizan generalmente por tener un evidente modelo de 
probabilidades como base, el cual indica una probabilidad de un objeto de estar en cada una 
de las clases en lugar de una simple clasificación.  

Explicamos brevemente el funcionamiento de algunos métodos estadísticos [53, 95]: 

• Discriminante Lineal de Fisher es uno de los procedimientos de clasificación más 
antiguos. Los objetos o puntos son clasificados de acuerdo a la posición que ocupan 
respecto a dicho hiperplano ver Anexo 2, Figura 8. 

• Discriminante lineal por máxima probabilidad asume que los vectores de atributos de 
ejemplos pertenecientes a la clase Ci son independientes y siguen una cierta 
distribución de probabilidad con función de densidad if . En la clasificación de un nuevo 

punto este es asignado a la clase para la cual la función de densidad probabilística sea 
mayor.  

• Discriminante cuadrático es similar al lineal, sólo que la frontera entre dos regiones 
discriminantes puede ser una superficie cuadrática. Un discriminante cuadrático es 
calculado para cada clase y en la clasificación de un nuevo objeto la clase donde se 
obtenga el mayor valor de pertenencia es seleccionada.  

• Regresión Logística también opera seleccionando un hiperplano para separar las clases 
tanto como sea posible, a diferencia del discriminante lineal esta técnica persigue 
maximizar una probabilidad condicional.  

En el Anexo 2, Figura 9 se muestra la separación de los objetos a partir de la aplicación de 
los métodos anteriormente discutidos. El aprendizaje en estos métodos se caracteriza por la 
estimación de los parámetros de las funciones de densidad probabilística y generalmente se 
basan en la determinación de la probabilidad máxima. 

Tendencias actuales en el uso de las técnicas estadísticas muestran el uso de estas 
combinadas con otros métodos o como parte de sistemas multiclasificadores [3]. Hay que 
señalar que estos métodos se deben aplicar cuando se puede encontrar un modelo ya sea 
lineal, logístico, cuadrático etcétera que permita aproximar la interrelación entre los datos 
adecuadamente [96]. En caso que la interrelación entre los datos sea excesivamente 
compleja es recomendable utilizar otras técnicas como por ejemplo las redes neuronales u 
otras.  

1.2.2 Algoritmos Lógico-Combinatorios para Reconocimiento de Patrones 

Este enfoque parte de la descripción de los objetos en forma de vectores donde cada 
componente del vector representa uno de los rasgos analizados y el valor de dicha 
componente, el valor particular que tiene un objeto respecto a ese rasgo [97]. La idea básica 


ESTADO DEL ARTE EN LOS MODELOS DE APRENDIZAJE Y CLASIFICACIÓN BASADOS EN LA LÓGICA BORROSA  

15 

de la clasificación de los objetos según este enfoque es la evaluación de los objetos 
haciendo uso de diferentes métricas y algoritmos [98] tales como: 

• Regla del máximo peso: Esta regla anuncia que un objeto pertenece a la clase 
respecto a la cual tenga un mayor peso informacional.  

• Regla del vecino más cercano: Esta regla le asigna a un objeto, la clase a la que 
pertenece el objeto que se encuentre más cercano de acuerdo a una distancia.  

• Regla de los k-vecinos más cercanos: mediante una distancia se determinan los k 
objetos más cercanos al cuestionado, la clase del nuevo objeto se toma como la más 
frecuente en los k-vecinos más cercanos [4].  

• Regla del ideal: Es la regla del vecino más cercano o el vecino más semejante 
aplicada a los ideales de la clase. Se entiende por ideal informativo al objeto w, tal 
que su peso informacional es maximal con respecto a su clase. 

Otras tendencias en el análisis lógico combinatorio parten de la idea del análisis de 
subfamilias de rasgos (como proyecciones en subespacios del espacio n-dimensional) y 
sobre la base de esas subfamilias de rasgos, hacer conclusiones parciales, temporales, que 
permitan posteriormente sacar una conclusión final y más general. Esta es la idea 
fundamental en la que se sustentan los algoritmos de votación [7]. Otros trabajos y 
algoritmos se basan en el concepto de testor y el concepto de testor por clase [5, 6, 8]. 

El aprendizaje asociado a esta forma de clasificación esta sujeta a la posibilidad de poder 
encontrar métricas y distancias adecuadas en dependencia de la naturaleza de los datos, 
aspecto que con frecuencia se torna muy difícil y depende de la subjetividad de los expertos 
y las características propias de los problemas. Otra característica propia de estos modelos 
es que basan su funcionamiento en el cálculo de distancias entre los objetos a clasificar y los 
del conjunto de entrenamiento, por tanto, la clasificación de un nuevo objeto tiene un alto 
grado de dependencia del conjunto de entrenamiento. Esta alta dependencia del conjunto de 
entrenamiento afecta la robustez del modelo en entornos donde aspectos como el ruido y la 
imprecisión de los datos aparece.   

1.2.3 Estrategias basadas en árboles de decisión 

Una estrategia pionera en este campo es el análisis CHAID cuya extensión ha dado origen a 
otros métodos. La técnica CHAID divide a una población de objetos en grupos de acuerdo a 
los valores de los rasgos predictores de dichos objetos y sus interacciones [53, 99]. En 
general la inducción de los árboles de decisión está basada en algoritmos de aprendizaje 
discriminativo por medio de particionamientos recursivos. En cada nodo diferente de las 
hojas se plantea la pregunta ¿Cuál atributo de los no seleccionados aún es el que mejor 
discrimina los casos del conjunto de aprendizaje que pertenecen a clases diferentes? Se 
evalúan todos los atributos restantes y el que mejor discrimine a los casos se ubica en el 
nodo actual y por cada valor posible de este atributo se busca un nodo descendiente. 


ESTADO DEL ARTE EN LOS MODELOS DE APRENDIZAJE Y CLASIFICACIÓN BASADOS EN LA LÓGICA BORROSA  

16 

El algoritmo CART [10] es otro algoritmo basado en árboles de decisión que permite el 
trabajo con datos incompletos, y que incorpora estrategias de poda con el fin de obtener 
árboles donde se combine apropiadamente la capacidad de predicción con la cantidad de 
nodos. 

Otros modelos basados en esta estrategia son los algoritmos ID3 [12], que solo permite el 
tratamiento de datos simbólicos, y sus extensiones C4.5 [13] y C5.0 [100] que posibilitan 
también el tratamiento de datos numéricos. En el caso de los algoritmos propuestos por 
Quinlan basan su funcionamiento en una heurística hill-climbing y el criterio de selección de 
rasgos que usa se basa en el cálculo de la ganancia de la entropía o de la ganancia radial 
[11]. El criterio de selección basado en la ganancia de la entropía tiene la dificultad que 
favorece la selección de rasgos con mayor cantidad de posibles valores, el criterio basado 
en la ganancia radial por su parte resuelve este problema pero ante determinadas 
situaciones puede caer en indefiniciones o provocar que atributos con una baja ganancia 
sean seleccionados por sobre otros con mayor calidad [101].   

1.2.4 Sistemas basados en el conocimiento de la Inteligencia Artificial 

En términos generales, la estructura de un sistema basado en el conocimiento (SBC) puede 
ser representada a partir de la siguiente fórmula:  

SBC = MI + BC + [Explicación] + [Adaptación e incorporación de nuevo conocimiento]… 

La base de conocimiento BC es uno de los elementos fundamentales de los SBC es la 
estructura encargada de almacenar el conocimiento. La máquina de inferencia MI es el otro 
elemento fundamental y constituye el método de solución que “razona” usando el 
conocimiento contenido en la BC. Como se puede ver una de las principales características 
que identifican a los SBC es la distinción entre conocimiento y estrategia de control utilizada 
para el manejo de este.  

Existe una gran variedad de SBC, estos se diferencian por la forma de representar el 
conocimiento y por la naturaleza de la máquina de inferencia asociada, ejemplo de ellos son: 
sistemas basados en probabilidades SBP, en reglas SBR, en frames SBF, sistemas basados 
en casos CBR, los modelos conexionistas o basados en pesos, los sistemas de inferencia 
borrosos etcétera [11, 14-17]. La tabla del Anexo 3 muestra un resumen de las principales 
propiedades de algunos sistemas basados en el conocimiento.  

Por su importancia para este trabajo discutiremos brevemente acerca de los siguientes 
sistemas basados en el conocimiento: sistemas basados en reglas, sistemas basados en 
casos, las redes neuronales, los sistemas de inferencia borrosos y neuroborrosos. 

Sistemas basados en reglas (SBR) se caracterizan porque la forma de representación del 
conocimiento son las reglas de producción y como método de inferencia utilizan la regla de 
modus ponens. Las reglas de este tipo de SBC expresan siempre una condicional, con 


ESTADO DEL ARTE EN LOS MODELOS DE APRENDIZAJE Y CLASIFICACIÓN BASADOS EN LA LÓGICA BORROSA  

17 

antecedentes y un consecuente. La interpretación de una regla parte del hecho que si los 
antecedentes se satisfacen entonces se obtiene el consecuente, este tipo de reglas se 
conoce en la literatura como reglas duras[102]. Como ventaja fundamental muestran su 
capacidad de interpretación y explicación de la inferencia. Pero solo deben ser utilizados en 
los casos donde el conocimiento pueda ser representado de forma eficiente en forma de 
reglas duras evitando situaciones donde haya inconsistencia e imprecisión de los datos [17] 
y evitando su aplicación en problemas donde exista vaguedad en la definición de los 
conceptos [93]. 

Los sistemas basados en casos (CBR) basan sus potencialidades para el aprendizaje en los 
mecanismos de detección de similaridades entre casos y también en la propiedad de 
incorporar de forma natural nuevo conocimiento mejorando gradualmente su funcionamiento 
[15, 103]. Su principal limitación radica en la capacidad de representación de los valores de 
los rasgos [104], aspecto que dificulta su aplicación en situaciones que requieren 
representaciones de casos complejas como por ejemplo las que se presentan cuando existe 
un alto grado de interrelación entre los rasgos. También hay que señalar que la definición de 
las funciones de semejanza y los mecanismos de selección de rasgos para cada problema 
específico son problemas abiertos en este campo, cuya solución depende en gran medida 
de la experiencia de los expertos. 

Redes neuronales artificiales también conocidos como modelos conexionistas consiste de un 
conjunto de elementos computacionales simples (unidades Ui o neuronas artificiales), que 
están unidos por arcos dirigidos que le permiten comunicarse. Cada arco tiene asociado un 
peso numérico Wij que indica la significación de la información que llega por este arco, o sea, 
la influencia que tiene la activación alcanzada por la neurona Ui sobre la neurona Uj es 
precisamente en los pesos donde se almacena de forma intrínseca el conocimiento de este 
tipo de sistema. Hay tres aspectos que caracterizan a las redes neuronales y permiten 
distinguir a cada uno de los diversos modelos que se reportan en la bibliografía [16], ellos 
son: la topología de la red (Anexo 7), las características de los nodos (modelo de la neurona) 
y el mecanismo de aprendizaje. 

El uso de las redes neuronales ha mostrado una alta eficiencia en la resolución de diversos 
problemas, no obstante su efectividad se les señala que se comportan como cajas negras  
y no facilitan la interpretación de los resultados [16]. Tendencias actuales en el uso de estas 
se presenta en combinación con otros modelos [29, 105, 106] como partes integrantes de 
sistemas multiclasificadores, sistemas neuroborrosos [107, 108] y redes neuronales 
ensambladas [109].   

1.2.4.1 Los sistemas de inferencia borrosos y neuroborrosos  

Sistemas de inferencia borrosos 

La base del funcionamiento de los sistemas de inferencia borrosos son los conjuntos 
borrosos. A diferencia de los conjuntos clásicos en estos conjuntos la pertenencia de un 


ESTADO DEL ARTE EN LOS MODELOS DE APRENDIZAJE Y CLASIFICACIÓN BASADOS EN LA LÓGICA BORROSA  

18 

elemento se convierte en un problema de grado. Más formalmente podemos decir que un 
conjunto borroso A en un universo de discurso U está caracterizado por una función de 
pertenencia μ a  la cual a cada elemento en el dominio le asigna un grado de pertenencia al 

conjunto en el intervalo [0,1] y se representa de la forma μ a :U→[0, 1] [18, 110]. De esta 
forma un mismo elemento puede pertenecer a varios conjuntos simultáneamente solo que 
con cierto grado de pertenencia. Cada conjunto borroso tiene asociado además un término 
lingüístico de forma tal que la función de pertenencia asociada a un conjunto está ligada a 
una palabra como por ejemplo: bajo, medio, más o menos alto, alto, muy alto, etcétera.  

En la representación y construcción de las funciones de pertenencia se pueden utilizar 
diferentes modelos matemáticos tales como: funciones triangulares, funciones trapezoidales, 
funciones campana, funciones simoidales, etcétera; ver Anexo 5 . Por la importancia para 
este trabajo más adelante en la sección “Diferentes enfoques en la construcción de 
funciones de pertenencia” se aborda con mayor profundidad esta temática. 

El centro de las técnicas de modelación borrosa lo constituyen las variables lingüísticas 
concepto que agrupa a los conjuntos borrosos asociados a una misma variable. Una variable 
lingüística [108, 110] se caracteriza por un quíntuplo (x, T(x), X, G, M) en el cual x es el 
nombre de la variable, T(X) es el conjunto de términos lingüísticos, X es el universo de 
discurso, M es una regla semántica la cual asocia a cada valor lingüístico Z su significado 
M(Z), donde M(Z) denota un conjunto borroso en X y G es el conjunto de reglas sintácticas 
de generación de términos compuestos, a partir de los términos atómicos que configuran las 
sentencias que dan lugar a cada valor lingüístico. Ver en Anexo 4 un ejemplo de variable 
lingüística.  

Las variables lingüísticas y sus conjuntos borrosos son usados para describir relaciones 
entre variables en forma de reglas If-then que se les conoce como reglas borrosas. Se define 
una regla borrosa R como una tupla (P,Q) donde P son los conjuntos borrosos que 
representan a los antecedentes y Q es el consecuente [18].  

Los sistemas basados en reglas borrosas son llamados sistemas de inferencia borrosos 
(SIB). Estos sistemas se muestran como un espacio de hipótesis que nos permiten no tener 
necesariamente que distinguir entre valores muy similares. No son dependientes de la 
escala de los datos que ellos procesan y basan su funcionamiento en la aplicación de la 
regla de Modus Ponens generalizada [30]. Un elemento fundamental en los SIB lo constituye  
su base de conocimiento que es una base de reglas borrosas }…{= r1 R, ,R  BR  [18, 24]. 
Una característica importante que diferencia a los SIB de los Sistemas Basados en Reglas 
clásicos es que el resultado de la inferencia se obtiene de aplicar numerosas reglas1 y 

                                         
1  usualmente todas las de la base de reglas.  


ESTADO DEL ARTE EN LOS MODELOS DE APRENDIZAJE Y CLASIFICACIÓN BASADOS EN LA LÓGICA BORROSA  

19 

conciliar las inferencias parciales de estas a partir de un procedimiento de agregación Anexo 
6 Figura 13. 

En general el esquema de evaluación de cada regla se basa en la aplicación de una TNorma 
mientras que el procedimiento de agregación se basa en la aplicación de una CoNorma. 
Como ejemplos de TNormas y CoNormas usualmente se usan las combinaciones min-max y 
producto-max [18, 111] ver Anexo 6.  

Existen tres tipos fundamentales de sistemas de inferencia borrosos: el modelo de 
Mamdami, Sugeno y Tsukamoto que se diferencian en la forma del consecuente de sus 
reglas borrosas [18] ver Anexo 6. Para la aplicación en problemas de clasificación, que es 
nuestro caso, con frecuencia se utiliza el Sugeno grado cero precisamente por la estructura 
de las reglas que este tipo de sistema representa [112]. Este modelo también conocido como 
TSK, por sus autores Takagi, Sugeno y Kang [113], utiliza reglas de la forma: Si “x es A” y “y 
es B” entonces z=f(x, y). Donde A y B son conjuntos borrosos en el antecedente y z 
usualmente f(x, y) es un polinomio cuyo grado determina el grado del modelo borroso 
Cuando f es una constante al sistema borroso correspondiente se le llama “modelo borroso 
Sugeno de grado cero”. 

El centro de los sistemas borrosos es la base de reglas. Si esta es construida solo a partir 
del conocimiento adquirido previamente por un experto o grupo de expertos podría 
usualmente no funcionar correctamente cuando es aplicado. Esto puede ocurrir porque los 
expertos podrían equivocarse acerca de la localización de determinados puntos 
característicos en las funciones de pertenencia, respecto al número de reglas o respecto a la 
indistinguibilidad de determinadas áreas del espacio de búsqueda. La aplicación de técnicas 
de aprendizaje automático ha contribuido a eliminar el cuello de botella que significada la 
construcción manual de la base, pero aún queda mucho por hacer. En la sección generación 
de reglas borrosas se discute esta problemática. 

Sistemas neuroborrosos 

El término sistema neuroborroso se refiere a la combinación de las redes neuronales y los 
sistemas de inferencia borrosos. Es necesario aclarar que no basta que una red neuronal y 
un sistema de inferencia borroso sean usados juntos para estar en presencia de un modelo 
neuroborroso. Un sistema neuroborroso es una forma de crear un sistema de inferencia 
borroso utilizando algún tipo de heurística o método de aprendizaje inspirado en los 
mecanismos de aprendizaje usados en las redes neuronales [24]. 

Los sistemas neuroborrosos pueden ser clasificados por sus topologías. Veamos dos 
posibles representaciones para una mejor comprensión a través de los gráficos de la Figura 
22 Anexo 8. Ambos gráficos representan un sistema borroso con las siguientes reglas: 

R1: Si x1 es grande y x2 es viejo entonces y es malo 

R2: Si x1 es pequeño y x2 es nuevo entonces y es bueno 


ESTADO DEL ARTE EN LOS MODELOS DE APRENDIZAJE Y CLASIFICACIÓN BASADOS EN LA LÓGICA BORROSA  

20 

La representación de la Figura 22 (a) Anexo 8 es conocida como orientada a nodos porque 
en este tipo de representación todos los parámetros de las funciones de pertenencia residen 
dentro de los nodos mientras que los pesos de la red no tienen porque tener valores, estos 
pueden ser considerados 1. La representación orientada a nodos de los sistemas borrosos 
facilita desde su implementación la interpretabilidad del sistema de inferencia al no tener en 
cuenta pesos en la conexiones, cuyo significado semántico con frecuencia es difícil de 
explicar. En esta implementación las capas de la red no están completamente conectadas 
sino que las conexiones tienen lugar a partir de la presencia de las reglas borrosas y las 
relaciones que estas representen dentro del sistema borroso. La capa de los antecedentes 
en este modelo es donde se encuentran los conjuntos borrosos y sus funciones de 
pertenencia, es la capa principal donde tiene lugar las modificaciones durante el aprendizaje. 

La estructura de la Figura 22 (b) Anexo 8 es conocida como orientada a conexiones, en esta 
representación los conjuntos borrosos actúan como pesos de la red neuronal. Esta 
representación es más parecida a la de una red neuronal desde el punto de vista que los 
algoritmos de aprendizaje modifican los parámetros de las conexiones [24]. 

En la representación de la Figura 22 (b) Anexo 8 las conexiones también codifican los 
parámetros del sistema borroso: 

• Los pesos sobre las conexiones de los antecedentes son los conjuntos borrosos 
utilizados en los términos lingüísticos de los antecedentes. 

• Los pesos sobre las conexiones de los consecuentes son los conjuntos borrosos 
utilizados en los términos lingüísticos de los consecuentes. 

1.2.4.2 Interpretabilidad versus predicción en los sistemas basados en el 
conocimiento  

Generalmente los modelos que muestran gran potencialidad en la predicción no son 
interpretables mostrándose como cajas negras como las RNA; o son interpretables pero, 
solamente por expertos como es el caso de los métodos de predicción basados en modelos 
de regresión. Muchos de los modelos que potencian la comprensión de la inferencia están 
basados en reglas, casos, etcétera y desde su construcción facilitan la interpretabilidad de 
los modelos. Las características intrínsecas de estos modelos influyen negativamente en los 
resultados de predicción sobre todo cuando se presentan situaciones entre los límites de los 
dominios de salida.  

Los sistemas de inferencia borrosos y neuroborrosos por su parte tienen capacidades de 
interpolación numérica que los convierten en herramientas apropiadas para la predicción y la 
aproximación [22, 24], al igual que las redes neuronales tienen la capacidad de modelar 
procesos complejos. Pero lo adecuado es mantener un equilibrio entre interpretabilidad y 
capacidad de predicción, si se ajusta arbitrariamente el sistema, para garantizar capacidad 
de predicción, se puede perder significativamente en interpretabilidad [28, 114]. Se podría 


ESTADO DEL ARTE EN LOS MODELOS DE APRENDIZAJE Y CLASIFICACIÓN BASADOS EN LA LÓGICA BORROSA  

21 

pensar que es mejor garantizar calidad obviando aspectos como la interpretabilidad pero 
esta propiedad es particularmente importante en áreas: donde los humanos generalmente 
toman decisiones y las máquinas ayudan en las decisiones y el diagnóstico, donde el 
conocimiento previo es utilizado en procesos de análisis de datos y la modificación de este 
conocimiento por los mecanismos de aprendizaje debe ser chequeado y finalmente en casos 
donde las soluciones deben ser explicadas o justificadas a personas no expertas [19]. 

Cada una de las técnicas tienen sus ventajas y desventajas; en este entorno el 
softcomputing se muestra como la estrategia adecuada para crear sistemas robustos, 
eficientes y donde propiedades tan importantes como la claridad e interpretación de los 
resultados no se pierda [29, 115]. Los sistemas neuronales proporcionan a la combinación la 
habilidad para el aprendizaje y la base algorítmica para el procesamiento primario de 
grandes cantidades de datos. Los sistemas borrosos proporcionan una estructura de 
razonamiento lógico (en forma de reglas if-then) y una estructura superior de procesamiento 
de resultados del procesamiento primario [108]. Finalmente los algoritmos evolutivos 
proporcionan  a las técnicas de softcomputing la capacidad de adaptación y optimización 
imponiendo además muy pocas restricciones a los modelos [21, 28]. 

1.2.5 Conclusiones del epígrafe 

 Como conclusiones de este epígrafe nos planteamos dos: 

• En la tesis desarrollaremos un modelo basado en técnicas de softcomputing porque 
nos proponemos resolver problemas asociados con la ayuda a la toma de decisiones 
y el diagnóstico médico y debemos optar por modelos que potencien un equilibrio 
entre predicción e interpretabilidad. Además nuestras fuentes de datos constituyen 
situaciones reales y no podemos obviar la aparición de elementos como la impresión, 
la vaguedad en los límites de los conceptos y la incompletitud de los datos, 
situaciones donde el uso de técnicas basadas en softcomputing muestran buenos 
resultados.  

• Atendiendo a la necesidad, para la calidad en la aplicación de técnicas de 
softcomputing, de una adecuada construcción de la base de reglas borrosas se hace 
necesario un estudio del estado del arte en la generación de bases de reglas 
borrosas y dedicaremos el siguiente epígrafe a este objetivo.   

1.3 Generación de reglas borrosas 

La estructura y el funcionamiento de los sistemas de inferencia borrosos y neuroborrosos 
dependen en gran medida de la base de reglas que estos utilicen. A construcción de la base 
de reglas se puede hacer manual o automática. La variante de construcción manual tiene 
como principal dificultad que depende en alto grado de la subjetividad de los expertos que 
construyen las reglas. Estos podrían equivocarse en la definición de los parámetros de los 
conjuntos borrosos o en la combinación de estos para la construcción de las reglas. Por otra 


ESTADO DEL ARTE EN LOS MODELOS DE APRENDIZAJE Y CLASIFICACIÓN BASADOS EN LA LÓGICA BORROSA  

22 

parte formar todas las posibles combinaciones de conjuntos borrosos para construir las 
reglas y luego refinarlas tomando finalmente la base de reglas que minimice el error en la 
clasificación es un problema engorroso si tenemos en cuenta la cantidad de posibles bases 
de reglas a considerar.  

Estimaremos a continuación la cantidad de posibles bases de reglas para demostrar la 
intratabilidad de una estrategia que pretenda construir de forma manual una base de reglas 
inicial para luego optimizarla. Con el objetivo de simplificar el cálculo consideremos que 
estamos en presencia de un sistema de inferencia borroso del tipo Sugeno grado 0 y que 
utilizamos q funciones de pertenencia borrosas del tipo triángulo μ(a, b, c) para cada variable x. 
Tal que x∈[min, max]⊂ ℜ y que min < max. Las funciones de pertenencia del tipo triángulo 
tienen tres parámetros a, b, c tal que a < b < c. En lugar de considerar a, b, c ∈ ℜ  lo cual 
generaría infinitas funciones de pertenencia tomaremos solo m+2 puntos; tal que min = x0 < 
x1 < x2 <…< xm < xm+1 = max para cada variable x, asumimos que m ≥ q. El j-ésimo conjunto 
borroso de x está representado por la función de pertenencia ),,( 11 +− jkjkjk xxxμ  donde 

}∈{1,2,3..mk j ;  kj-1 < kj < kj+1. Definimos que k0 = 0 y kq+1 = m+1. Como conclusión hasta el 

momento para cada variable x existen ⎟⎟
⎠

⎞
⎜⎜
⎝

⎛
q
m

posibles conjuntos de particiones borrosas 

diferentes, donde cada conjunto de particiones contiene q posibles funciones de pertenencia 
borrosas. 

Siguiendo nuestros razonamientos la cantidad de conjuntos o configuraciones de particiones 

borrosas en un sistema borroso con n variables es entonces 
n

q
m
⎟⎟
⎠

⎞
⎜⎜
⎝

⎛ .  

Así mismo, por cada configuración o conjunto de particiones existen (q+1)n posibles reglas, 
teniendo en cuenta que cada regla puede o no incluir a cada una de las variables y además 
que cada variable incluida puede aparecer con una de sus q funciones de pertenencia. 

Una base de reglas para una partición determinada puede o no incluir a todas las reglas 
formando subconjuntos del conjunto de reglas posibles. Por tanto por cada configuración o 

partición pueden existir 
n1)(q2 + posibles bases de reglas diferentes. Considerando ahora 

todas las configuraciones posibles y el número de bases de reglas por cada configuración 

entonces el número total de posibles bases de reglas sería: 
n1)(q2 +⋅⎟⎟

⎠

⎞
⎜⎜
⎝

⎛ n

q
m

 
Como conclusión encontrar la base de reglas apropiada sin una estrategia u algoritmo 
adecuado se convierte en un problema intratable aún cuando trabajemos con valores 
moderados de n, q, y m.  


ESTADO DEL ARTE EN LOS MODELOS DE APRENDIZAJE Y CLASIFICACIÓN BASADOS EN LA LÓGICA BORROSA  

23 

Existe una amplia variedad de métodos para inducir reglas borrosas a partir de los datos. No 
obstante todas las estrategias en este sentido las podemos reducir a tres principales:  

1. Generar reglas duras y transformar estas reglas en reglas borrosas 

2. Generar una base de reglas borrosas candidatas, generalmente compuesta por un 
número mucho mayor de reglas que la base de reglas final, y luego en un segundo 
paso seleccionar un subconjunto de reglas de la base de reglas candidatas teniendo 
en cuenta la capacidad de las mismas para representar al conjunto de datos de 
entrenamiento. 

3. Generar una base de reglas borrosas inicial a partir de los datos que se corresponda 
en número a la base de reglas final y luego someter dicha base de reglas a un 
proceso de optimización. 

Como aspecto relevante de las tres estrategias debemos conocer que la mayoría de los 
algoritmos propuestos tienen como paso inicial la generación de las variables lingüísticas y 
los conjuntos borrosos respectivos. Es por eso que dedicaremos una subsección a discutir 
brevemente diferentes enfoques utilizados en la construcción de funciones de pertenencia 
asociadas a los conjuntos borrosos. 

1.3.1 Diferentes enfoques en la construcción de funciones de pertenencia 

Los métodos más comunes empleados en la construcción de funciones de pertenencia de 
conjuntos borrosos se basan con frecuencia en alguna de las siguientes tres estrategias 
[116]: evaluación subjetiva y construcción a partir de expertos donde especialistas humanos 
especifican diferentes curvas tomando como base su experiencia, frecuencias convertidas o 
probabilidades y el aprendizaje y adaptación tomando como base la aplicación de las 
técnicas de aprendizaje automático.  

La evaluación subjetiva y construcción a partir de expertos requiere que los expertos en el 
dominio de aplicación sean capaces de entender hasta cierto punto la teoría de la 
borrosidad, elemento que no siempre se puede lograr cuando se desarrolla una aplicación. 
Además es una estrategia que depende mucho del grado de expertisidad de los 
especialistas. Una tendencia actual que tiene como base  el uso de expertos se basa en el 
uso de los métodos Delphi [117].  

Estrategias basadas en la teoría de la posibilidad y la estadística. 

Zadeh [118] a diferencia de otros como Giles[119] y Ruspini [120], plantea que las 
distribuciones de posibilidad del universo de atributos son conceptualmente distintas a las 
distribuciones de probabilidad y evitan las interpretaciones probabilísticas de los grados de 
pertenencia.  

Giles [119] y Ruspini [120] han operado con interpretaciones probabilísticas de los grados de 
pertenencia. Giles por ejemplo identifica los grados de membresía con probabilidades 


ESTADO DEL ARTE EN LOS MODELOS DE APRENDIZAJE Y CLASIFICACIÓN BASADOS EN LA LÓGICA BORROSA  

24 

subjetivas determinadas en cada situación. Ruspini, en su trabajo de algoritmos de 
clusterización borrosa, dice explícitamente que él usa una interpretación probabilística de los 
grados de membresía y establece además una fórmula en la cuál los grados de pertenencia 
de un objeto en las diferentes clases o clusters suman 1. Estos autores aplican este enfoque 
tanto al tratamiento de datos numéricos como simbólicos. Consideramos que esta estrategia 
confunde el concepto de ocurrencia de un evento en que se basa el concepto de 
probabilidad con el grado de pertenencia de un elemento a un conjunto [52]. 

En la actualidad no es común encontrar propuestas basadas en el enfoque probabilístico 
para la representación de funciones de pertenencia en el caso de datos numéricos. Este 
enfoque ha quedado para el tratamiento de datos simbólicos por la propia naturaleza de 
estos datos. En este sentido el modelo más sencillo es el que representa en la Ecuación 24 
del Anexo 9. Pero este modelo rompe la suavidad que incorporan los conceptos de la lógica 
borrosa porque de esta forma un elemento pertenece o no pertenece de forma categórica al 
conjunto [121].  

Autores como Detlef Nauck y José A. Fabri [24, 107] utilizan enfoques para el caso simbólico 
donde interviene la probabilidad de aparición del k-ésimo término (termk) Ecuación 25 del 
Anexo 9. En este caso el valor de la  probabilidad P[termI] podría estar determinado, a partir 
del análisis de la base de casos usada para la generación de las reglas borrosas y el 
ComplementValue proponen se calcule como el complemento normal, el complemento de 
Yager o el complemento Sugeno [18].  

Otra variante también propuesta por Nauck [24] se refiere a la probabilidad de aparición del 
término-i según el conjunto de casos analizados durante la construcción de la función de 
pertenencia. Además construye una sola función de pertenencia para todos los términos de 
una variable lingüística ver Ecuación 25 del Anexo 9. 

Para el caso del tratamiento de datos simbólicos consideramos que un modelo más 
adecuado podría estar basado en el cálculo de grados de separación entre los elementos 
simbólicos. De esta forma se pueden simular las posibilidades, que brindan por su 
naturaleza los datos numéricos, relacionadas con poder calcular distancias entre ellos. Estos 
grados de separación proponemos se determinen en función de las frecuencias relativas de 
aparición de los términos lingüísticos en función de las clases. Este enfoque permite una 
suavidad mayor de los conjuntos borrosos asociados a las variables simbólicas, aspecto que 
se pierde en el resto de los enfoques para el tratamiento de este tipo de variables, y que 
constituye una de las bondades fundamentales que incorpora la lógica borrosa [49]. En el 
siguiente capítulo se presenta una propuesta de función de pertenencia para el caso 
simbólico basada en los criterios anteriormente expuestos.  

Estrategias basadas en el aprendizaje automático y la adaptación 

Algunos métodos que se reportan en la bibliografía podrían requerir de la participación de 
expertos al menos en la etapa inicial de la generación de las funciones de pertenencia. Un 


ESTADO DEL ARTE EN LOS MODELOS DE APRENDIZAJE Y CLASIFICACIÓN BASADOS EN LA LÓGICA BORROSA  

25 

ejemplo de ello es el método basado en la interpolación que propone Joseph Chen[122]. 
Como premisa para la aplicación de este método es necesario conocer la pertenencia para 
un conjunto finito de puntos, información que podría ser suministrada por un experto. A este 
método se le señala que aplicando métodos de interpolación basados en los mínimos 
cuadrados y los spline no siempre se logra construir buenas funciones de pertenencia. 

Otros autores como Narazaki, Ralescu e Inoue [123, 124] proponen métodos basados en la 
determinación de los centros de gravedad de los términos lingüísticos de una variable 
lingüística. En estos centros de gravedad la función de pertenencia alcanza el máximo valor. 
Para determinar el grado de pertenencia de un nuevo elemento se define una función que 
depende de la distancia entre el nuevo elemento y el centro de gravedad del conjunto 
borroso. Una dificultad de esta estrategia radica en que solo permite representar funciones 
con dos caídas y un pico, o sea no permite representar funciones con una meseta donde se 
alcance el máximo grado de pertenencia ni funciones donde a partir de un determinado valor 
todos los que continúan tengan un máximo grado de pertenencia al conjunto. Por otra parte 
el proceso de definición de la función de distancia entre elementos del conjunto puede 
depender mucho de la subjetividad de los expertos en el dominio de aplicación.  

Hong [125, 126] propone un método de aprendizaje para derivar automáticamente funciones 
de pertenencia desde un conjunto dado de casos. Este algoritmo genera en su primer paso 
un conjunto inicial de funciones que luego simplifica a partir de operaciones de unión y 
absorción entre ellas. Como principales desventajas de este algoritmo están que solo 
permite generar funciones triangulares y que en la primera fase genera demasiadas 
funciones de pertenencia elevando significativamente la complejidad computacional del 
método. 

En ocasiones las funciones de pertenencia que se quieren obtener son funciones con 
propiedades deseables para el análisis, por ejemplo continuas, derivables etc. En estos 
casos generalmente es factible aplicar métodos numéricos clásicos o simples análisis 
matemáticos [127] que permitan determinar parámetros iniciales de las funciones de 
pertenencia y luego refinar estos aplicando técnicas de optimización [128]. Estas técnicas 
generalmente imponen como restricciones necesidad de la derivabilidad de la funciones y 
además muchas de ellas solo garantizan encontrar óptimos locales y no globales del espacio 
de búsqueda. 

Otra técnica que por su fácil uso y las pocas restricciones que imponen a los modelos han 
ganado popularidad en la construcción de funciones de pertenencia son los algoritmos 
genéticos (AG). El problema de determinar los parámetros que describen cada función 
usando esta técnica es un problema de optimización donde se pretende minimizar el error 
que se produce con la selección de diferentes valores de los parámetros y frecuentemente 
aparece aparejado con un proceso de optimización de bases de reglas borrosas [34, 36-38, 
51, 55]. No obstante su aplicabilidad se les señala como principal desventaja que no siempre 
convergen a un óptimo global sino a un elemento cuasi óptimo [129].  


ESTADO DEL ARTE EN LOS MODELOS DE APRENDIZAJE Y CLASIFICACIÓN BASADOS EN LA LÓGICA BORROSA  

26 

1.3.2 Estrategia de generación de la base de reglas duras y transformación en 
reglas borrosas 

Esta tendencia de generación de reglas borrosas se basa en explotar las potencialidades de 
los algoritmos para la generación de reglas duras [109]. Téngase en cuenta que muchos de 
estos algoritmos son bien conocidos y su efectividad ha sido probada en múltiples 
problemas. En este sentido, tres fases bien determinadas, se identifican: la generación de 
las reglas duras, la construcción de los conjuntos borrosos a partir de los datos y finalmente 
la transformación de las reglas duras en borrosas. Discutiremos en esta subsección algunos 
de los algoritmos utilizados en la generación de reglas duras y algunos de los esfuerzos 
realizados en la extensión de dichos algoritmos.  

Varios algoritmos que generan reglas duras basan su funcionamiento en los árboles de 
decisión, entre los más conocidos están el ID3 [12], C4.5 [13] y C5.0 [100]. Una extensión 
del ID3 que trata el problema de la borrosidad es el algoritmo GID3 [130] que construye un 
árbol de decisión sobre la base de atributos continuos y maneja valores borrosos en lugar de 
duros. Esta extensión tiene entre sus ventajas: que constituye un nuevo método para 
suavizar el valor del umbral y que genera un árbol de decisión más razonable y natural. No 
obstante a pesar de que se manejan los atributos como borrosos las reglas que se 
construyen a partir del árbol de decisión son duras.  

Otra extensión del ID3 para el caso borroso es el algoritmo FID3 [131] que propone un 
método de generación de reglas borrosas basado en la optimización de árboles de decisión 
borrosos previamente construidos utilizando el mismo principio del ID3. Los árboles de 
decisión borrosos construidos se diferencian de los árboles de decisión tradicionales en que 
en los arcos en lugar del valor de un atributo se ubica el conjunto borroso cuyo término 
lingüístico se corresponde con el valor del atributo. En los árboles construidos cada camino 
desde la raíz hasta las hojas corresponde con una regla borrosa. Cada nodo terminal 
representa una clase y tiene asociado un factor de certidumbre que representa la 
confidencialidad de la decisión que el representa. Esta variante se le señala que construye el 
árbol usando el criterio de selección ganancia de la entropía y por tanto arrastra con las 
debilidades del ID3 original y que se discuten en [101].    

De forma similar en [132] se propone una variante del ID3 que posibilita la generación de 
reglas borrosas a partir de las reglas duras generadas con el ID3. Entre las principales 
deficiencias de esta extensión se señala que la complejidad computacional de la misma es 
elevada [54]. 

Otra estrategia en la generación de reglas borrosas a partir de reglas duras es el uso de las 
redes neuronales [32, 109, 133]. Estos algoritmos no son los favoritos para la extracción de 
reglas, sin embargo, experimentos realizados dicen que las reglas extraídas desde redes 
neuronales son comparables con la extraídas desde los árboles de decisión en términos de 
cantidad de reglas, exactitud de las predicciones y número promedio de condiciones de la 


ESTADO DEL ARTE EN LOS MODELOS DE APRENDIZAJE Y CLASIFICACIÓN BASADOS EN LA LÓGICA BORROSA  

27 

regla. La complejidad computacional de estos algoritmos es exponencial y son modelos 
altamente costosos. Además las reglas borrosas generadas con este enfoque con frecuencia 
no son fácilmente interpretables destruyendo la potencia que aporta la representación del 
conocimiento en forma de reglas. 

El uso de método basados en conjuntos aproximados (rough sets) para la generación de 
reglas duras y su posterior conversión a borrosas es otra tendencia en la generación de 
reglas borrosas [29, 31, 134-136]. La idea básica de esta tendencia se basa en la 
construcción de reductos y la posterior combinación de los valores de los atributos formando 
reglas y teniendo en cuenta la relación de estos en los casos del conjunto de entrenamiento 
[93]. La eficiencia en la obtención de las reglas usando estos algoritmos depende en gran 
medida de la complejidad del procedimiento de construcción de los reductos que con 
frecuencia es costoso. 

1.3.3 Estrategia de generación de la base de reglas borrosas candidatas y 
refinamiento 

Uno de los algoritmos clásicos y pionero en esta estrategia lo constituye el algoritmo 
propuesto por Wang y Mendel [137]. En una primera fase este algoritmo genera todas las 
posibles reglas que se obtienen de las combinaciones de los conjuntos borrosos estos 
últimos predefinidos de antemano. En un segundo estado refina la base de reglas inicial 
seleccionando solamente aquellas reglas que sean representativas del conjunto de 
entrenamiento. Como desventajas que se señalan en la propuesta de Wang y Mendel están: 

• El hecho de necesitar la definición previa de los conjuntos borrosos, obliga la 
intervención de expertos de forma previa a la aplicación del algoritmo. En muchas 
situaciones reales es muy difícil definir apropiadamente las funciones de pertenencia 
borrosas y sus respectivos conjuntos borrosos de forma previa, especialmente en 
problemas con gran cantidad de variables como los problemas de minería de datos.  

• Otra desventaja, que se manifiesta en general en la primera estrategia de generación 
de reglas presentada, es que genera demasiadas reglas como parte de la base de 
reglas candidatas; algunas muy específicas y otras incluso sin sentido. 

Hong y Lee [125] proponen un método basado en el uso de tablas de decisión para derivar 
automáticamente reglas borrosas y funciones de pertenencia a partir de datos numéricos. En 
este algoritmo se construyen inicialmente un conjunto de funciones de pertenencia que son 
representadas en una tabla de decisión multidimensional. Luego la tabla de decisión es 
simplificada por medio de un conjunto de operaciones definidas para actuar sobre sus filas y 
columnas. Finalmente se generan reglas a partir de cada fila de la tabla. El algoritmo de 
Hong presenta varias desventajas para su aplicación entre las que podemos citar: 

• Requiere que los valores del rasgo objetivo sean ordenables, admitiendo solamente 
datos numéricos.  


ESTADO DEL ARTE EN LOS MODELOS DE APRENDIZAJE Y CLASIFICACIÓN BASADOS EN LA LÓGICA BORROSA  

28 

• Trabaja con un solo tipo de función de membresía, la triangular. 

• En la construcción de las funciones de pertenencia triangulares la tabla de decisión 
que el algoritmo usa está diseñada para problemas con solo dos rasgos.  

• El método de construcción de las funciones de pertenencia que se propone en el 
algoritmo puede conllevar a construir una cantidad excesiva de funciones, 
incrementando hasta niveles intratables la aplicación del algoritmo. Todo esto porque 
durante la construcción de las funciones de pertenencia iniciales para cada variable 
se determina la menor diferencia entre los valores de la variable y tomando esta 
distancia se construyen tantos intervalos y funciones como sean necesarios hasta 
lograr cubrir todo el dominio de los datos. 

En [24] se describen en detalle varios algoritmos para la generación de reglas borrosas que 
siguen la estrategia de las reglas candidatas. Estos algoritmos son utilizados en el sistema 
NEFCLASS [138]. En su primera fase los algoritmos propuestos por Nauck construyen por 
cada caso un grupo de antecedentes hasta lograr cubrir todos los casos del conjunto de 
entrenamiento. En su segunda fase, el algoritmo construye una base de reglas candidatas a 
partir de la combinación de los antecedentes construidos en la fase 1. En la última fase del 
aprendizaje el algoritmo recorre el conjunto de casos seleccionando de la base de reglas 
candidatas las reglas que constituyen la base de reglas final tomando como criterio de 
selección la capacidad de las reglas de representar los casos del conjunto de entrenamiento. 
Los algoritmos propuestos por Nauck son costosos, se generan durante la creación de la 
base de reglas candidatas una gran cantidad de reglas muchas de las cuales carecen 
incluso de significado lógico.   

El algoritmo utilizado en NEFPROX [111] actúa similar al algoritmo de NEFCLASS, pero para 
determinar los conjuntos borrosos de los consecuentes calcula el promedio pesado de los 
valores de salida de todas las reglas que cumplen que la evaluación de las funciones de 
pertenencia de sus antecedentes es distinto de cero. El algoritmo de aprendizaje del 
NEXPROX necesita recorrer dos veces el conjunto de entrenamiento, una para obtener los 
antecedentes de las reglas y otra para calcular la media y varianza para todos los 
antecedentes, requiere después, seleccionar los consecuentes para todos los antecedentes 
y completar los cálculos estadísticos.  

Como una limitante adicional los algoritmos que usan los sistemas NEFCLASS y NEFPROX 
no permiten la manipulación de datos simbólicos solo numéricos. Atendiendo a esta 
dificultad Nauck presenta el algoritmo 4.5 que permite trabajar tanto con datos numéricos 
como simbólicos [24]. Este otro algoritmo durante la construcción de las reglas en su etapa 
inicial ignora a los atributos simbólicos y genera reglas solo con atributos numéricos. En una 
etapa posterior genera los antecedentes simbólicos y genera la base de reglas candidatas a 
partir de formar todas las posibles combinaciones de las reglas que solo contenían 
antecedentes numéricos con los antecedentes simbólicos sin tener en cuenta la existencia o 
no de relaciones entre los conjuntos borrosos generados a partir de los atributos simbólicos y 


ESTADO DEL ARTE EN LOS MODELOS DE APRENDIZAJE Y CLASIFICACIÓN BASADOS EN LA LÓGICA BORROSA  

29 

los generados a partir de los numéricos. En esta etapa el conjunto de reglas generado puede 
ser inconsistente. En su última fase este algoritmo elimina las inconsistencias a partir de 
procesar todas las reglas con igual antecedente pero distinto consecuente y seleccionar solo 
aquellas que tengan el mejor funcionamiento. Este último algoritmo incorpora mayor 
complejidad al proceso de generación de las reglas que los algoritmos de NEFCLASS y 
NEFPROX, la base de reglas candidatas que construye contiene mayor cantidad de reglas 
innecesarias e inconsistentes. 

Otros autores que proponen la construcción de reglas borrosas suponen conocida la 
cantidad clusters o intervalos a formar y aplican estrategias de aprendizaje no supervisado 
para la formación de los clusters [139, 140]. Luego a partir de cada cluster generan reglas y 
en una etapa final refinan la base de reglas a partir de determinar para cada regla su grado 
de confidencia que representa su importancia. A diferencia del método de Nauck las reglas 
generadas desde la base de reglas candidatas son consistentes y pueden ser explotadas. 
Tiene como desventaja que requiere que se le especifique el número de clusters a formar de 
forma previa y que solo permiten trabajar con funciones de pertenencia triángulo. 

1.3.4 Estrategia de generación de reglas borrosas a partir de la optimización de la 
base de reglas  

Esta estrategia supone la construcción previa de una base de reglas y su posterior 
optimización. Algunos métodos construyen la base de reglas simultáneamente con la 
optimización pero por lo general este proceso tiene lugar dividido en dos etapas bien 
marcadas. La base de reglas inicial puede ser construida de forma manual por los expertos o 
siguiendo alguna de las estrategias exp