Empleo de relaciones de similaridad borrosa para el cálculo de pesos en algoritmos de aprendizaje
Resumen
La Medida de Calidad de la Similaridad basada en la Teoría de los Conjuntos
Aproximados constituye una alternativa eficaz para el análisis de conjuntos de datos ya
que representa el grado de similaridad entre los objetos de un sistema de decisión
heterogéneo. No obstante esta medida presenta la limitante de usar umbrales en la
construcción de las relaciones de semejanza. Estos umbrales constituyen parámetros a
ajustar, haciendo los métodos derivados muy sensible a pequeñas variaciones. En esta
investigación se propone usar las relaciones borrosas de la Teoría de los Conjuntos
Borrosos para eliminar los umbrales y flexibilizar la construcción de las relaciones de
similaridad. Con esta modificación se redefine una nueva métrica denominada Medida
de la Calidad de la Similaridad Borrosa. La nueva medida sustituye la relación de
semejanza entre dos objetos por una relación borrosa binaria, que cuantifica la fortaleza
de la relación en un rango de [0,1]. La relación borrosa está caracterizada por una
función de pertenencia, que en este caso se define por una función de semejanza basada
en la Teoría de los Conjuntos Aproximados Extendida. La nueva medida incluye el
cálculo de los pesos de los rasgos; y se estudia su impacto al igual que su precursora
para mejorar el desempeño de los k-Vecinos más Cercanos y el Multilayer Perceptron.
Los resultados experimentales en bases de datos internacionales y aplicados en dos áreas
del conocimiento: la Ingeniería Civil y el Rendimiento académico; muestran un
comportamiento semejante en cuanto a precisión entre ambas medida. The Similarity Quality Measure based on Rough Sets Theory is an effective alternative
for intelligent analysis of heterogeneous data sets. This measures represents the degree
of similarity between objects of a mixed decision system. However this measure has the
limitation of use thresholds building similarity relations. These thresholds are
parameters to adjust the method, making it very sensitive to small variations. In this
research it use fuzzy relations to eliminate the thresholds in the Measure Quality of
Similarity and make it more flexible building the relationships of similarity. With this
modification it redefines a new metric called Fuzzy Similarity Quality measure. The
new measure replaces the relation of similarity between two objects by a binary fuzzy
relation, which quantify the strength of the relationship in a range of [0.1]. The fuzzy
relation is characterized by a membership function, which in this case is defined by a
similarity function based on extended Rough Set theory. The new measure includes
calculate features weights; and its impact as its predecessor studying for improve the
performance of the k-Nearest Neighbors and Multilayer Pereceptron. Experimental
results in International database and it applied in two areas of knowledge: Engineering
Civil and academic performance; the result show a similar behavior between them for
accuracy measure.
xmlui.dri2xhtml.METS-1.0.item-rights
Este documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia:
Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 License