Implementación de algoritmos para el agrupamiento documental utilizando OverallSimSUX

dc.contributor.advisorMagdaleno Guevara, Damny
dc.contributor.advisorFuentes Herrera, Ivett
dc.contributor.authorCabrera González, Ernesto Julio
dc.coverage.spatialSanta Claraen_US
dc.date.accessioned2018-03-13T16:08:17Z
dc.date.available2018-03-13T16:08:17Z
dc.date.issued2015-06-28
dc.description.abstractEn el Centro de Estudios de Informática (CEI) de la Universidad Central “Marta Abreu” de las Villas (UCLV) se ha propuesto una metodología para el agrupamiento de documentos XML combinando estructura y contenido, a través de la confección de una nueva función de similitud. Esta metodología está soportada en un procedimiento general implementado en un sistema para el agrupamiento de artículos científicos en formato XML. Aunque esta metodología muestra buen desempeño, avalado por experimentos con varios corpus textuales y pruebas estadísticas, al tener implícito una sola técnica de agrupamiento, K-Star; se desconoce el efecto que sufriría al remplazarla por otra con características disímiles. En este trabajo se implementaron varios algoritmos de agrupamiento documental, siguiendo la metodología para el cálculo de la función de similitud OverallSimSUX, para documentos XML. Se realizó la implementación de la herramienta OSSM Clustering, que incluye varias técnicas de agrupamiento de documentos, acopladas a la metodología mencionada y permite además, incorporarle otras técnicas de manera sencilla. Se comprobó que la metodología se comportó de manera similar, al variar los algoritmos y funciones de similitud, lo que demuestra la estabilidad de la misma.en_US
dc.description.abstractAt the Center for Informatic Studies (CEI) of Universidad Central "Marta Abreu" of Las Villas (UCLV) has proposed a methodology for clustering XML documents by combining structure and content, through the making of a new function similarity. Is methodology is supported by general procedure implemented in a system for clustering of scientific articles in XML format (LucXML) recovered. Although this method shows good performance, supported by experiments with various text corpora and statistical tests, having a single technique implicit clustering, K-Star; the effect would suffer to replace it by another with different characteristics is unknown. In this paper several documentary clustering algorithms were implemented following the methodology for calculating the similarity function OverallSimSUX for XML documents. OSSM Clustering implementing the tool, which includes various techniques for grouping of documents, coupled to the above methodology was performed.en_US
dc.description.sponsorshipFacultad de Matemática, Física y Computación. Departamento de Ciencias de la Computaciónen_US
dc.description.statusnon-publisheden_US
dc.identifier.urihttps://dspace.uclv.edu.cu/handle/123456789/8898
dc.language.isoesen_US
dc.publisherUniversidad Central “Marta Abreu” de Las Villasen_US
dc.rightsEste documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 Licenseen_US
dc.subjectMetodologíaen_US
dc.subjectAlgoritmos de Agrupamientoen_US
dc.subjectAgrupamiento Documentalen_US
dc.subjectArtículos Científicosen_US
dc.subjectXMLen_US
dc.subjectOverallSimSUXen_US
dc.subjectOSSM Clusteringen_US
dc.subjectAprendizaje Automáticoen_US
dc.subject.otherMetodologíaen_US
dc.subject.otherTécnicas de Agrupamientoen_US
dc.subject.otherDocumentosen_US
dc.subject.otherAprendizaje Automáticoen_US
dc.subject.otherInteligencia Artificialen_US
dc.titleImplementación de algoritmos para el agrupamiento documental utilizando OverallSimSUXen_US
dc.typeThesisen_US
dc.type.thesisbacheloren_US

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
TESIS Ernesto Julio Cabrera González.pdf
Tamaño:
2.21 MB
Formato:
Adobe Portable Document Format
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
3.33 KB
Formato:
Item-specific license agreed upon to submission
Descripción: