Implementación de algoritmos para el agrupamiento documental utilizando OverallSimSUX

dc.contributor.advisorMagdaleno Guevara, Damny
dc.contributor.advisorGarcía Lorenzo, María Matilde
dc.contributor.authorMiranda Dorta, Yadriel
dc.coverage.spatialSanta Claraen_US
dc.date.accessioned2018-04-25T19:53:53Z
dc.date.available2018-04-25T19:53:53Z
dc.date.issued2014-06-26
dc.description.abstractEn el Centro de Estudios de Informática (CEI) de la Universidad Central “Marta Abreu” de las Villas (UCLV) se ha propuesto una metodología para el agrupamiento de documentos XML combinando estructura y contenido, a través de la confección de una nueva función de similitud. Es metodología está soportada en un procedimiento general implementado en un sistema para para el agrupamiento de artículos científicos en formato XML (LucXML), recuperados. Aunque esta metodología muestra buen desempeño, avalado por experimentos con varios corpus textuales y pruebas estadísticas, al tener implícito una sola técnica de agrupamiento, K-Star; se desconoce el efecto que sufriría al remplazarla por otra con características disímiles. En este trabajo se implementaron varios algoritmos de agrupamiento documental, siguiendo la metodología para el cálculo de la función de similitud OverallSimSUX, para documentos XML. Se realizó la implementación de la herramienta XMLearning, que incluye varias técnicas de agrupamiento de documentos, acopladas a la metodología mencionada. La evaluación a través los experimentos y los casos de estudios definidos, mostró en uno de los experimentos que los resultados a pesar de presentar diferencias, presentaron igual comportamiento, en el otro experimento no se mostraron diferencias significativas entre los resultados.en_US
dc.description.abstractAt the Center for Informatic Studies (CEI) of Universidad Central "Marta Abreu" of Las Villas (UCLV) has proposed a methodology for clustering XML documents by combining structure and content, through the making of a new function similarity. Is methodology is supported by general procedure implemented in a system for clustering of scientific articles in XML format (LucXML) recovered. Although this method shows good performance, supported by experiments with various text corpora and statistical tests, having a single technique implicit clustering, K-Star; the effect would suffer to replace it by another with different characteristics is unknown. In this paper several documentary clustering algorithms were implemented following the methodology for calculating the similarity function OverallSimSUX for XML documents. XMLearning implementing the tool, which includes various techniques for grouping of documents, coupled to the above methodology was performed. The evaluation through experiments and case studies defined, showed in one experiment that the results despite having differences, showed the same behavior in another experiment, no significant differences between the results were.en_US
dc.description.sponsorshipFacultad de Matemática, Física y Computación. Departamento de Computaciónen_US
dc.description.statusnon-publisheden_US
dc.identifier.urihttps://dspace.uclv.edu.cu/handle/123456789/9288
dc.language.isoesen_US
dc.publisherUniversidad Central “Marta Abreu” de Las Villasen_US
dc.rightsEste documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 Licenseen_US
dc.subjectMetodologíaen_US
dc.subjectAlgoritmos de Agrupamientoen_US
dc.subjectAgrupamiento Documentalen_US
dc.subjectOverallSimSUXen_US
dc.subjectTécnicas de Agrupamientoen_US
dc.subjectInteligencia Artificialen_US
dc.subject.otherMetodologíaen_US
dc.subject.otherArtículos Científicosen_US
dc.subject.otherTécnicas de Agrupamientoen_US
dc.subject.otherDocumentosen_US
dc.subject.otherAprendizaje Automáticoen_US
dc.subject.otherInteligencia Artificialen_US
dc.titleImplementación de algoritmos para el agrupamiento documental utilizando OverallSimSUXen_US
dc.typeThesisen_US
dc.type.thesisbacheloren_US

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Tesis.pdf
Tamaño:
2.27 MB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
3.33 KB
Formato:
Item-specific license agreed upon to submission
Descripción: