Agrupamiento de artículos científicos con formato semiestructurado basado en las referencias bibliográficas

dc.contributor.advisorMagdaleno Guevara, Damny
dc.contributor.advisorGarcía Lorenzo, María Matilde
dc.contributor.authorAmador Penichet, Lisvandy
dc.coverage.spatialSanta Claraen_US
dc.date.accessioned2018-03-13T22:59:47Z
dc.date.available2018-03-13T22:59:47Z
dc.date.issued2015-07-04
dc.description.abstractLa cantidad de información científica en formato semiestructurado que se encuentra disponibles en Internet, intranets corporativas, y otros medios de comunicación está creciendo vertiginosamente. Gestionar el conocimiento a partir de la información que se puede encontrar en las publicaciones científicas es fundamental para cualquier investigador. La gestión de la información científica cada vez resulta más compleja y desafiante, debido a que las colecciones de documentos generalmente son heterogéneas, grandes, diversas y dinámicas. Superar estos desafíos es esencial para dar a los científicos mejores condiciones de administrar el tiempo necesario para procesar la información científica. En este trabajo se implementó un nuevo método de agrupamiento de artículos científicos en formato XML basado en la información brindada por las referencias bibliográficas de los mismos. La utilización de este método contribuye de manera significativa al descubrimiento de conocimiento relevante. Se definió la función de similitud SimRefBib que facilita capturar el grado de semejanza entre los documentos tomando como base la información contenida en sus referencias bibliográficas. Se propone el uso del algoritmo de agrupamiento SemClustDML para la obtención de los grupos de documentos afines. La evaluación a través de los experimentos y los casos de estudios definidos arrojaron resultados relevantes en el agrupamiento de artículos científicos en formato XML.en_US
dc.description.abstractThe amount of scientific information in semi-structured format available in the internet, corporative intranets and other communication means, is growing at a very fast speed. The knowledge management from scientific publications is fundamental to any researcher today. The management of scientific knowledge becomes more complicated and challenging as days go by, given the fact that documents collections are generally heterogeneous, large, diverse and dynamic. Overcoming these difficulties becomes essential to provide the scientists with the necessary time administration to process scientific information. In this Major Paper a new method to clustering scientific articles in XML format has been implemented, based on the information provided by their own bibliographic references. The use of this method significantly contributes to the discovery of relevant knowledge. This Paper also defined the SimRefBib similarities facilitating the capture of the degree of similarities among the documents taking as a base the information contained within their bibliographic references. There is the proposal of a clustering algorithm SemClustDML to obtain groups of alike documents. The evaluation through experiments and definite case studies showed encouraging results in the clustering of scientific articles in XML format.en_US
dc.description.sponsorshipFacultad de Matemática, Física y Computación. Departamento de Ciencias de la Computaciónen_US
dc.description.statusnon-publisheden_US
dc.identifier.urihttps://dspace.uclv.edu.cu/handle/123456789/8901
dc.language.isoesen_US
dc.publisherUniversidad Central “Marta Abreu” de Las Villasen_US
dc.rightsEste documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 Licenseen_US
dc.subjectMétodoen_US
dc.subjectAgrupamiento de Artículos Científicosen_US
dc.subjectFormato XMLen_US
dc.subjectReferencias Bibliográficasen_US
dc.subjectDescubrimiento de Conocimiento Relevanteen_US
dc.subjectSimilitud SimRefBiben_US
dc.subjectSemClustDMLen_US
dc.subjectGrupos de Documentos Afinesen_US
dc.subjectEvaluaciónen_US
dc.subject.otherAlgoritmos de Agrupamientoen_US
dc.subject.otherAgrupamiento Automático de Textosen_US
dc.subject.otherColección de Documentosen_US
dc.subject.otherReferencias Bibliográficasen_US
dc.subject.otherDescubrimiento de Conocimientoen_US
dc.subject.otherSimilituden_US
dc.subject.otherRecuperación de Informaciónen_US
dc.subject.otherEvaluación de la Calidaden_US
dc.titleAgrupamiento de artículos científicos con formato semiestructurado basado en las referencias bibliográficasen_US
dc.typeThesisen_US
dc.type.thesisbacheloren_US

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Lisvandy_Amador.pdf
Tamaño:
2.46 MB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
3.33 KB
Formato:
Item-specific license agreed upon to submission
Descripción: