Agrupamiento de artículos científicos con formato semiestructurado basado en las referencias bibliográficas

Amador Penichet, Lisvandy

Agrupamiento de artículos científicos con formato semiestructurado basado en las referencias bibliográficas

dc.contributor.advisor	Magdaleno Guevara, Damny
dc.contributor.advisor	García Lorenzo, María Matilde
dc.contributor.author	Amador Penichet, Lisvandy
dc.coverage.spatial	Santa Clara	en_US
dc.date.accessioned	2018-03-13T22:59:47Z
dc.date.available	2018-03-13T22:59:47Z
dc.date.issued	2015-07-04
dc.description.abstract	La cantidad de información científica en formato semiestructurado que se encuentra disponibles en Internet, intranets corporativas, y otros medios de comunicación está creciendo vertiginosamente. Gestionar el conocimiento a partir de la información que se puede encontrar en las publicaciones científicas es fundamental para cualquier investigador. La gestión de la información científica cada vez resulta más compleja y desafiante, debido a que las colecciones de documentos generalmente son heterogéneas, grandes, diversas y dinámicas. Superar estos desafíos es esencial para dar a los científicos mejores condiciones de administrar el tiempo necesario para procesar la información científica. En este trabajo se implementó un nuevo método de agrupamiento de artículos científicos en formato XML basado en la información brindada por las referencias bibliográficas de los mismos. La utilización de este método contribuye de manera significativa al descubrimiento de conocimiento relevante. Se definió la función de similitud SimRefBib que facilita capturar el grado de semejanza entre los documentos tomando como base la información contenida en sus referencias bibliográficas. Se propone el uso del algoritmo de agrupamiento SemClustDML para la obtención de los grupos de documentos afines. La evaluación a través de los experimentos y los casos de estudios definidos arrojaron resultados relevantes en el agrupamiento de artículos científicos en formato XML.	en_US
dc.description.abstract	The amount of scientific information in semi-structured format available in the internet, corporative intranets and other communication means, is growing at a very fast speed. The knowledge management from scientific publications is fundamental to any researcher today. The management of scientific knowledge becomes more complicated and challenging as days go by, given the fact that documents collections are generally heterogeneous, large, diverse and dynamic. Overcoming these difficulties becomes essential to provide the scientists with the necessary time administration to process scientific information. In this Major Paper a new method to clustering scientific articles in XML format has been implemented, based on the information provided by their own bibliographic references. The use of this method significantly contributes to the discovery of relevant knowledge. This Paper also defined the SimRefBib similarities facilitating the capture of the degree of similarities among the documents taking as a base the information contained within their bibliographic references. There is the proposal of a clustering algorithm SemClustDML to obtain groups of alike documents. The evaluation through experiments and definite case studies showed encouraging results in the clustering of scientific articles in XML format.	en_US
dc.description.sponsorship	Facultad de Matemática, Física y Computación. Departamento de Ciencias de la Computación	en_US
dc.description.status	non-published	en_US
dc.identifier.uri	https://dspace.uclv.edu.cu/handle/123456789/8901
dc.language.iso	es	en_US
dc.publisher	Universidad Central “Marta Abreu” de Las Villas	en_US
dc.rights	Este documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 License	en_US
dc.subject	Método	en_US
dc.subject	Agrupamiento de Artículos Científicos	en_US
dc.subject	Formato XML	en_US
dc.subject	Referencias Bibliográficas	en_US
dc.subject	Descubrimiento de Conocimiento Relevante	en_US
dc.subject	Similitud SimRefBib	en_US
dc.subject	SemClustDML	en_US
dc.subject	Grupos de Documentos Afines	en_US
dc.subject	Evaluación	en_US
dc.subject.other	Algoritmos de Agrupamiento	en_US
dc.subject.other	Agrupamiento Automático de Textos	en_US
dc.subject.other	Colección de Documentos	en_US
dc.subject.other	Referencias Bibliográficas	en_US
dc.subject.other	Descubrimiento de Conocimiento	en_US
dc.subject.other	Similitud	en_US
dc.subject.other	Recuperación de Información	en_US
dc.subject.other	Evaluación de la Calidad	en_US
dc.title	Agrupamiento de artículos científicos con formato semiestructurado basado en las referencias bibliográficas	en_US
dc.type	Thesis	en_US
dc.type.thesis	bachelor	en_US

Archivos

Bloque original

Mostrando 1 - 1 de 1

Nombre:: Lisvandy_Amador.pdf
Tamaño:: 2.46 MB
Formato:: Adobe Portable Document Format

Descargar

Bloque de licencias

Mostrando 1 - 1 de 1

Nombre:: license.txt
Tamaño:: 3.33 KB
Formato:: Item-specific license agreed upon to submission
Descripción:

Descargar

Colecciones

Tesis de Pregrado - Licenciatura en Ciencias de la Computación