Agrupamiento de artículos científicos basado en la extracción de frases relevantes

dc.contributor.advisorGarcía Lorenzo, María Matilde
dc.contributor.advisorMagdaleno Guevara, Damny
dc.contributor.authorAmador Penichet, Lisvandy
dc.coverage.spatialSanta Claraen_US
dc.date.accessioned2019-01-16T15:11:24Z
dc.date.available2019-01-16T15:11:24Z
dc.date.issued2018-07-09
dc.description.abstractLa gestión del conocimiento a partir de la información recogida en la bibliografía científica resulta imprescindible para los investigadores en función de optimizar el tiempo de que disponen. El agrupamiento automático de datos se perfila como una de las técnicas que facilitan este proceso. Este permite formar grupos de documentos afines a partir de una colección obtenida mediante un proceso de recuperación de información. Este trabajo tuvo como objetivo: desarrollar un método de agrupamiento de artículos científicos a través de la extracción de frases relevantes obtenidas de los títulos y de las referencias bibliográficas para mejorar la gestión del conocimiento a partir de la literatura científica. Para formar los grupos se tomaron como centroides las frases relevantes contenidas en la intersección de los títulos de los artículos con los títulos de las referencias. Además, se creó un grafo de conexiones de los artículos basado en las frases relevantes que comparten. Mediante este grafo se eliminó el solapamiento entre grupos y se asignaron a los grupos los documentos que no contenían las palabras centroides. Para evaluar los resultados del método propuesto se utilizaron siete medidas externas de calidad del agrupamiento. Como casos de estudios fueron usados artículos científicos provenientes de diferentes áreas del conocimiento. Los experimentos realizados demostraron la factibilidad del método propuesto en el agrupamiento de artículos científicos.en_US
dc.description.abstractThe knowledge’s management from the information collected in the scientific literature is essential for researchers in order to optimize the available time. The automatic data clustering is emerging as a technique that facilitate this process. This allows forming groups of related documents from a collection obtained through a process of information retrieval. The objective of this work was, to develop a method of scientific articles clustering through the extraction of relevant phrases, obtained from titles and bibliographic references to improve knowledge management based on scientific literature. To form the groups, the relevant phrases contained in the intersection of the articles’ titles with the titles of the references were taken as centroids. In addition, a connection graph of the articles was created based on the relevant phrases they share. Through this graph the overlap between groups was eliminated and the documents that did not contain the centroid words were assigned to the groups. To evaluate the results of the proposed method, seven external measures of clustering quality were used. As case studies were used scientific articles from different knowledge’s areas. The experiments carried out demonstrated the feasibility of the proposed method in the clustering of scientific articles.en_US
dc.description.sponsorshipFacultad de Matemática, Física y Computación. Departamento de Ciencias de la Computaciónen_US
dc.description.statusnon-publisheden_US
dc.identifier.urihttps://dspace.uclv.edu.cu/handle/123456789/10604
dc.language.isoesen_US
dc.publisherUniversidad Central “Marta Abreu” de Las Villasen_US
dc.rightsEste documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 Licenseen_US
dc.subjectAgrupamientoen_US
dc.subjectArtículos Científicosen_US
dc.subjectFrases Relevantesen_US
dc.subjectGrafo de Conexionesen_US
dc.subject.otherAgrupamiento Automático de Textosen_US
dc.subject.otherArtículos Científicosen_US
dc.subject.otherMétodo de Extracciónen_US
dc.subject.otherFraseologíaen_US
dc.subject.otherTeoría de Grafosen_US
dc.titleAgrupamiento de artículos científicos basado en la extracción de frases relevantesen_US
dc.typeThesisen_US
dc.type.thesismasteren_US

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
tesis-Lisvandy.pdf
Tamaño:
1.67 MB
Formato:
Adobe Portable Document Format
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
3.33 KB
Formato:
Item-specific license agreed upon to submission
Descripción: