Aplicación para la recuperación de información soportado en el agrupamiento de documentos XML de artículos científicos
Fecha
2014-07-04
Autores
Cabeza Méndez, Michel
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Central “Marta Abreu” de Las Villas
Resumen
Cada día más datos electrónicos en formato semiestructurado específicamente en XML se encuentran disponibles en el World Wide Web, intranets corporativas, y otros medios de comunicación. Debido a que la información por si sola tiene pocas ventajas, gestionar el conocimiento a partir de ella es esencial para dar mejores condiciones de trabajo a los investigadores e incrementar su productividad científica. Concretamente en el laboratorio de Inteligencia Artificial se han obtenidos varios sistemas que permiten manipular la información, estos son: SATEX, GARLucene y LucXML, el último da tratamiento de forma específica a los documentos XML aunque no garantiza gestionar los documentos desde un repositorio en la red. A esto se le añade, que en el Centro de Estudios de Informática existen un gran número de artículos científicos de variados temas. Por tanto, superar estos desafíos es esencial para dar a los científicos mejores condiciones de administrar el tiempo necesario para procesamiento de la información científica.
En este trabajo se implementó una herramienta Web que ha utilizado las técnicas de recuperación inteligente soportada en un algoritmo de agrupamiento de documentos XML, el cual explota las ventajas de estos documentos utilizando el contenido y la estructura existente en ellos.
La validación del sistema a través de los casos de estudios definidos corrobora la validez de la implementación realizada.
Every day more electronic data in semi-structured format, specifically XML are available in the World Wide Web, corporative intranets and other communication medias. Due to the information by itself, have few advantages manage the knowledge is essential to give better work conditions to the researches and increase his scientific productivity. In the Artificial Intelligence Laboratory have been obtained several systems that allow manipulate the information, these are: SATEX, GARLucene and LucXML, the last mentioned give treatment specifically to the XML documents, but not guarantee manage of the documents from a repository in the network. Besides, in the Informatics Studies Center exist a large number of scientific articles of various themes. Therefore, beat these challenges is essential to give the scientific better conditions to manage the necessary time to the processing of the scientific information. In this work was implemented a web tool that have use the intelligent recovery technique support in an algorithm of XML document clustering that explodes the advantages of the document using the content and the structure existing in them. The validation of the system through of the case of study defined corroborates the validity of the implementation make.
Every day more electronic data in semi-structured format, specifically XML are available in the World Wide Web, corporative intranets and other communication medias. Due to the information by itself, have few advantages manage the knowledge is essential to give better work conditions to the researches and increase his scientific productivity. In the Artificial Intelligence Laboratory have been obtained several systems that allow manipulate the information, these are: SATEX, GARLucene and LucXML, the last mentioned give treatment specifically to the XML documents, but not guarantee manage of the documents from a repository in the network. Besides, in the Informatics Studies Center exist a large number of scientific articles of various themes. Therefore, beat these challenges is essential to give the scientific better conditions to manage the necessary time to the processing of the scientific information. In this work was implemented a web tool that have use the intelligent recovery technique support in an algorithm of XML document clustering that explodes the advantages of the document using the content and the structure existing in them. The validation of the system through of the case of study defined corroborates the validity of the implementation make.
Descripción
Palabras clave
Herramienta Web, Recuperación de Información, Algoritmos de Agrupamiento, Documentos XML, Artículos Científicos, Universidad Central “Marta Abreu” de las Villas (UCLV)