Herramientas de minería de textos e inteligencia artificial aplicadas a la gestión de la información científico-técnica

Fecha

2011-07-11

Autores

Artiles Egüe, Michel

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Central “Marta Abreu” de Las Villas

Resumen

La cantidad de información está continuamente creciendo; pero la información en sí misma tiene pocas ventajas, su sistematización, incorporación y utilización son los elementos que aportan su valor añadido: el conocimiento. En el laboratorio de Inteligencia Artificial del CEI-UCLV se han desarrollado los sistemas SATEX y GARLucene que si bien permiten gestionar información siguiendo el esquema de indexado, recuperación, agrupamiento y valoración de los grupos textuales obtenidos, no brindan un entorno de trabajo amigable que permita la introducción y generalización de los mismos, ya que no garantizan una interacción efectiva entre usuarios y grandes repositorios de información. Por otro lado, en el CEI-UCLV existe un gran número de artículos científicos y documentos relacionados con diversos temas de investigación, y se hace tedioso para los investigadores descubrir conocimiento que requieren para encausar una investigación a partir de estos grandes volúmenes textuales. De ahí que el objetivo de esta investigación consiste en desarrollar una aplicación que permita gestionar de forma efectiva la información científico-técnica disponible en grandes repositorios de información. Los principales resultados alcanzados son: un conjunto de herramientas que permiten la gestión y recuperación de información científico-técnica, el preprocesamiento y representación de los corpus, y el agrupamiento y valoración de los grupos textuales, y una aplicación web que utiliza el conjunto de herramientas desarrolladas y permita el indexado, recuperación y agrupamiento de documentos científicos, así como etiquetar y evaluar los grupos obtenidos, garantizando una adecuada conexión con los repositorios de información científico-técnica del CEI-UCLV.
The amount of information is continually growing, but the information itself has few advantages, its systematization, incorporation and usage are the elements that bring its added value: knowledge. The Artificial Intelligence Laboratory from the CEI-UCLV has developed the systems GARLucene and SATEX, which allow to manage the information following the scheme of indexing, retrieval, clustering and textual assessment of the obtained groups, but these systems do not provide a friendly environment for the introduction and generalization of the mentioned groups, because they do not guarantee an effective interaction between users and large data repositories. On the other hand, the CEI-UCLV has a huge number of scientific papers and documents related to different research topics, and it becomes tedious for the researchers to discover the knowledge they need from this high-volume text. Hence, the objective of this research is to develop an application that can effectively manage the scientific and technical information available in large repositories of information. The main results obtained are: a set of tools that enable the management and retrieval of scientific and technical information, the preprocessing and representation of the corpus, as well as the grouping and evaluation of textual groups, and a web application which uses the set of developed tools allowing the indexing, retrieval and grouping of scientific papers, together with the labeling and evaluation of the obtained groups, ensuring a proper connection with the repositories of scientific and technical information from the CEI-UCLV.

Descripción

Palabras clave

Minería de Textos, Herramientas, Inteligencia Artificial Aplicada, Gestión de Información, Información Científico-Técnica

Citación