LNE2NEXI 2.0: Traductor de consultas del lenguaje natural español a NEXI v2.0

Fecha

2012-06-26

Autores

Díaz Matos, Samuel

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Central “Marta Abreu” de Las Villas

Resumen

Para interactuar con los Sistemas de Recuperación de Información sobre documentos XML, los usuarios deben expresar tanto su necesidad de contenido como las restricciones estructurales en forma de una consulta estructurada. Históricamente, estas consultas estructuradas han sido elaboradas en lenguajes formales, tales como XPath o NEXI. Desafortunadamente, los lenguajes formales de consulta son demasiado complejos para ser utilizados por los usuarios inexpertos, y están estrechamente ligados a la estructura física subyacente de la colección de documentos XML. En la presente investigación se desarrolló un traductor que transforma consultas formuladas en lenguaje natural español sobre cualquier dominio a NEXI, que utiliza técnicas de procesamiento del lenguaje natural e implementa un mecanismo de expansión de consultas a partir de un diccionario del dominio creado con la ayuda de la base de datos léxica EuroWordNet. La herramienta fue evaluada de forma empírica a partir de un caso de estudio obteniéndose buenos resultados.
To interact with information retrieval systems on XML documents, users must express both their need for content and structural constraints in the form of a structured query. Historically, these structured queries have been developed in formal languages such as XPath or NEXI. Unfortunately, formal query languages are too complex to be used by inexperienced users, and are closely linked to the underlying physical structure of the collection of XML documents. In the present research it was developed a translator which transforms queries formulated in natural Spanish language on any domain to NEXI. It uses techniques of natural language processing and implements a mechanism of expansion of queries beginning with a domain´s dictionary created with the help of the lexical database: EuroWordNet. The tool was evaluated on an empirical way from a study case, obtaining good results.

Descripción

Palabras clave

Sistema de Recuperación de Información (SRI), Procesamiento del Lenguaje Natural, Español, Documentos XML, Traductor de Consultas, Desarrollo de Herramientas, NEXI, Caso de Estudio

Citación

Descargar Referencia Bibliográfica