Modelo para el agrupamiento de documentos afines y su ulterior resumen a través de la representación espacio vectorial de un corpus textual

Fecha

2005-07-20

Autores

Arco García, Leticia

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Central “Marta Abreu” de Las Villas

Resumen

El objetivo general de la investigación consiste en desarrollar un modelo conceptual y un procedimiento metodológico, soportado en el software CorpusMiner, que ofrece a los investigadores y desarrolladores en el campo de la minería de textos una herramienta que posibilita el agrupamiento de textos para la obtención de resúmenes extractos a partir de grupos homogéneos de documentos afines, con un enfoque de integración. En el contenido del trabajo se expone el marco teórico-referencial de la investigación, enfatizando en las técnicas más empleadas en la actualidad para la representación de corpus textuales, el agrupamiento de documentos y la obtención de resúmenes extractos. Se desarrolla un modelo conceptual flexible que justifica la concepción y posterior aplicación de cada una de las etapas del procedimiento general propuesto: representación del corpus textual, agrupamiento de documentos, extracción de palabras claves de grupos textuales y obtención del resumen extracto de cada grupo de documentos. Finalmente, se muestra la viabilidad del modelo desarrollado a partir de su aplicación en tres casos de estudio utilizando la herramienta CorpusMiner que lo soporta. Se evaluaron, utilizando pruebas estadísticas no paramétricas, la etapa de agrupamiento así como la fase de reducción de dimensionalidad dentro de la etapa de representación textual. Se demostró de esta forma la hipótesis de investigación planteada.

Descripción

Palabras clave

Modelo de Agrupamiento, Documentos Afines, Resúmenes Extractos, Representación Espacio Vectorial, Corpus Textual

Citación