Modelo para el agrupamiento de documentos afines y su ulterior resumen a través de la representación espacio vectorial de un corpus textual
Fecha
2005-07-20
Autores
Arco García, Leticia
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Central “Marta Abreu” de Las Villas
Resumen
El objetivo general de la investigación consiste en desarrollar un modelo conceptual y un procedimiento metodológico, soportado en el software CorpusMiner, que ofrece a los investigadores y desarrolladores en el campo de la minería de textos una herramienta que posibilita el agrupamiento de textos para la obtención de resúmenes extractos a partir de grupos homogéneos de documentos afines, con un enfoque de integración.
En el contenido del trabajo se expone el marco teórico-referencial de la investigación, enfatizando en las técnicas más empleadas en la actualidad para la representación de corpus textuales, el agrupamiento de documentos y la obtención de resúmenes extractos. Se desarrolla un modelo conceptual flexible que justifica la concepción y posterior aplicación de cada una de las etapas del procedimiento general propuesto: representación del corpus textual, agrupamiento de documentos, extracción de palabras claves de grupos textuales y obtención del resumen extracto de cada grupo de documentos.
Finalmente, se muestra la viabilidad del modelo desarrollado a partir de su aplicación en tres casos de estudio utilizando la herramienta CorpusMiner que lo soporta. Se evaluaron, utilizando pruebas estadísticas no paramétricas, la etapa de agrupamiento así como la fase de reducción de dimensionalidad dentro de la etapa de representación textual. Se demostró de esta forma la hipótesis de investigación planteada.
Descripción
Palabras clave
Modelo de Agrupamiento, Documentos Afines, Resúmenes Extractos, Representación Espacio Vectorial, Corpus Textual