TextLynx Plus: Ampliación de funciones para un analizador avanzado de textos
dc.contributor.advisor | Llanes Abeijón, Manuel | |
dc.contributor.author | Barrios Cañizares, Víctor Annier | |
dc.coverage.spatial | Santa Clara | en_US |
dc.date.accessioned | 2018-05-07T17:45:02Z | |
dc.date.available | 2018-05-07T17:45:02Z | |
dc.date.issued | 2007-07-08 | |
dc.description.abstract | El sistema TextLynx Plus realiza el análisis lingüístico de un corpus de textos. Para esto permite realizar el reconocimiento morfológico (tagging) y sintáctico (parsing) de los textos (usando software libre adicional al que provee de una interfaz más amistosa), así como la caracterización y clasificación del léxico por su frecuencia y distribución. Elabora tablas enmarcadas en los siguientes tipos: grafémica, léxicas, textuales descriptivas y textuales relacionales. En la implementación de gran parte de sus algoritmos para procesar los datos textuales se hace uso de la memoria en disco de la máquina para poder manipular corpora de gran tamaño sin recurrir a un uso excesivo de la RAM. Se aplican transformaciones en la representación léxica del corpus que permiten comparar los corpora de forma más efectiva por sus rasgos esenciales, así como la comparación y clasificación de los textos que los componen. El sistema permite representar léxicamente al corpus de forma tal que se superan algunas de las limitaciones del enfoque de saco de palabras al considerarse la combinatoria léxica y las relaciones sintácticas en el marco oracional al representar el contenido de los textos. La codificación óptima de representaciones de corpus muy grandes permite usar dichas representaciones en el procesamiento con software de minería de texto como el CorpusMiner | en_US |
dc.description.abstract | The TextLynx Plus system is designed to perform the linguistic analysis of text corpora. The system allows for the POS tagging and parsing of the texts in the corpus (using additional free software for which it provides a user friendly interface) , as well as the characterization and distribution of the lexicon based on its frequency and distribution. The system produces graphemic, lexical, textual (descriptive and relational) tables. In the implementation of many of its algorithms for textual data processing use is made of memory in the disk to make the system capable of manipulating larger corpora without incurring in excessive use of RAM. Transformations in the lexical representation of the corpus allows for corpus comparison of higher efficiency based on essential features, as well as the comparison and classification of texts. The system provides for the lexical representation of the corpus beyond the ―bag of words‖ paradigm by including lexical combinatory and syntactical relations within the sentential framework to represent the contents of the texts. Optimum codification of very large corpus representations enables processing with text mining software such as CorpusMiner. | en_US |
dc.description.sponsorship | Facultad de Matemática, Física y Computación. Departamento de Ciencias de la Computación | en_US |
dc.description.status | non-published | en_US |
dc.identifier.uri | https://dspace.uclv.edu.cu/handle/123456789/9341 | |
dc.language.iso | es | en_US |
dc.publisher | Universidad Central “Marta Abreu” de Las Villas | en_US |
dc.rights | Este documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 License | en_US |
dc.subject | TextLynx Plus | en_US |
dc.subject | Ampliación de Funciones | en_US |
dc.subject | Analizador Avanzado | en_US |
dc.subject | Textos | en_US |
dc.subject | Lingüística Computacional | en_US |
dc.subject | Inteligencia Artificial | en_US |
dc.subject.other | Análisis Lingüístico | en_US |
dc.subject.other | Minería de Datos | en_US |
dc.subject.other | Procesador de Textos | en_US |
dc.subject.other | Software | en_US |
dc.subject.other | Lingüística Computacional | en_US |
dc.subject.other | Inteligencia Artificial | en_US |
dc.title | TextLynx Plus: Ampliación de funciones para un analizador avanzado de textos | en_US |
dc.type | Thesis | en_US |
dc.type.thesis | bachelor | en_US |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- TextLynxPlus (Victor Annier Barrios Cañizares).pdf
- Tamaño:
- 1.97 MB
- Formato:
- Adobe Portable Document Format
Bloque de licencias
1 - 1 de 1
No hay miniatura disponible
- Nombre:
- license.txt
- Tamaño:
- 3.33 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción: