TextLynx Plus: Ampliación de funciones para un analizador avanzado de textos

dc.contributor.advisorLlanes Abeijón, Manuel
dc.contributor.authorBarrios Cañizares, Víctor Annier
dc.coverage.spatialSanta Claraen_US
dc.date.accessioned2018-05-07T17:45:02Z
dc.date.available2018-05-07T17:45:02Z
dc.date.issued2007-07-08
dc.description.abstractEl sistema TextLynx Plus realiza el análisis lingüístico de un corpus de textos. Para esto permite realizar el reconocimiento morfológico (tagging) y sintáctico (parsing) de los textos (usando software libre adicional al que provee de una interfaz más amistosa), así como la caracterización y clasificación del léxico por su frecuencia y distribución. Elabora tablas enmarcadas en los siguientes tipos: grafémica, léxicas, textuales descriptivas y textuales relacionales. En la implementación de gran parte de sus algoritmos para procesar los datos textuales se hace uso de la memoria en disco de la máquina para poder manipular corpora de gran tamaño sin recurrir a un uso excesivo de la RAM. Se aplican transformaciones en la representación léxica del corpus que permiten comparar los corpora de forma más efectiva por sus rasgos esenciales, así como la comparación y clasificación de los textos que los componen. El sistema permite representar léxicamente al corpus de forma tal que se superan algunas de las limitaciones del enfoque de saco de palabras al considerarse la combinatoria léxica y las relaciones sintácticas en el marco oracional al representar el contenido de los textos. La codificación óptima de representaciones de corpus muy grandes permite usar dichas representaciones en el procesamiento con software de minería de texto como el CorpusMineren_US
dc.description.abstractThe TextLynx Plus system is designed to perform the linguistic analysis of text corpora. The system allows for the POS tagging and parsing of the texts in the corpus (using additional free software for which it provides a user friendly interface) , as well as the characterization and distribution of the lexicon based on its frequency and distribution. The system produces graphemic, lexical, textual (descriptive and relational) tables. In the implementation of many of its algorithms for textual data processing use is made of memory in the disk to make the system capable of manipulating larger corpora without incurring in excessive use of RAM. Transformations in the lexical representation of the corpus allows for corpus comparison of higher efficiency based on essential features, as well as the comparison and classification of texts. The system provides for the lexical representation of the corpus beyond the ―bag of words‖ paradigm by including lexical combinatory and syntactical relations within the sentential framework to represent the contents of the texts. Optimum codification of very large corpus representations enables processing with text mining software such as CorpusMiner.en_US
dc.description.sponsorshipFacultad de Matemática, Física y Computación. Departamento de Ciencias de la Computaciónen_US
dc.description.statusnon-publisheden_US
dc.identifier.urihttps://dspace.uclv.edu.cu/handle/123456789/9341
dc.language.isoesen_US
dc.publisherUniversidad Central “Marta Abreu” de Las Villasen_US
dc.rightsEste documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 Licenseen_US
dc.subjectTextLynx Plusen_US
dc.subjectAmpliación de Funcionesen_US
dc.subjectAnalizador Avanzadoen_US
dc.subjectTextosen_US
dc.subjectLingüística Computacionalen_US
dc.subjectInteligencia Artificialen_US
dc.subject.otherAnálisis Lingüísticoen_US
dc.subject.otherMinería de Datosen_US
dc.subject.otherProcesador de Textosen_US
dc.subject.otherSoftwareen_US
dc.subject.otherLingüística Computacionalen_US
dc.subject.otherInteligencia Artificialen_US
dc.titleTextLynx Plus: Ampliación de funciones para un analizador avanzado de textosen_US
dc.typeThesisen_US
dc.type.thesisbacheloren_US

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
TextLynxPlus (Victor Annier Barrios Cañizares).pdf
Tamaño:
1.97 MB
Formato:
Adobe Portable Document Format
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
3.33 KB
Formato:
Item-specific license agreed upon to submission
Descripción: