Desambiguación del sentido de las palabras

dc.contributor.advisorAmores Fernández, Mario Alberto
dc.contributor.advisorArco García, Leticia
dc.contributor.authorNadal Pérez, Ariel
dc.contributor.authorSantana González, Katherine
dc.coverage.spatial1016432en_US
dc.date.accessioned2015-06-26T20:33:14Z
dc.date.available2015-06-26T20:33:14Z
dc.date.issued2014-06-27
dc.description.abstractEl lenguaje natural es ambiguo, por lo que muchas palabras pueden interpretarse de varias maneras, dependiendo del contexto en que se producen. De ahí que tiene gran desarrollo en la actualidad la identificación computacional del significado de las palabras en su contexto. Los métodos no supervisados para la desambiguación del sentido de las palabras tienen la ventaja que no requieren partir de textos previamente etiquetados; sin embargo, aún presentan deficiencias ya que logran bajos valores de efectividad de la desambiguación y realizan una gran cantidad de iteraciones para desambiguar. Por tal motivo, el objetivo general de la investigación consiste en desarrollar métodos más efectivos y eficientes que permitan desambiguar de manera no supervisada el sentido de las palabras, basados en agrupamientos y en la teoría de los conjuntos aproximados. Los principales resultados obtenidos son: (1) se identificaron los algoritmos existentes ya sean supervisados o no supervisados, que permitan desambiguar el sentido de las palabras, destacándose aquellos no supervisados basados en grafos; (2) se transformó el método propuesto por (Anaya-Sánchez et al., 2007) y se creó el método RST-Disambiguation; (3) se creó la biblioteca UnsupervisedWSD que integra los métodos modificados y el creado; y (4) se validó con el Semcor la exactitud y precisión del algoritmo propuesto evidenciando buenos resultados en la desambiguación de términos.en_US
dc.description.abstractNatural language is ambiguous. Words can be interpreted in various ways depending on the context. Thus the push today for a computational identification of the meaning of words in their context. Unsupervised meaning-disambiguation methods have the advantage of not requiring pre-labeled texts as a starting point. However, they still present deficiencies, as they achieve relatively low values of disambiguation effectiveness and require a large number of iterations to disambiguate. Given the case, the overall objective of this research is to develop more effective and efficient methods to disambiguate the meaning of words, in an unsupervised manner and based in groupings and the rough sets theory. The results obtained were: (1) Identification of the existing algorithms, either supervised or unsupervised, which allow to disambiguate the meaning of the words, making emphasis on unsupervised, graph-based ones (2) Transformation of the method proposed by (Anaya-Sánchez et al., 2007) and creation of the method RST-Disambiguation (3) Creation of the UnsupervisedWSD library that integrates the modified methods and the created one (4) Validation, with Semcor, of the accuracy and precision of the proposed algorithm, with a resulting evidence of good results in the disambiguation of termsen_US
dc.description.sponsorshipFacultad de Matemática, Física y Computación. Departamento Ciencias de la Computaciónen_US
dc.description.statusnon-publisheden_US
dc.identifier.urihttps://dspace.uclv.edu.cu/123456789/1198
dc.language.isoesen_US
dc.publisherUniversidad Central “Marta Abreu” de Las Villasen_US
dc.rightsEste documento es Propiedad Patrimonial de la Universidad Central ¨Marta Abreu¨de Las Villas. El autor o autores conservan los derechos morales que como tal le son reconocidos por la Legislación vigente sobre Derecho de Autor. Los distintos Usuarios podrán copiar, distribuir, comunicar públicamente la obra y hacer obras derivadas; bajo las condiciones siguientes: 1. Reconocer y citar al autor original 2. No utilizar la obra con fines comerciales 3. No realizar modificación alguna a la obra 4. Compartir aquellos productos resultado del uso de la obra bajo la misma licencia de esta. Los Usuarios pueden reutilizar los metadatos en cualquier medio sin autorización previa, siempre que los propósitos de su utilización sean sin ánimo de lucro y se provea el Identificador OAI, un enlace al registro de metadatos original, o se haga referencia al repositorio de donde han sido extraídos.en_US
dc.subjectLenguaje Naturalen_US
dc.subjectMétodos de Desambiguaciónen_US
dc.subjectLingüística Computacionalen_US
dc.titleDesambiguación del sentido de las palabrasen_US
dc.typeThesisen_US
dc.type.thesisbacheloren_US

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Tesis Katherine-Ariel.pdf
Tamaño:
2.19 MB
Formato:
Adobe Portable Document Format
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
3.33 KB
Formato:
Item-specific license agreed upon to submission
Descripción: