Detección de ironía en textos cortos enfocada a la minería de opinión

dc.contributor.advisorArco García, Leticia
dc.contributor.advisorRodríguez Dosina, Adrián
dc.contributor.authorSotolongo Peña, Anakarla
dc.coverage.spatial1016432en_US
dc.date.accessioned2018-01-15T20:56:44Z
dc.date.available2018-01-15T20:56:44Z
dc.date.issued2017-06-25
dc.description.abstractLas opiniones textuales imponen grandes retos a las aplicaciones de minería de opinión ya que varios problemas están presentes; entre ellos: la escritura de opiniones de manera irónica o sarcástica. Existen varias propuestas que permiten detectar ironía; sin embargo, la efectividad de la clasificación es baja, sobre todo debido a que aún no son suficientemente expresivos los rasgos identificados para discriminar entre oraciones irónicas y no irónicas. Es por ello que el objetivo general de esta investigación consiste en detectar de manera efectiva la ironía en textos cortos a partir de la identificación de nuevos rasgos lingüísticos y la aplicación de algoritmos de aprendizaje supervisado. Los principales resultados obtenidos son: (1) El estudio y consecuente identificación de las características de los rasgos utilizados en la clasificación de la ironía, así como los principales algoritmos de aprendizaje supervisado utilizados con tales propósitos. (2) La creación de nuevos rasgos que permiten caracterizar los textos irónicos y por tanto discriminar entre clases, principalmente basados en patrones específicos y generales, la ambigüedad, el desbalance contextual, las estadísticas de aparición de las palabras y el contraste en el texto. (3) Un módulo que permite detectar de manera efectiva la ironía a partir de los rasgos creados y seleccionados de la literatura, mediante el uso de varias técnicas de aprendizaje supervisado. La combinación de los rasgos creados, así como los algoritmos de clasificación empleados, permitieron obtener valores de calidad en la detección de la ironía superiores a los reportados previamente en la literatura.en_US
dc.description.abstractTextual opinions impose great challenges on opinion mining applications because several problems are present; such as: the opinion could be writing in an ironic or sarcastic way. There are several proposals to detect irony; however, the irony classification effectiveness is low, mainly because the features identified to discriminate between ironic and non-ironic sentences are not enough expressive. For that reason, this research is focus on the irony detect in short texts by identifying new linguistic features and applying supervised learning algorithms. The main results obtained are: (1) The study and consequent identification of the principal characteristics of features used in irony classification, as well as the main supervised learning algorithms used for such purposes. (2) The creation of new features that allow characterizing ironic texts and therefore discriminate between classes, mainly based on specific and general patterns, ambiguity, contextual imbalance, statistics on word appearances and contrast in the text. (3) A module which allows the effective irony detection from the created features and others selected from the literature, by applying supervised learning techniques. The combination of the created features, as well as the selected classification algorithms, allowed to obtain quality values in the irony detection better than those previously reported in the literature.en_US
dc.description.sponsorshipFacultad de Matemática, Física y Computación. Departamento de Ciencias de la Computaciónen_US
dc.description.statusnon-publisheden_US
dc.identifier.urihttps://dspace.uclv.edu.cu/handle/123456789/8409
dc.language.isoesen_US
dc.publisherUniversidad Central “Marta Abreu” de Las Villasen_US
dc.rightsEste documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 Licenseen_US
dc.subjectMinería de Opiniónen_US
dc.subjectIronía en Textos Cortosen_US
dc.subjectClasificaciónen_US
dc.subjectAprendizaje Automático Supervisadoen_US
dc.subject.otherMinería deTextoen_US
dc.subject.otherOpinión Públicaen_US
dc.subject.otherSátiraen_US
dc.subject.otherAprendizaje Automatizadoen_US
dc.subject.otherDiseño Experimentalen_US
dc.titleDetección de ironía en textos cortos enfocada a la minería de opiniónen_US
dc.typeThesisen_US
dc.type.thesisbacheloren_US

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
2017.06.20 Tesis Anakarla.pdf
Tamaño:
1.26 MB
Formato:
Adobe Portable Document Format
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
3.33 KB
Formato:
Item-specific license agreed upon to submission
Descripción: