Creación y perfeccionamiento de herramientas para la minería de opinión en idioma Español

dc.contributor.advisorAmores Fernández, Mario Alberto
dc.contributor.advisorArco García, Leticia
dc.contributor.authorBorroto Escalante, Claudia Milissen
dc.coverage.spatial1016432en_US
dc.date.accessioned2017-02-01T16:34:07Z
dc.date.available2017-02-01T16:34:07Z
dc.date.issued2014-06-28
dc.description.abstractLas herramientas utilizadas actualmente en la Minería de Opinión (Amores)son generalmente enfocadas en el idioma Inglés, presentan dificultades en el procesamiento, estántodas muy dispersas y algunas en formatos obsoletos.Por lo tanto, se necesitan de otras herramientas para el idioma Español y que reporten mejores resultados. Además, sería de gran utilidad agrupar la mayor cantidad posible de herramientas en una biblioteca. De ahí que el objetivo general de este trabajo consiste en desarrollar una biblioteca en Java con nuevas herramientas que permitan realizar la minería de opinión, junto con algunas ya existentes actualizadas y perfeccionadas.Los principales resultados obtenidos son: (1) se modificó el Índice Intralingüístico transformando el formato del mismo para hacer más eficiente su uso en la MO; (2) se modificó el SentiWordNet 3.0 transformando el formato y aplicando cuatro etapas que permitieron obtener una mejor puntuación de los términos; (3) se creó el SpanishSentiWordNet que facilitará significativamente la MO en Español; (4) se creó la biblioteca PolarityDetection que encapsula los recursos creados y modificados facilitando la MO; y finalmente, (5) se realizaron experimentos con 200 opiniones positivas y 200 opiniones negativas con igual representatividad de los idiomas Inglés y Español y se obtuvo aproximadamente el 90% de opiniones bien clasificadas.en_US
dc.description.abstractThe currently used tools in Opinion Mining (OM) are generally focused on English language. They have difficulties in processing, are very scattered and some of them are provided in obsolete formats. Therefore, the need for other tools focused in the Spanish language that can provide better results become apparent. It would also be useful to group as many tools as possible in a library. Hence, the general objective of this work is to develop a Java library with new tools to perform opinion mining, along with some existing tools, which were updated and improved. The main results are: (1) the intralinguistic index was modified by means of transforming its format for a more efficient use in OM; (2) SentiWordNet 3.0 was modified transforming the existing format and applying four stages that allowed to obtain better score for the terms; (3) SpanishSentiWordNet was created, which will significantly facilitate OM in Spanish; (4) The library PolarityDetection was created which encapsulate the created and modified resources facilitating OM; and finally, (5) experiments with 200 positive reviews and 200 negative reviews with equal representation of the English and Spanish languages were made and they got about 90% of well classified reviews.en_US
dc.description.sponsorshipFacultad de Matemática, Física y Computación. Departamento de Ciencias de la Computaciónen_US
dc.description.statusnon-publisheden_US
dc.identifier.urihttps://dspace.uclv.edu.cu/handle/123456789/7319
dc.language.isoesen_US
dc.publisherUniversidad Central “Marta Abreu” de Las Villasen_US
dc.rightsEste documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 Licenseen_US
dc.subjectPerfeccionamiento de Herramientasen_US
dc.subjectMinería de Opiniónen_US
dc.subjectIdioma Españolen_US
dc.subjectBiblioteca Javaen_US
dc.subject.otherBase de Datosen_US
dc.subject.otherDesarrollo de Aplicacionesen_US
dc.titleCreación y perfeccionamiento de herramientas para la minería de opinión en idioma Españolen_US
dc.typeThesisen_US
dc.type.thesisbacheloren_US

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Informe Claudia Rev 17.06.2014.pdf
Tamaño:
1.55 MB
Formato:
Adobe Portable Document Format
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
3.33 KB
Formato:
Item-specific license agreed upon to submission
Descripción: