Medidas de similitud biomolecular k-arias basadas en la Teoría de la Generalizabilidad

dc.contributor.advisorRivera Borroto, Oscar Miguel
dc.contributor.advisorHernández Díaz, Yoandy
dc.contributor.advisorCasas Cardoso, Gladys María
dc.contributor.authorCastillo Fernández, Emilia María
dc.coverage.spatial1016432en_US
dc.date.accessioned2016-04-01T16:14:43Z
dc.date.available2016-04-01T16:14:43Z
dc.date.issued2013-07-04
dc.description.abstractSe introduce un marco formal acerca de la Teoría de la Generalizabilidad (TG) en Quimioinformática para mejorar el análisis matemático e interpretación de relaciones de similitud biomolecular. Las medidas TG incorporan en sus fórmulas información en cuanto a transformaciones admisibles de las escalas métricas de medición, que permiten modelar las semejanzas biomoleculares como similitudes entre vectores de representación transformados funcionalmente. También, las similitudes basadas en la TG tienen distribuciones estadísticas asociadas, que permiten contrastar si un puntaje de similitud en particular es significativo o no. La utilidad de las medidas de TG por pares para problemas Quimioinformáticos se muestra a través del análisis estadístico de su desempeño relativo en experimentos de búsqueda de similitud que comprenden un amplio rango de medidas de proximidad reportadas previamente, la selección de conjuntos de datos para validación y aplicación, descriptores numéricos informativos, una fase de selección de rasgos, y una métrica de desempeño adecuada. Los resultados indican que las medidas basadas en la TG se desempeñan comparable o superiormente en algunos casos a las medidas reportadas, demostrando así su efectividad en la recuperación temprana. Su interpretación y otras aplicaciones potenciales son consideradas posteriormente. Después, se presentan las medidas TG multivariadas como la generalización natural del caso bivariado para múltiples biomoléculas. Se muestra que estas son equivalentes a la media ponderada de sus contrapartes binarias correspondientes, siendo tres de ellas completamente nuevas en la literatura. Luego, las medidas TG multivariadas son calculadas en conjuntos de datos modificados para evaluar su poder discriminatorio entre compuestos activos e inactivos. Su integración a herramientas operativas de cribado virtual y generalización a relaciones polinómicas de grado superior son discutidas en la parte final de este trabajo.en_US
dc.description.abstractA formal frame on Generalizability Theory (GT) is introduced in Cheminformatics in order to improve the mathematical analysis and interpretation of biomolecular similarity relationships. GT-measures incorporate information in their formulas concerning the admissible transformations of metric scales of measurement, so they allow modeling the biomolecular resemblances as similarities among functionally transformed representation vectors. Also, GT-based similarities have associated statistical distribution functions, so they allow contrasting whether a particular similarity score is significant. The usefulness of 2-way GT-measures for cheminformatic problems is shown through the statistical analysis of their relative performance in similarity searching experiments comprising a broad range of previously reported proximity measures, medium-to-large screening data sets for validation and application, informative numerical descriptors, a feature selection stage, and a suitable performance metric. Results indicate that GT-based measures perform comparably or superiorly in some cases to the state-of-the-art measures, thus demonstrating their effectiveness at the early retrieval. Their interpretation and other potential applications are further considered. Afterwards, k-way GT-measures are presented as the natural generalization to the bivariate case for multiple biomolecules. They are shown to be equivalent to the weighted average of their corresponding 2-way counterparts, three of them being entirely new in the literature. Later, k-way GT-measures are calculated for modified data sets in order to assess their discriminatory power between active and inactive compounds. Their integration into operative virtual screening tools and generalization to higher-degree polynomial relationships are discussed in the last part of this work.en_US
dc.description.sponsorshipFacultad de Matemática, Física y Computación. Departamento Ciencias de la Computaciónen_US
dc.description.statusnon-publisheden_US
dc.identifier.urihttps://dspace.uclv.edu.cu/handle/123456789/5148
dc.language.isoesen_US
dc.publisherUniversidad Central “Marta Abreu” de Las Villasen_US
dc.rightsEste documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 Licenseen_US
dc.subjectDescubrimiento de Fármacosen_US
dc.subjectTeoría de la Generalizabilidaden_US
dc.subjectTécnicas de Cribado Virtualen_US
dc.subjectQuimioinformáticaen_US
dc.subjectAnálisis Matemáticoen_US
dc.subjectRelaciones de Similituden_US
dc.titleMedidas de similitud biomolecular k-arias basadas en la Teoría de la Generalizabilidaden_US
dc.typeThesisen_US
dc.type.thesisbacheloren_US

Archivos

Bloque original
Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
tesis Emilia Castillo.pdf
Tamaño:
1.57 MB
Formato:
Adobe Portable Document Format
Bloque de licencias
Mostrando 1 - 1 de 1
No hay miniatura disponible
Nombre:
license.txt
Tamaño:
3.33 KB
Formato:
Item-specific license agreed upon to submission
Descripción: