Modelos de proximidad novedosos para el cribado virtual de conjuntos de datos quimioinformáticos

Hernández Díaz, Yoandy

Modelos de proximidad novedosos para el cribado virtual de conjuntos de datos quimioinformáticos

dc.contributor.advisor	Rivera Borroto, Oscar Miguel
dc.contributor.advisor	Morell Pérez, Carlos
dc.contributor.author	Hernández Díaz, Yoandy
dc.coverage.spatial	Santa Clara	en_US
dc.date.accessioned	2018-03-06T22:22:51Z
dc.date.available	2018-03-06T22:22:51Z
dc.date.issued	2011-06-26
dc.description.abstract	La búsqueda de similitud es una prestación importante en los sistemas modernos de gestión de la información química para acceder a la rica información contenida en los enormes repositorios químicos modernos. Básicamente, dadas una representación molecular, una medida de similitud y un algoritmo de búsqueda, la salida de la técnica devuelve una lista ordenada de moléculas del conjunto de datos en orden decreciente de similitud con respecto a la molécula consulta especificada por el usuario. Como consecuencia, los investigadores han puesto su interés en la eficacia de las representaciones y medidas de similitud en estas tareas. Sin embargo, sus estudios se han enfocado predominantemente en representaciones binarias y las medidas de semejanza correspondientes, y poco se ha trabajado en otros tipos de descripción numérica. También se han aplicado técnicas del Aprendizaje Automático en la selección de rasgos, aunque no de forma consistente con el principio de vecindad. Estos precedentes junto a la necesidad de nuevos métodos apropiados para cada contexto químico, constituyen la motivación para este trabajo. El mismo comprende la implementación computacional en el ambiente Java de 21 modelos de proximidad, 9 de los cuales son novedosos en Quimioinformática, proceden del área de la Psicología y están basados en el concepto acuerdo relacional, y otros doce son medidas ya establecidas de la literatura especializada. Posteriormente, las nuevas medidas de similitud fueron comparadas y validadas en la “recuperación temprana” usando nueve conjuntos farmacológicos de la Química Medicinal de interés internacional, representados por descriptores numéricos, seleccionados por Aprendizaje Automático, y un algoritmo de búsqueda eficiente. Los resultados muestran que en tendencia promedia los nuevos modelos se comportan superiormente a los de referencia y que más de la mitad de los mismos se sitúan entre los diez modelos más potentes.	en_US
dc.description.abstract	Similarity searching is an important possibility in modern chemical information management systems to accede the rich information contained in modern enormous chemical repositories. Basically, given a molecular representation, a similarity measure, and a matching algorithm, the technique’s output returns an ordered list of dataset molecules in decreasing order of similarity with respect to a query or reference molecule specified by the user. As a consequence, researchers have put their interest in molecular representations and similarity measures performance in these tasks. However, their studies have been predominantly focused in binary representations and the corresponding resemblance measures, and little work has been done taking into account other types of numerical description. Also, Machine Learning techniques have been applied for descriptor selection, though not consistently with the neighborhood principle. These precedents, together with the need of new methods suitable for each chemical context, constitute the motivation for this work. It comprises the computational implementation in the Java environment of 21 proximity models, of which 12 are novel in Chemoinformatics that come from the Psychology area, and are based on the concept of relational agreement; and other nine are measures already established in the specialized literature. Later, the new similarity measures were compared and validated at the “early retrieval” using nine pharmacological datasets from Medicinal Chemistry, represented by machine learning-selected real descriptors, and some efficient matching algorithm. Results show that in average trends the new models perform superiorly with respect to the reference ones, and more than half of them are among the top-10 models.	en_US
dc.description.sponsorship	Facultad de Matemática, Física y Computación. Departamento de Ciencias de la Computación	en_US
dc.description.status	non-published	en_US
dc.identifier.uri	https://dspace.uclv.edu.cu/handle/123456789/8843
dc.language.iso	es	en_US
dc.publisher	Universidad Central “Marta Abreu” de Las Villas	en_US
dc.rights	Este documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 License	en_US
dc.subject	Sistemas de Gestión de la Información	en_US
dc.subject	Repositorios Químicos	en_US
dc.subject	Algoritmo de Búsqueda	en_US
dc.subject	Similitud Molecular	en_US
dc.subject	Cribado Virtual	en_US
dc.subject	Datos Quimioinformáticos	en_US
dc.subject	Aprendizaje Automático	en_US
dc.subject	Computación en Química	en_US
dc.subject.other	Sistemas de Información	en_US
dc.subject.other	Repositorios	en_US
dc.subject.other	Algoritmo	en_US
dc.subject.other	Búsquedas	en_US
dc.subject.other	Medidas de Similitud	en_US
dc.subject.other	Filtros Digitales	en_US
dc.subject.other	Aprendizaje Automático	en_US
dc.subject.other	Inteligencia Artificial	en_US
dc.subject.other	Computación en Química	en_US
dc.title	Modelos de proximidad novedosos para el cribado virtual de conjuntos de datos quimioinformáticos	en_US
dc.type	Thesis	en_US
dc.type.thesis	bachelor	en_US

Archivos

Bloque original

Mostrando 1 - 1 de 1

Nombre:: Tesis Completa de Yoandy Hernández Díaz.pdf
Tamaño:: 1.62 MB
Formato:: Adobe Portable Document Format

Descargar

Bloque de licencias

Mostrando 1 - 1 de 1

Nombre:: license.txt
Tamaño:: 3.33 KB
Formato:: Item-specific license agreed upon to submission
Descripción:

Descargar

Colecciones

Tesis de Pregrado - Licenciatura en Ciencias de la Computación