Comparación de estrategias aglomerativas combinatorias tipo Ward usando conjuntos de datos quimioinformáticos y descriptores moleculares reales seleccionados por técnicas de aprendizaje automático
Fecha
2011
Autores
Rivera Borroto, Oscar Miguel
Hernández Llanes, David
Marrero Ponce, Yovani
Grau Ábalo, Ricardo del Corazón
García de la Vega, José Manuel
Rodríguez Abed, Abdel
Casas Cardoso, Gladys
Rodríguez Martín, Itnamy
Díaz Gálvez, Amalia
Título de la revista
ISSN de la revista
Título del volumen
Editor
Feijóo
Resumen
El trabajo aborda la temática de los algoritmos de conglomerados combinatorios y su aplicación en problemas de la Quimioinformática como son el cribado virtual y las técnicas de selección de compuestos en conjunto de datos farmacológicos. Como tarea primaria e íntimamente ligada a los propósitos del trabajo, se propone una metodología para la selección de descriptores moleculares linealmente relevantes a las actividades biológicas bajo estudio mediante técnicas del Aprendizaje Automático, que garanticen el principio de comportamiento de vecindad y, por tanto, el buen rendimiento de los algoritmos a comparar. Posteriormente se proponen doce algoritmos aglomerativos jerárquicos y combinatorios, siete de los cuales son clásicos en la literatura especializada y otros cinco son novedosos en esta área del conocimiento. El objetivo fundamental del trabajo es comparar los nuevos algoritmos con el de elección o de Ward. Los experimentos se realizaron empleando ocho conjuntos de datos bien establecidos y validados en la literatura de la Química Medicinal que incluyen compuestos con usos en el tratamiento de problemas cardiovasculares, de enfermedades mentales, antiinflamatorios, entre otros. El tratamiento estadístico de los resultados permitó a los autores concluir que mediante las técnicas de selección de rasgos empleadas es posible establecer un sistema de meta-aprendizaje en conjuntos supervisados que guíen la posterior selección de descriptores moleculares en sistemas análogos pero no supervisados. Además, permite inferir que el grupo de actividades farmacológicas es modelizable a través de unas pocas familias de descriptores moleculares 3D. Finalmente, y como resultado más alentador, conlleva a argumentar que tres de los algoritmos propuestos se comportan de forma superior a la mayoría de los algoritmos clásicos y similarmente (o ligeramente superior en el caso más optimista) al algoritmo de Unión Completa y al de Ward.
Descripción
Palabras clave
Estrategias, Ward, Datos, Aprendizaje, Algoritmos, Problemas, Quimioinformática, Resultados, Algoritmos de conglomerados, Aprendizaje automático