Nueva metodología de consenso basado en KNIME para la predicción de la actividad antileishmanial
Fecha
2020
Autores
Casanova Alvarez, Omar
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Central "Marta Abreu" de Las Villas
Resumen
Las predicciones in-silico de la actividad antileishmanial usando modelos de Relaciones
Cuantitativas Estructura-Actividad (QSAR) han sido desarrolladas sobre bases de datos pequeñas
y limitadas. En la actualidad, la disponibilidad de grandes y diversas bases de datos
obtenidas de High-Throughput Screening (HTS) provee la oportunidad a la comunidad científica
de modelar esta actividad desde las estructuras químicas. En este estudio, se presenta el
primer flujo de trabajo semiautomatizado en KNIME para modelar grandes, diversas y altamente
desbalanceadas series de compuestos con actividad antileishmanial. Esto propone una
nueva estrategia basada en el uso de diferentes conjuntos de entrenamiento balanceados para
la generación de un modelo de consenso que usa árboles de decisión y tres criterios de clasificación.
Los modelos fueron rigurosamente validados usando las series de prueba y externa.
Para el nivel de consenso más bajo que cubre el 100% del espacio químico, las estadísticas
de predicción están alrededor del 75% para ambos, serie de prueba y externa, mientras que
para el mayor nivel de consenso incremental donde se reduce el espacio químico hasta el
21 %, las estadísticas ascienden hasta el 92 %. Estos resultados resaltan la relevancia del modelo
consenso para priorizar una relativamente pequeña serie de compuestos activos con alta
sensibilidad en la predicción usando el consenso incremental a altos niveles de concordancia
o predecir muchos más compuestos como sea posible, decreciendo el nivel del acuerdo.
Así, el flujo de trabajo desarrollado elimina errores humanos, mejora la reproducibilidad del
procedimiento y nos permite reproducir el diseño cuando nuevos datos estén disponibles y
usarlo en otros problemas de QSAR.
Descripción
Palabras clave
Leishmania, Relaciones Cuantitativas Estructura-Actividad (QSAR), KNIME, Datos Desbalanceados, Machine Learning, Árbol de Decisión