Nueva metodología de consenso basado en KNIME para la predicción de la actividad antileishmanial

Fecha

2020

Autores

Casanova Alvarez, Omar

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Central "Marta Abreu" de Las Villas

Resumen

Las predicciones in-silico de la actividad antileishmanial usando modelos de Relaciones Cuantitativas Estructura-Actividad (QSAR) han sido desarrolladas sobre bases de datos pequeñas y limitadas. En la actualidad, la disponibilidad de grandes y diversas bases de datos obtenidas de High-Throughput Screening (HTS) provee la oportunidad a la comunidad científica de modelar esta actividad desde las estructuras químicas. En este estudio, se presenta el primer flujo de trabajo semiautomatizado en KNIME para modelar grandes, diversas y altamente desbalanceadas series de compuestos con actividad antileishmanial. Esto propone una nueva estrategia basada en el uso de diferentes conjuntos de entrenamiento balanceados para la generación de un modelo de consenso que usa árboles de decisión y tres criterios de clasificación. Los modelos fueron rigurosamente validados usando las series de prueba y externa. Para el nivel de consenso más bajo que cubre el 100% del espacio químico, las estadísticas de predicción están alrededor del 75% para ambos, serie de prueba y externa, mientras que para el mayor nivel de consenso incremental donde se reduce el espacio químico hasta el 21 %, las estadísticas ascienden hasta el 92 %. Estos resultados resaltan la relevancia del modelo consenso para priorizar una relativamente pequeña serie de compuestos activos con alta sensibilidad en la predicción usando el consenso incremental a altos niveles de concordancia o predecir muchos más compuestos como sea posible, decreciendo el nivel del acuerdo. Así, el flujo de trabajo desarrollado elimina errores humanos, mejora la reproducibilidad del procedimiento y nos permite reproducir el diseño cuando nuevos datos estén disponibles y usarlo en otros problemas de QSAR.

Descripción

Palabras clave

Leishmania, Relaciones Cuantitativas Estructura-Actividad (QSAR), KNIME, Datos Desbalanceados, Machine Learning, Árbol de Decisión

Citación

Descargar Referencia Bibliográfica