Creación de un flujo de trabajo automatizado en KNIME,para el estudio de La Relación Estructura.Actividad de una base de datos de compuestos orgánicos con actividad antimalárica
Fecha
2020
Autores
Abreu Martínez, Elier E.
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Central "Marta Abreu'' de Las Villas. Facultad de Química y Farmacia. Departamento de Licenciatura en Química
Resumen
Structure –Activity Relationship (SAR)analysis plays an importantrole in understanding structural determinants of biological activity and optimizing compounds to become leaders for preclinical evaluation. The programs designed to carry out this analysis offer low interactivity in the manipulation of the results obtained. In this study, the first automated workflow is presented, in KNIME, which allows combining two methods of SAR analysis, creation and inspection of anetwork similarity graph (NSG)and detection and removal of Activity Cliff. For this, the compounds from GNF were taken and cured, obtaining a database of 4682 compounds with their 𝐸����𝐶����50(𝑛����𝑀����)reported, which were labeled as "active" (𝐸����𝐶����50≤1000𝑛����𝑀����) and "inactive" (𝐸����𝐶����50>1000𝑛����𝑀����).The SAR analysisfirst creates the NSG and extracts the SAR information available in each of the clusters and then identifies the subsets of compounds that induce the local SAR discontinuity in the database(Activity Cliff). Therefore, highly informative subsets of local SAR, including known antimalarial chemotypes, were identified in the database. This information should be useful in prioritizing and selecting antimalarial candidate compounds.
El análisis de la Relación Estructura –Actividad (SAR, por sus siglas en inglés)desempeña un papel fundamental en la comprensión de los determinantes estructurales de la actividad biológica y enla optimización de compuestos para convertirse en líderes para la evaluación preclínica. Los programas encaminados a realizar este análisis ofrecen una baja interactividad en la manipulación de los resultados obtenidos.En este estudio, se presenta el primer flujo de trabajo automatizado,en KNIME, que permite combinar dos métodos del análisis de la SAR, creación e inspección de ungráfico de similitud tipo red (NSG, por sus siglas en inglés)y detección y remoción de Activity Cliff.Para ello se tomaron los compuestos provenientes del GNF y se curaronobteniéndose una base de datos de 4682 compuestoscon su 𝐸��𝐶��50(𝑛��𝑀��)reportado, que fueron etiquetados como “activos” (𝐸��𝐶��50≤1000𝑛��𝑀��) e “inactivos” (𝐸��𝐶��50>1000𝑛��𝑀��).El análisis de la SARprimero crea el NSG y extrae la información de la SAR disponible en cada uno de los clústeres y luegoidentifica los subconjuntos de compuestos que inducen la discontinuidad SAR local en los conjuntos de datos (Activity Cliff). Por tanto, fue identificado enla base de datossubconjuntos con un elevado contenido de información de la SAR local, incluidos los quimiotiposantipalúdicos conocidos. Esta información debería ser útil para priorizar y seleccionar compuestos candidatos antipalúdicos
El análisis de la Relación Estructura –Actividad (SAR, por sus siglas en inglés)desempeña un papel fundamental en la comprensión de los determinantes estructurales de la actividad biológica y enla optimización de compuestos para convertirse en líderes para la evaluación preclínica. Los programas encaminados a realizar este análisis ofrecen una baja interactividad en la manipulación de los resultados obtenidos.En este estudio, se presenta el primer flujo de trabajo automatizado,en KNIME, que permite combinar dos métodos del análisis de la SAR, creación e inspección de ungráfico de similitud tipo red (NSG, por sus siglas en inglés)y detección y remoción de Activity Cliff.Para ello se tomaron los compuestos provenientes del GNF y se curaronobteniéndose una base de datos de 4682 compuestoscon su 𝐸��𝐶��50(𝑛��𝑀��)reportado, que fueron etiquetados como “activos” (𝐸��𝐶��50≤1000𝑛��𝑀��) e “inactivos” (𝐸��𝐶��50>1000𝑛��𝑀��).El análisis de la SARprimero crea el NSG y extrae la información de la SAR disponible en cada uno de los clústeres y luegoidentifica los subconjuntos de compuestos que inducen la discontinuidad SAR local en los conjuntos de datos (Activity Cliff). Por tanto, fue identificado enla base de datossubconjuntos con un elevado contenido de información de la SAR local, incluidos los quimiotiposantipalúdicos conocidos. Esta información debería ser útil para priorizar y seleccionar compuestos candidatos antipalúdicos
Descripción
Palabras clave
Actividad Antimalárica, Trabajo Automatizado, KNIME, Relación Estructura Actividad (SAR), Compuestos Antipalúdicos