Diseño y aplicación de un flujo de modelación QSPR para la predicción de la biodisponibilidad oral de fármacos y moléculas afines en humanos

Fecha

2019

Autores

Falcón Cano, Gabriela

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Central ``Marta Abreu`` de Las Villas. Facultad de Química y Farmacia. Departamento de Licenciatura en Ciencias Farmacéuticas

Resumen

La determinación exacta de la biodisponibilidad oral es primordial durante el descubrimiento y desarrollo de fármacos. La complejidad y variabilidad de esta propiedad hacen de su predicción una tarea difícil. Los modelos de Relación Cuantitativa Estructura-Propiedad constituyen una estrategia prometedora para la predicción de la biodisponibilidad oral, sin embargo, la mayoría los modelos disponibles han sido desarrollados sobre pequeñas bases de datos públicas con calidad y diversidad estructural cuestionables, utilizando técnicas estadísticas aplicadas de forma individual y sin una proyección a la automatización del proceso de modelación, lo que limita su utilización por cualquier tipo de usuario. En el presente trabajo se desarrolló un flujo continuo de modelación, utilizando KNIME 3.7.1, para la predicción de la biodisponibilidad oral humana, a partir de una base de datos de 1063 fármacos y moléculas afines, utilizándose los algoritmos de clasificación: bosques aleatorios, máquina de soporte vectorial, regresión logística, redes neuronales artificiales, árbol de decisión para clasificación y J48graft, combinados en un voto mayoritario simple y utilizando como variables independientes 3847 descriptores calculados mediante la herramienta “alvaDesc”. Los resultados del voto mayoritario fueron sustancialmente mejores que los de los modelos individuales, obteniéndose una capacidad predictiva mayor que 77%. Para la estimación del dominio de aplicación se utilizaron dos métodos: (i) basado en el propio algoritmo bosques aleatorios y (ii) basado en el leverage. La extracción de las variables de ambos modelos permitió establecer relaciones entre los descriptores moleculares y la biodisponibilidad oral
Accurate determination of oral bioavailability is paramount during drug discovery and development. The complexity and variability of oral bioavailability make the accuracy prediction a challenge. Quantitative structure-property relationship approaches are promising alternative to the early oral bioavailability prediction, nevertheless the majority of available in silico models had been developed on small databases with questionable quality and structural diversity; using individual statistics techniques and machine learning algorithms and without automatic scope; that limits its use by any user. The present work develop a continuous modelling workflow for human oral bioavailability prediction, using KNIME 3.7.1, based on 1063 structurally diverse drug and drug-like molecules. The algorithms random forest, support vector machine, logistic regression, artificial neural networks, decision tree and J48graft were combined in a global vote and using 3847 molecular descriptors from “alvaDesc” as independents variables. Global vote performance was better than individual models, getting predictive ability above 77%. For estimating applicability domain two methods were used: (i) based on random forest algorithm and (ii) leverage approach. The extraction of variables from both models allowed establishing relations between the molecular descriptors implicated and oral bioavailability

Descripción

Palabras clave

Industria Farmacéutica, Diseño de Fármacos, Sistema de Modelación QSPR, Modelación

Citación