Cabrera Pérez, Miguel ÁngelFalcón Cano, Gabriela2019-10-222019-10-222019https://dspace.uclv.edu.cu/handle/123456789/11736La determinación exacta de la biodisponibilidad oral es primordial durante el descubrimiento y desarrollo de fármacos. La complejidad y variabilidad de esta propiedad hacen de su predicción una tarea difícil. Los modelos de Relación Cuantitativa Estructura-Propiedad constituyen una estrategia prometedora para la predicción de la biodisponibilidad oral, sin embargo, la mayoría los modelos disponibles han sido desarrollados sobre pequeñas bases de datos públicas con calidad y diversidad estructural cuestionables, utilizando técnicas estadísticas aplicadas de forma individual y sin una proyección a la automatización del proceso de modelación, lo que limita su utilización por cualquier tipo de usuario. En el presente trabajo se desarrolló un flujo continuo de modelación, utilizando KNIME 3.7.1, para la predicción de la biodisponibilidad oral humana, a partir de una base de datos de 1063 fármacos y moléculas afines, utilizándose los algoritmos de clasificación: bosques aleatorios, máquina de soporte vectorial, regresión logística, redes neuronales artificiales, árbol de decisión para clasificación y J48graft, combinados en un voto mayoritario simple y utilizando como variables independientes 3847 descriptores calculados mediante la herramienta “alvaDesc”. Los resultados del voto mayoritario fueron sustancialmente mejores que los de los modelos individuales, obteniéndose una capacidad predictiva mayor que 77%. Para la estimación del dominio de aplicación se utilizaron dos métodos: (i) basado en el propio algoritmo bosques aleatorios y (ii) basado en el leverage. La extracción de las variables de ambos modelos permitió establecer relaciones entre los descriptores moleculares y la biodisponibilidad oralAccurate determination of oral bioavailability is paramount during drug discovery and development. The complexity and variability of oral bioavailability make the accuracy prediction a challenge. Quantitative structure-property relationship approaches are promising alternative to the early oral bioavailability prediction, nevertheless the majority of available in silico models had been developed on small databases with questionable quality and structural diversity; using individual statistics techniques and machine learning algorithms and without automatic scope; that limits its use by any user. The present work develop a continuous modelling workflow for human oral bioavailability prediction, using KNIME 3.7.1, based on 1063 structurally diverse drug and drug-like molecules. The algorithms random forest, support vector machine, logistic regression, artificial neural networks, decision tree and J48graft were combined in a global vote and using 3847 molecular descriptors from “alvaDesc” as independents variables. Global vote performance was better than individual models, getting predictive ability above 77%. For estimating applicability domain two methods were used: (i) based on random forest algorithm and (ii) leverage approach. The extraction of variables from both models allowed establishing relations between the molecular descriptors implicated and oral bioavailabilityesEste documento es Propiedad Patrimonial de la Universidad Central “Marta Abreu” de Las Villas. Los usuarios podrán hacer uso de esta obra bajo la siguiente licencia: Creative Commons: Atribución-No Comercial-Compartir Igual 4.0 LicenseIndustria FarmacéuticaDiseño de FármacosSistema de Modelación QSPRModelaciónDiseño y aplicación de un flujo de modelación QSPR para la predicción de la biodisponibilidad oral de fármacos y moléculas afines en humanosDesign and application of a QSPR modelling workflow for prediction of human oral bioavailability of drugs and drug-likeThesis