Herramientas de tendencia y validación para el agrupamiento. Índice de Dunn para aplicaciones Quimioinformáticas
Cargando...
Archivos
Fecha
Autores
Rodríguez Martín, Itnamy
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Central “Marta Abreu” de Las Villas
Resumen
Esta tesis aborda el tema del análisis de grupos (clústeres); específicamente lo relacionado con las técnicas de validación y tendencia al agrupamiento. En el informe se hace un análisis exhaustivo de las pruebas que se han propuesto en la literatura para el estudio de la tendencia, haciendo énfasis en los conceptos y los algoritmos más relevantes. Posteriormente, en el trabajo se introduce el Índice de Dunn como una medida novedosa de la clusterabilidad en el área Quimioinformática. También se presenta el software TODAEX 1.0, su diseño y generalidades, que aporta varias herramientas para el manejo de datos químio-/bio- informáticos a esta área. Como aplicación práctica de las nuevas herramientas teórico-computacionales se realiza un estudio de ocho conjuntos de datos farmacológicos de interés internacional, mostrando que los mismos presentan una débil predisposición a formar clústeres.
This thesis deals with the subject of group (clusters) analysis; specifically, it treats with the validation and cluster tendency techniques. In the document an exhaustive analysis is done on the reported tests for tendency, doing emphasis on their concepts and most relevant algorithms. Later, the Dunn index is introduced as a novel measure of clusterability in Cheminformatics. Also, we introduce the software TODAEX 1.0, its design, and generalities, which contribute various tools for handling chem.-/bio- informatics datasets to this area. As a practical application of the new theoretical-computational tools, a study is carried out on eight pharmacological datasets of international interest. Results show these repositories have a weak predisposition to form clusters.
This thesis deals with the subject of group (clusters) analysis; specifically, it treats with the validation and cluster tendency techniques. In the document an exhaustive analysis is done on the reported tests for tendency, doing emphasis on their concepts and most relevant algorithms. Later, the Dunn index is introduced as a novel measure of clusterability in Cheminformatics. Also, we introduce the software TODAEX 1.0, its design, and generalities, which contribute various tools for handling chem.-/bio- informatics datasets to this area. As a practical application of the new theoretical-computational tools, a study is carried out on eight pharmacological datasets of international interest. Results show these repositories have a weak predisposition to form clusters.