Reducción de la dimensión no lineal en datos de microarreglos de ADN para el cáncer

Fecha

2018-06-28

Autores

Pérez Carballo, Lorenzo Antonio

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Central “Marta Abreu” de Las Villas

Resumen

En la presente investigación, se desea reducir la dimensión de los datos de microarreglos de ADN para el cáncer mediante métodos de extracción de características no lineales, para obtener un procedimiento que permita distinguir entre muestras cancerígenas y no cancerígenas. Para lograr esto se estudian las potencialidades de los métodos de reducción de la dimensión siguientes: “Métodos de selección de características”, “Análisis de componentes principales kernel” y “Descomposición matricial CUR”. Luego, dichos métodos se utilizan en las metodologías propuestas “reducción de dimensión no lineal”, “doble reducción de dimensión no lineal” y “doble reducción de dimensión no lineal en forma distribuida” de forma conjunta, para obtener un modelo de clasificación. En la etapa final del trabajo, se utilizan las metodologías propuestas sobre seis bases de datos para luego hacer una discusión de los resultados a partir de la complejidad de los datos y análisis horizontales. De una manera breve decir que esta investigación es parcial ya que debido al gran campo de estudio del tema tratado se realizarán próximamente otras búsquedas de solución para distinguir entre muestras cancerígenas y no cancerígenas.
In the present investigation, it is desired to reduce the size of DNA microarray data for cancer by nonlinear extraction methods, to obtain a procedure that allows to distinguish between carcinogenic and non-carcinogenic samples. To achieve this, the potentials of the following dimension reduction methods are studied: "Feature selection methods", "Principal component analysis kernel" and "Matrix decomposition CUR". Then, these methods are used in the proposed methodologies "reduction of non-linear dimension", "double reduction of non-linear dimension" and "double reduction of non-linear dimension in distributed form" jointly, to obtain a classification model. In the final stage of the work, the proposed methodologies are used on six databases to then make a discussion of the results based on the complexity of the data and horizontal analysis. In a brief way to say that this research is partial because due to the large field of study of the subject treated other solutions will soon be conducted to distinguish between carcinogenic and non-carcinogenic samples.

Descripción

Palabras clave

Reducción, Dimensión no Lineal, Datos de Microarreglos de ADN, Cáncer

Citación