Título

Introducing biological information in the superparamagnetic clustering algorithm of gene expression data

Autor

MARIA DEL PILAR MONSIVAIS ALONSO

Colaborador

LINA RAQUEL RIEGO RUIZ (Director)

HARET CODRATIAN ROSU (Director)

ROMAN LOPEZ SANDOVAL (Director)

Nivel de Acceso

Acceso Abierto

Resumen o descripción

"Los microarreglos proporcionan informaciòn de la actividad a nivel transcripcional de los genes de un organismo, bajo distintas circunstancias. Esto puede llevar al descubrimiento de genes clave en procesos celulares, clasificación molecular de enfermedades o identificar funciones para los genes, entre otras cosas. En el proceso de obtención de esta información, los algoritmos de clustering son una pieza importante al ayudar en la clasificación de los datos provenientes de microarreglos. En este trabajo modificamos el algoritmo de Clustering Superparamagnético añadiendo un peso extra en la fórmula de interacción que aprovecha la información que se tiene sobre los genes regulados por un mismo factor de transcripción. Con este algoritmo modificado, que nombramos SPCTF, analizamos los datos de microarreglos de Spellman et al. para ciclo celular en levadura (Saccharomyces cerevisiae) y encontramos clusters con un número mayor de integrantes, comparando con el algoritmo original SPC. Algunos de los genes que pudimos incorporar no fueron detectados por Spellman et al. en un principio, pero fueron identificados por otros estudios posteriormente. Otros de los genes que fueron incorporados aún no han sido clasificados, por lo que analizamos los clusters compuestos en su mayoría por estos genes sin identificar con el algoritmo MUSA y esto nos permitió seleccionar aquellos cuyos genes contienen sitios de unión a factores de transcripción correspondientes a ciclo celular. Estos clusters pueden ser estudiados ahora de manera experimental para descubrir nuevos genes involucrados en el ciclo celular. La idea de introducir la información biológica ya disponible para optimizar la clasificación de genes puede ser implementada para otros algoritmos de clustering."

"Microarray technology allow researchers to examine the transcriptional activity of thousands of genes under different conditions. Microarrays have been used, for example, to discover key genes involved in cellular processes, disease classification, drug development and gene function annotation. Clustering algorithms have become an important step in the microarray data analysis in order to discover biologically relevant information. We modify the superparamagnetic clustering algorithm (SPC) by adding an extra weight to the interaction formula that considers which genes are regulated by the same transcription factor. This combined similarity measure for two genes relies on two types of information: their expression profiles generated by a microarray, and the number of shared transcription factors that have been proved (experimentally) to bind to their promoters. With this modified algorithm which we call SPCTF, we analyze the Spellman et al. microarray data for cell cycle genes in yeast (Saccharomyces cerevisiae), and find clusters with a higher number of elements compared with those obtained with the SPC algorithm. Some of the incorporated genes by using SPCFT were not detected at first by Spellman et al. but were later identified by other studies, whereas several genes still remain unclassified. The clusters composed by unidentified genes were analyzed with MUSA, the motif finding using an unsupervised approach algorithm, and this allow us to select the clusters whose elements contain cell cycle transcription factor binding sites as clusters worthy of further experimental studies because they would probably lead to new cell cycle genes. Our idea of introducing the available information about transcription factors to optimize the gene classification could be implemented for other distance-based clustering algorithms."

Fecha de publicación

enero de 2012

Tipo de publicación

Tesis de doctorado

Formato

application/pdf

Idioma

Inglés

Audiencia

Público en general

Repositorio Orígen

Repositorio IPICYT

Descargas

369

Comentarios



Necesitas iniciar sesión o registrarte para comentar.