Author: CARLOS LUIS ACUÑA MATAMOROS

Evaluación in silico de métodos analíticos para selección de subconjuntos núcleo en una colección de trigos criollos Mexicanos

CARLOS LUIS ACUÑA MATAMOROS (2018)

"La selección de subconjuntos núcleo de las colecciones alojadas en los bancos de semillas, crece en importancia a medida que el número de accesiones y la información de marcadores genéticos aumentan rápidamente. Un conjunto de datos de 20,526 marcadores de polimorfismos de un solo nucleótido (SNP) que caracterizan 7986 variedades criollas de trigo mexicano, se utilizaron para probar 11 métodos para la selección de subconjunto núcleo, a través de criterios de optimización que contienen el promedio de distancia genética y diversidad genética. La riqueza alélica se utilizó como criterio adicional para calificar los subconjuntos núcleo generados. Tres repeticiones con muestras aleatorias de 1500 loci de SNP, cada uno comprendiendo un máximo de 3000 alelos, fueron usados para la evaluación del método a través de cuatro diferentes funciones objetivo. La búsqueda voraz LR (LR) y LR con el primer par aleatorio (LRSemi) fueron consistentemente mejores en todos los ensayos para maximizar las funciones objetivas, y funcionaron bien incluso para los criterios no incluidos en esas funciones. La comparación múltiple Tukey HSD (diferencia significativa honesta) agrupó dichos métodos junto con la selección secuencial progresiva (SFS) y con SFS de primer par aleatorio (SFSSemi) como estrategias en la parte superior de los enfoques. Todos ellos son algoritmos simples de maximización heurística y superaron dos enfoques de optimización más sofisticados: el intercambio paralelo de réplicas mixtas y el intercambio de réplicas de Monte Carlo. Por su eficiencia para optimizar las funciones objetivo y la velocidad de computo, los métodos LRsemi y SFSSSemi demostraron ser buenas alternativas para la selección de subconjuntos núcleo de grandes colecciones de accesiones altamente homocigóticas caracterizadas por muchos marcadores bialélicos"

"Core subset selection from collections hosted by seed banks, grow in importance as the number of accessions and genetic marker information rapidly increases. A data set of 20,526 SNP markers characterizing 7,986 Mexican creole wheat landraces, was used to test 11 methods for core subset selection, through optimization criteria containing average genetic distance and genetic diversity. Allele richness was used as an additional criterion to qualify the generated core subsets. Three replications with random samples of 1,500 SNP loci, comprising 3,000 alleles, were used to perform the method evaluations through four different objective functions. The LR greed search and LR with random first pair (LRSemi) were consistently best across all assays for maximizing the objective functions, and they performed well even for criteria not included in those functions. The Tukey HSD multiple comparisons grouped those methods together with the sequential forward selection (SFS) and sequential forward selection with random first pair (SFSSemi) strategies as the top set of approaches. All of them are simple heuristic maximization algorithms, and outperformed two more sophisticated optimization approaches: parallel mixed replica exchange (MixRep) and replica exchange Monte Carlo (REMC). For their efficiency to optimize the objective functions and computing speed, the LRSemi and SFSSemi methods demonstrated to be good alternatives for core subset selection from large collections of highly homozygous accessions characterized by many biallelic markers"

Master thesis

Trigo Cultivo Criollo CIENCIAS AGROPECUARIAS Y BIOTECNOLOGÍA