Mocelos de selección genómica para predicción de caracteres complejos en híbridos de maíz.
Abstract
La predicción del rendimiento híbrido es muy importante en los programas de mejoramiento agrícola. En el fitomejoramiento, los ensayos multi-ambientales desempeñan un papel importante en la selección de rasgos importantes, tales como estabilidad a través de ambientes, rendimiento de grano y resistencia a plagas. Las condiciones ambientales modulan la expresión génica causando interacción genotipo×ambiente (G×A), de tal manera que las correlaciones genéticas estimadas del rendimiento de líneas individuales a través de ambientes resumen la acción conjunta de los genes y las condiciones ambientales. Este trabajo propone un modelo estadístico genético que incorpora G×A junto con la aptitud combinatoria general y específica para predecir el rendimiento de híbridos en ambientes. El modelo propuesto también se puede aplicar a cualquier otra especie híbrida con diferentes grupos parentales. En este estudio se evaluó el poder predictivo de dos modelos de predicción de rendimiento de híbridos utilizando la técnica de validación cruzada aplicada en datos híbridos de maíz, que comprenden 2,724 híbridos derivados de 507 líneas Dent y 24 líneas Flint, que fueron evaluadas para tres rasgos en 58 ambientes durante 12 años; los análisis se realizaron para cada año. En promedio, los modelos genómicos que incluyen la interacción de la aptitud combinatoria general y específica con los ambientes tienen mayor poder predictivo que los modelos genómicos sin interacción con ambientes (van del 12 al 22\%, dependiendo del rasgo). Se concluye que la inclusión de G×A en la predicción de rendimiento de híbridos de maíz no probados aumenta la precisión de los modelos genómicos. Por otra parte, se sabe que la selección genómica se ha convertido en una herramienta muy conocida para la selección de candidatos en programas de fitomejoramiento de plantas y animales. En el caso de rasgos cuantitativos, es usual suponer que la distribución de la variable respuesta se puede aproximar con una distribución normal. Sin embargo, es bien sabido que el proceso de selección conduce a distribuciones que son asimétricas. Existe una amplia literatura estadística sobre distribuciones asimétricas; una distribución particularmente interesante es la normal asimétrica, que incluye un parámetro de forma que le permite adoptar formas asimétricas. Por lo tanto, la distribución normal asimétrica puede considerarse una generalización de la distribución normal. Se propone el uso de la distribución normal asimétrica en el contexto de regresión con aplicaciones en Selección Genómica, donde por lo general el número de predictores excede ampliamente el tamaño de la muestra. Con el fin de hacer los cálculos factibles, se utilizó una representación estocástica de una variable aleatoria normal asimétrica que permite el uso de técnicas de cadenas de Markov Monte Carlo (MCMC) para ajustar el modelo propuesto. Se evaluó el poder predictivo y la bondad de ajuste del modelo y se comparó con el modelo de regresión Ridge Bayesiano utilizando simulaciones de datos. También se evaluó el poder predictivo del modelo propuesto utilizando un conjunto de datos reales de maíz. Los resultados muestran que la bondad de ajuste (utilizando el criterio de información de la devianza y el número efectivo de parámetros) favoreció el modelo propuesto; sin embargo, el poder predictivo evaluado a través de la validación cruzada entre la regresión Ridge Bayesiana y el modelo propuesto fue aproximadamente el mismo. _______________ GENOMIC SELECTION MODELS FOR PREDICTION OF COMPLEX TRAITS IN MAIZE HYBRIDS. ABSTRACT: The prediction of hybrid performance (HP) is very important in agricultural breeding programs. In plant breeding, multi-environment trials play an important role in the selection of important traits, such as stability across environments, grain yield and pest resistence. Environmental conditions modulate gene expression causing genotype×environment interaction (G×E), such that the estimated genetic correlations of the performance of individual line across environments summarize the joint action of genes and environmental conditions. This work proposes a genomical statistical model that incorporates G×E for general and specific combining ability for predicting the performance of hybrids in environments. The proposed model can also be applied to any other hybrid species with distinct parental pools. In this study, we evaluated the predictive ability of two HP prediction models using a cross-validation approach applied in extensive maize hybrid data, comprising 2724 hybrids derived from 507 dent lines and 24 flint lines, which were evaluated for three traits in 58 environments over 12 years; analyses were performed for each year. On average, genomic models that include the environments have greater predictive ability than genomic models without interaction with environments (ranging from 12 to 22\%, depending on the trait). We concluded that including G×E in the prediction of untested maize hybrids increases the accuracy of genomic models.
Genomic selection (GS) has become as a very well-known tool for selecting candidates in plant and animal breeding programs. In the case of quantitative traits, it is usual to assume that the distribution of the response variable can be approximated with a normal distribution. However, it is well known that the selection process leads to distributions that are skewed. There is vast statistical literature on skewed distributions; a particularly interesting distribution is the skew normal, which includes a shape parameter that allows it to adopt skewed forms. Therefore, the skew normal distribution can be considered a generalization of normal distribution. Here we propose using the skew normal distribution in the regression context with GS application where usually the number of predictors vastly exceeds the sample size. In order to make the computations feasible, we used a stochastic representation of a skew normal random variable which allows using standard Markov Chain Monte Carlo (MCMC) techniques to fit the proposed model. We evaluated the predictive power and goodness of fit of the proposed model and compared it to the Bayesian Ridge Regression model using simulated datasets. We also evaluated the predictive power of the proposed model using a real maize dataset. Results show that the goodness of fit (deviance information criterion and effective number of parameters) favored the proposed model; nevertheless, the predictive power evaluated through cross-validation of the Bayesian Ridge Regression and the proposed model was about the same.
Collections
- Tesis MC, MT, MP y DC [102]