Inferencia sobre datos no detectados de poblaciones lognormales
Abstract
Frecuentemente, la descripción y comparación de poblaciones con concentraciones de contaminantes se realiza empleando métodos no paramétricos. En la práctica, si las muestras contienen datos no detectados, éstos se omiten o sustituyen por una fracción del límite de detección (LD). Respecto a datos ambientales que contienen datos no detectados, los organismos de regulación ambiental requieren que los riesgos sean caracterizados en términos de la concentración media del contaminante. Este trabajo aborda el problema de descripción, inferencia y comparación de concentraciones medias de poblaciones lognormales mediante una prueba estadística basada en modelos de regresión lineal con variables indicadoras, empleando un enfoque paramétrico. El algoritmo Expectation-Maximization (EM), la verosimilitud y el método
de Wald son empleados para el manejo de datos no detectados, la estimación y la obtención de regiones de confianza. También se presenta el enfoque con modelos mixtos para comparar medias poblacionales con covariables aleatorias. Se realizó un estudio de simulación para conocer la potencia de la prueba paramétrica propuesta al comparar muestras lognormales y no lognormales, confrontándola además, con la prueba no paramétrica logrank. El método resultó simple y versátil para dos poblaciones y puede extenderse a tres o más, ya que su implementación e interpretación no es difícil. La potencia de la prueba propuesta fue mejor que la prueba logrank al comparar muestras lognormales y mostró un despeño aceptable para muestras exponenciales y de Gumbel. ________Frequently, the summarization and comparison of populations with pollutant concentrations is done using non-parametric methods. In practice, if the samples contain nondetects data, these are omitted or substituted for a fraction of the detection limit. With regard to environmental data which contain nondetects, environmental regulation organisms require that risks be characterized in terms of the pollutant mean concentration. From a parametric approach, this study takes on the problem of summarization, inference, and comparison of mean concentrations of lognormal populations using a linear regression model with indicator variables. The EM algorithm, total likelihood, and Wald’s method are used to handle nondetects data, estimation, and
detection of confidence regions. We also show an approach with mixed-effects models to compare population means with random covariables. A simulation study is done to know the power of the proposed parametric test when comparing lognormal and non-
lognormal samples, besides it is also compared with logrank non-parametric test. The method proved to be simple and adaptable for two populations and can be extended to three or more, since its implementation and interpretation are not difficult. The power of the proposed test was better than the logrank test when comparing lognormal samples, and showed an acceptable performance for exponential and Gumbel samples.
Collections
- Tesis MC, MT, MP y DC [102]