Estimación semiparamétrica en el análisis de encuestas complejas
Abstract
En la primera parte de este trabajo se muestra que no hay p érdida significativa en la
precisi ón del estimador del total poblacional si calculamos el par ámetro de suavizamiento
del modelo de splines penalizados con informaci ón de la muestra en vez de utilizar toda
la informaci ón de la poblacióon. El par ámetro de suavizamiento es obtenido fijando los
grados de libertad y resolviendo una ecuaci ón basada únicamente en datos de la muestra. Se discuten los resultados de un estudio de simulación de la determinación del parámetro de suavizamiento. Además, se evaluó el efecto de la propuesta de determinaci ón del parámetro de suavizamiento en la estimación del total poblacional usando una poblaci ón real. Para esta poblaci ón, los experimentos de simulación muestran que la determinaci ón del parámetro de suavizamiento, ya sea con datos de la muestra o con los datos de toda la población, produce errores relativos similares en la estimaci ón del total poblacional. En la segunda parte, se presenta y desarrolla un método semiparam étrico de estimaci ón del total poblacional para mejorar la precisión de los estimadores mediante la incorporación de información auxiliar multivariada. El modelo de superpoblaci ón utilizado es un modelo de coeficientes variantes, que ha demostrado ser una herramienta semiparam étrica simple y eficiente en la regresi ón multivariada. En condiciones de diseño estándar, los estimadores propuestos son asintóticamente insesgados, consistente y asint óticamente normales. Para ilustrar el modelo y la metodolog ía de estimaci ón propuesta, se estudian dos poblaciones, una poblaci ón real y otra simulada, que han proporcionado fuerte evidencia que corrobora la teorí a asintótica. _______________ SEMIPARAMETRIC ESTIMATION IN COMPLEX SURVEY ANALYSIS. ABSTRACT: In the first part of this work, the aim is to show that there is no significant loss in accuracy of the estimator of the population total if we calculate the smoothing parameter of penalized spline model with sample information rather than using all the population information. The smoothing parameter is obtained by fixing the degrees of freedom and solving an equation based only on sample data. Results of a simulation study of the determination of smoothing parameter are presented. In addition, the effect of the proposed determination of smoothing parameter on the estimation of the population total is evaluated using a real population. For this population, simulation experiments show
that determining the smoothing parameter with either sample data or with data from
the entire population, produces similar relative errors on the estimate of the population
total. In the second part, a model-assisted semiparametric method of estimating
finite-population totals is investigated to improve the precision of survey estimators by
incorporating multivariate auxiliary information. The proposed superpopulation model
is a varying-coe fficient model which has proven to be a simple and effi cient semiparametric tool in multivariate regression. Under standard design conditions, the proposed estimators are asymptotically design-unbiased, consistent and asymptotically normal. Both simulated and real data examples are given to illustrate the model and the proposed estimation methodology, which have provided strong evidence that corroborates
with the asymptotic theory.
Collections
- Tesis MC, MT, MP y DC [102]