Evaluación de modelos empíricos, matemáticos y redes neuronales para estimar datos faltantes en estaciones meteorológicas en México
Abstract
Los datos faltantes son un problema recurrente en diferentes áreas de la investigación. La Meteorología no es la excepción y demanda que las bases se rellenen con datos generados por alguna metodología que proporcione una estimación aceptable. En el presente trabajo se propuso la evaluación de modelos empíricos (U.S. Weather Service y el de razones de distancia), la Transformada de Wavelet y las Redes Neuronales Artificiales, con el fin de determinar las metodologías más apropiadas para la estimación de datos faltantes en estaciones meteorológicas de México. Estos modelos fueron analizados en tres regiones climáticas, a saber: clima Cálido Sub-húmedo, Templado Sub-húmedo y Muy Seco Semi-cálido, que corresponden a una superficie aproximada del 50% del territorio nacional; de igual manera se estudiaron tres variables climáticas: temperatura promedio, evaporación y precipitación a nivel mensual. Se seleccionaron 42 estaciones bases (en las tres regiones climáticas) y se procedió a eliminar un 15% y 25% de los datos de cada estación, los cuales se simularon y los resultados se compararon con los valores observados. Para la evaluación estadística se utilizaron los siguientes parámetros e índices: cuadrado medio del error, raíz cuadrada del cuadrado medio del error, índice de Wilmott, diferencia relativa, error de estimación y error absoluto medio, además se realizó un análisis de regresión lineal simple con el fin de determinar el mejor modelo de estimación para datos faltantes. Los mejores modelos de estimación obtenidos para las 42 estaciones meteorológicas fueron en primer lugar la Transformada de Wavelet, como segundo el U.S. Weather Service con cinco estaciones cercanas y como tercero las Redes Neuronales Artificiales. _______________ EVALUATION OF EMPIRICAL MODELS, MATHEMATICS AND NEURAL NETWORKS TO GENERATE MISSING DATA IN WEATHER STATIONS IN MEXICO. ABSTRACT: Missing data are a recurrent problem in different research areas. Meteorology is no exception and databases often need to be infilled with data generated by any method that provides an acceptable estimate. This paper evaluates empirical models (U.S. Weather Service and distance ratios), the Wavelet Transform and Artificial Neural Networks to determine the most appropriate methodologies for estimating missing data in weather stations in Mexico. These models were analyzed in three climate regions, namely Warm Sub-humid, Temperate Sub-humid and Semi-warm Very Dry climates, which together account for 50% of Mexico’s territory; similarly, three climate variables were studied: average monthly temperature, evaporation and precipitation. Forty-two base stations (in the three climate regions) were selected and then 15% and 25% of each station’s data were removed. After that, the missing data were simulated and the results compared with the observed values. For the statistical evaluation, parameters and indices were used are: mean squared error, root mean square error, Willmott’s index, difference relative, standard error of the estimate and mean absolute error. Also, a simple linear regression analysis was performed to determine the best model for estimating missing data. The best estimation models obtained for the 42 weather stations were, in descending order, the Wavelet Transform, the U.S. Weather Service with five nearby stations and lastly the Artificial Neural Networks.
Collections
- Tesis MC, MT, MP y DC [273]