Descripción de dos métodos de rellenado de datos ausentes en series de tiempo meteorológicas

Se presentan dos metodolog´?as para el rellenado de datos ausentes, enfocadas haciasu uso en series de tiempo geof´?sicas. La primera se basa en la descomposici´on encomponentes principales de la matriz de correlaci´on de datos de una misma variableentre estaciones cercanas y en periodos de tiempo c...

Descripción completa

Autores Principales: Alfaro Martínez, Eric J., Soley Alfaro, Francisco Javier
Formato: Artículo
Idioma: Español
Publicado: 2015
Acceso en línea: http://revistas.ucr.ac.cr/index.php/matematica/article/view/1419
http://hdl.handle.net/10669/12947
Sumario: Se presentan dos metodolog´?as para el rellenado de datos ausentes, enfocadas haciasu uso en series de tiempo geof´?sicas. La primera se basa en la descomposici´on encomponentes principales de la matriz de correlaci´on de datos de una misma variableentre estaciones cercanas y en periodos de tiempo comunes. Este m´etodo multivariablepermite incorporar en los valores rellenados los fen´omenos de mayor escala a partirde la informaci´on de las estaciones cercanas. El segundo m´etodo es para ser utilizadocuando no hay estaciones cercanas y el rellenado se debe hacer con la informaci´on dela misma estaci´on. Consiste en ajustar un modelo autoregresivo a la serie de tiempo yutilizar ese modelo como estimador de los datos ausentes. Se evaluaron dos algoritmospara calcular los coeficientes autoregresivos: el estimador de Burg y el propuesto porUlrych y Clayton. El primero es apropiado para procesos estoc´asticos y el segundo paraseries determin´?sticas. Las dos metodolog´?as descritos en este trabajo son recursivas:se hace una primera estimaci´on a los datos ausentes corriendo el algoritmo ignorandolos datos ausentes si es posible ´o aproxim´andolos de forma grosera. El algoritmo secontin´ua ejecutando con los nuevos valores sustituyendo los valores estimados en lacorrida anterior. La ejecuci´on termina cuando la diferencia m´axima de los valoresestimados entre dos corridas sucesivas es menor que un valor fijado de antemano porel usuario. Los datos rellenados conservan la media y la desviaci´on est´andar originalde la serie de tiempo. Estos algoritmos se adaptaron y modificaron, por medio del usode Interfaces Gr´aficas con el usuario, para su uso en SCILAB, que es una plataforma similar a MATLAB pero de fuente abierta y que corre indistintamente en Windows yLinux. Ellos fueron elaborados como una actividad de extensi´on de la Universidad deCosta Rica.Palabras clave: datos faltantes, control de calidad, filtros auto regresivos, an´alisis decomponentes principales, aplicaciones de software libre.