142
UNIVERSIDAD DE COSTA RICA FACULTAD DE CIENCIAS ESCUELA DE MATEMÁTICA Tesis para optar al grado académico de Licenciatura en Ciencias Actuariales APLICACIÓN DE SERIES DE TIEMPO EN LA EVALUACIÓN DE REGÍMENES DE PENSIONES José Fabio Santamaría Chaves Ciudad Universitaria Rodrigo Facio San José, Costa Rica Diciembre de 2015

UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

UNIVERSIDAD DE COSTA RICAFACULTAD DE CIENCIAS

ESCUELA DE MATEMÁTICA

Tesis para optar al grado académico de Licenciatura en CienciasActuariales

APLICACIÓN DE SERIES DE TIEMPO EN LAEVALUACIÓN DE REGÍMENES DE PENSIONES

José Fabio Santamaría Chaves

Ciudad Universitaria Rodrigo FacioSan José, Costa Rica

Diciembre de 2015

Page 2: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:
Page 3: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Tesis presentada el día 15 de diciembre de 2015 en la Escuela de Matemática de la Uni-versidad de Costa Rica para optar por el grado de Licenciatura en Ciencias Actuariales,ante el siguiente tribunal:

Dr. Óscar Roldán SantamaríaPresidente del Tribunal

Dr. Luis Barboza ChinchillaDirector de Tesis

Dr. Juan José Víquez RodríguezLector

Dr. Santiago Cambronero VillalobosLector

Dr. Maikol Solís ChacónLector Externo

José Fabio Santamaría ChavesCandidato

iii

Page 4: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

iv

Page 5: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Agradecimientos

A mi director de tesis, Luis Barboza Chinchilla, ya que su guía posibilitó la realizaciónde este trabajo.

A los lectores Juan José Víquez Rodríguez y Santiago Cambronero Villalobos por susvaliosas observaciones.

A los funcionarios del Banco Nacional de Costa Rica que aportaron los datos necesariospara llevar a cabo el presente trabajo, así como por facilitar el equipo y los programasutilizados.

v

Page 6: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Ficha Bibliográfica

Santamaría Chaves, José Fabio. Aplicación de Series de Tiempo enla Evaluación de Regímenes de Pensiones. Tesis para optar por el

grado de Licenciatura en Ciencias Actuariales. Universidad de CostaRica. San José, Costa Rica. 2015. Págs xvi y 126.

Director: PhD. Luis Barboza Chinchilla

Palabras claves: series de tiempo univariadas, series de tiempomultivariadas, evaluación actuarial, régimen de pensiones, ajuste de

distribuciones.

Page 7: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Índice general

Agradecimientos v

Índice general ix

Índice de figuras xii

Índice de cuadros xiv

Resumen xv

1. Introducción 11.1. Justificación del tema . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2. Planteamiento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.3. Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31.4. Descripción del trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2. Marco Teórico 92.1. Series de tiempo univariadas . . . . . . . . . . . . . . . . . . . . . . . . 9

2.1.1. Conceptos preliminares . . . . . . . . . . . . . . . . . . . . . . . 92.1.2. Modelos ARIMA . . . . . . . . . . . . . . . . . . . . . . . . . . 11

Modelos no estacionarios . . . . . . . . . . . . . . . . . . . . . . 15Estimación de parámetros . . . . . . . . . . . . . . . . . . . . . 17

2.1.3. Especificación del modelo . . . . . . . . . . . . . . . . . . . . . 18Criterios de información . . . . . . . . . . . . . . . . . . . . . . 19Prueba de cociente de verosimilitud . . . . . . . . . . . . . . . . 20

vii

Page 8: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

viii Índice general

Análisis de residuos . . . . . . . . . . . . . . . . . . . . . . . . . 212.1.4. Estacionalidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 232.1.5. Datos atípicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

Aditivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24Innovacionales . . . . . . . . . . . . . . . . . . . . . . . . . . . 25Cambio de nivel . . . . . . . . . . . . . . . . . . . . . . . . . . 26Cambio temporal . . . . . . . . . . . . . . . . . . . . . . . . . . 26Identificación y estimación de datos atípicos . . . . . . . . . . . 27

2.1.6. Modelos de Heterocedasticidad . . . . . . . . . . . . . . . . . . 302.2. Modelos multivariados . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

2.2.1. Conceptos preliminares . . . . . . . . . . . . . . . . . . . . . . . 312.2.2. Modelos VARMA . . . . . . . . . . . . . . . . . . . . . . . . . . 34

Función de verosimilitud . . . . . . . . . . . . . . . . . . . . . . 352.2.3. Especificación del modelo . . . . . . . . . . . . . . . . . . . . . 36

Estimación preliminar de órdenes . . . . . . . . . . . . . . . . . 36Análisis de residuos . . . . . . . . . . . . . . . . . . . . . . . . . 39

2.2.4. Cointegración . . . . . . . . . . . . . . . . . . . . . . . . . . . . 422.2.5. Pruebas de heterocedasticidad . . . . . . . . . . . . . . . . . . . 43

2.3. Método de k-medias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452.4. Evaluaciones actuariales . . . . . . . . . . . . . . . . . . . . . . . . . . 47

2.4.1. Tasa de interés . . . . . . . . . . . . . . . . . . . . . . . . . . . 472.4.2. Valor presente actuarial . . . . . . . . . . . . . . . . . . . . . . 49

2.5. Ajuste de Distribuciones . . . . . . . . . . . . . . . . . . . . . . . . . . 51

3. Metodología 553.1. Obtención de datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553.2. Ajuste de series temporales . . . . . . . . . . . . . . . . . . . . . . . . 59

3.2.1. Series univariadas . . . . . . . . . . . . . . . . . . . . . . . . . . 593.2.2. Series multivariadas . . . . . . . . . . . . . . . . . . . . . . . . 61

3.3. Evaluación actuarial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 633.3.1. Perfil de beneficios y requisitos . . . . . . . . . . . . . . . . . . 63

Page 9: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Índice general ix

3.3.2. Insumos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653.3.3. Supuestos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 653.3.4. Cálculos realizados . . . . . . . . . . . . . . . . . . . . . . . . . 67

Beneficiarios actuales . . . . . . . . . . . . . . . . . . . . . . . . 68Miembros activos . . . . . . . . . . . . . . . . . . . . . . . . . . 69Balance Actuarial . . . . . . . . . . . . . . . . . . . . . . . . . . 70

3.4. Ajuste de distribución teórica . . . . . . . . . . . . . . . . . . . . . . . 71

4. Desarrollo 734.1. Rendimiento del Fondo . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

4.1.1. Especificación del modelo . . . . . . . . . . . . . . . . . . . . . 734.1.2. Ajuste del modelo . . . . . . . . . . . . . . . . . . . . . . . . . 794.1.3. Diagnóstico del modelo . . . . . . . . . . . . . . . . . . . . . . . 81

4.2. Inflación Mensual . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 864.2.1. Especificación del modelo . . . . . . . . . . . . . . . . . . . . . 864.2.2. Ajuste del modelo . . . . . . . . . . . . . . . . . . . . . . . . . 914.2.3. Diagnóstico del modelo . . . . . . . . . . . . . . . . . . . . . . . 92

4.3. Variaciones salariales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 974.3.1. Especificación del modelo . . . . . . . . . . . . . . . . . . . . . 974.3.2. Ajuste del modelo . . . . . . . . . . . . . . . . . . . . . . . . . 1034.3.3. Diagnóstico del modelo . . . . . . . . . . . . . . . . . . . . . . . 105

4.4. Evaluación Actuarial . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

5. Conclusiones y Recomendaciones 119

Bibliografía 126

Page 10: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

x Índice general

Page 11: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Índice de figuras

1.1. Relación entre las principales variables del modelo de Wilkie . . . . . . 4

3.1. Valores mensuales de inflación desde Febrero de 1976 . . . . . . . . . . 57

4.1. Valores mensuales de rendimiento del Fondo . . . . . . . . . . . . . . . 744.2. Función de autocorrelación del rendimiento del Fondo . . . . . . . . . . 764.3. Función de autocorrelación parcial del rendimiento del Fondo . . . . . . 774.4. Función de autocorrelación extendida del rendimiento del Fondo . . . . 774.5. Resultado de la función armasubsets para el rendimiento del Fondo . . 784.6. Efecto de puntos atípicos en el rendimiento del Fondo . . . . . . . . . . 804.7. Diagnósticos de los residuos del modelo de rendimientos del Fondo . . . 824.8. Gráfico QQ de los residuos del modelo de rendimientos del Fondo . . . 834.9. Función de autocorrelación muestral de los residuos al cuadrado del mo-

delo de rendimientos del Fondo . . . . . . . . . . . . . . . . . . . . . . 844.10. Valores p de la prueba de McLeod-Li de los residuos del modelo de ren-

dimientos del Fondo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 854.11. Gráfico de los valores mensuales de inflación . . . . . . . . . . . . . . . 864.12. Función de autocorrelación de la inflación . . . . . . . . . . . . . . . . 884.13. Función de autocorrelación parcial de la inflación . . . . . . . . . . . . 894.14. Función de autocorrelación extendida de la inflación . . . . . . . . . . . 894.15. Resultado de la función armasubsets para la inflación . . . . . . . . . . 904.16. Diagnósticos de los residuos del modelo de inflación . . . . . . . . . . . 934.17. Gráfico QQ de los residuos del modelo de inflación . . . . . . . . . . . . 94

xi

Page 12: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

xii Índice de figuras

4.18. Función de autocorrelación muestral de los residuos al cuadrado del mo-delo de inflación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95

4.19. Valores p de la prueba de McLeod-Li de los residuos del modelo de inflación 964.20. Series de variaciones salariales para cada grupo de edad . . . . . . . . . 984.21. Valores p de la prueba Ljung-Box para seleccionar el orden VMA . . . 1024.22. Función de correlación cruzada extendida de las variaciones salariales . 1024.23. Valores p de la prueba Ljung-Box para los residuos del modelo de varia-

ciones salariales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1064.24. Histograma de tasas de rendimiento anual en los primeros 10 años de

simulaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1094.25. Histograma de tasas de inflación anual en los primeros 10 años de simu-

laciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1104.26. Función de distribución empírica del balance actuarial . . . . . . . . . 1114.27. Función de densidad empírica del balance actuarial . . . . . . . . . . . 1124.28. Función de densidad empírica del balance actuarial y la mezcla gaussiana

con k = 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1164.29. Gráfico QQ de los resultados del balance actuarial y la mezcla gaussiana

con k = 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

Page 13: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Índice de cuadros

2.1. Función de autocorrelación extendida para un modelo ARMA(1,1) . . . 15

2.2. Comportamiento de las matrices de correlación cruzada extendidas paraun modelo VARMA(2,1) . . . . . . . . . . . . . . . . . . . . . . . . . . 39

4.1. Pruebas de raíz unitaria para la serie de rendimientos del Fondo . . . . 75

4.2. Modelo seleccionado para la serie de rendimientos del Fondo . . . . . . 79

4.3. Pruebas de raíz unitaria para los residuos del modelo de rendimientosdel Fondo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

4.4. Pruebas de normalidad de los residuos del modelo de rendimientos delFondo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

4.5. Pruebas de raíz unitaria para la serie de inflación . . . . . . . . . . . . 87

4.6. Modelo seleccionado por los criterios AIC y AICc para la serie de inflación 91

4.7. Modelo seleccionado por el BIC para la serie de inflación . . . . . . . . 91

4.8. Pruebas de raíz unitaria de los residuos del modelo de inflación . . . . . 92

4.9. Pruebas de normalidad de los residuos del modelo de inflación . . . . . 92

4.10. Grupos generados por el algoritmo de k-medias . . . . . . . . . . . . . 97

4.11. Rezagos significativos de la función de correlación cruzada según proce-dimiento de Cryer y Chan . . . . . . . . . . . . . . . . . . . . . . . . . 99

4.12. Rezagos significativos de la función de correlación cruzada según proce-dimiento de Brockwell y Davis . . . . . . . . . . . . . . . . . . . . . . . 99

4.13. Pruebas de raíz unitaria para las series marginales de variaciones salariales100

4.14. Prueba de cointegración de Johansen para la serie de variaciones salariales100

xiii

Page 14: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

xiv Índice de cuadros

4.15. Estimación preliminar del orden para un modelo VAR(p) para la seriede variaciones salariales . . . . . . . . . . . . . . . . . . . . . . . . . . 101

4.16. Pruebas de raíz unitaria para los residuos marginales del modelo de va-riaciones salariales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

4.17. Prueba de cointegración de Johansen para los residuos del modelo devariaciones salariales . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

4.18. Pruebas de normalidad para los residuos del modelo de variaciones sala-riales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

4.19. Pruebas de heterocedasticidad para los residuos del modelo de variacio-nes salariales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

4.20. Escenarios de la función de distribución del balance actuarial . . . . . . 1134.21. Parámetros de la mezcla ajustada a la función de densidad empírica del

balance actuarial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1144.22. Pruebas de ajuste de la mezcla a la función de densidad empírica del

balance actuarial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

Page 15: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Resumen

El presente trabajo pretende estudiar las series temporales y su aplicación en la mode-lización de las variables económicas que se utilizan en las evaluaciones actuariales deun fondo de pensiones hipotético.

Las variables económicas con las que se trabaja son: el rendimiento del fondo de pen-siones, la inflación, y las variaciones salariales de los afiliados a éste. Para modelizarel rendimiento del fondo y la inflación se aplicaron modelos univariados tipo ARIMA,mientras que para las variaciones salariales hubo que considerar el efecto de la edad delafiliado, por lo que se ajustó un modelo multivariado tipo VARMA. Dado el rango deedades de los afiliados, se hizo necesario agrupar estas edades mediante un algoritmode k-medias que redujera el número de parámetros del modelo a estimar.

Una vez seleccionados los modelos que presentaron el mejor ajuste a los datos muestra-les, se procedió a realizar 10000 simulaciones de cada una de las series para un períodode 115 años, que corresponde al período de tiempo necesario para llevar a todas las vidasdel colectivo hasta el último año de vida en la tabla de mortalidad empleada. Con estos10000 escenarios, se realizó el mismo número de evaluaciones actuariales. Con los resul-tados del balance actuarial de estos escenarios, se construyó la distribución empírica dela variable y se seleccionaron los percentiles clave para definir los escenarios optimista,pesimista y esperado. Finalmente, se procedió a ajustar una distribución teórica a losresultados empíricos. Al revisar el gráfico de la función de densidad, se observó queesta presenta colas asimétricas, por lo que se decidió utilizar una mezcla gaussiana paraajustar las colas por separado.

xv

Page 16: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

xvi Resumen

Page 17: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 1

Introducción

1.1. Justificación del tema

La sostenibilidad financiera de un fondo de pensiones depende de múltiples factoreseconómicos: los aumentos salariales futuros de los afiliados al fondo, la inflación futura,los rendimientos de los instrumentos financieros en los que se invierten los activos querespaldan las provisiones, entre otros. A la hora de evaluar un fondo de pensiones, elactuario debe hacer supuestos acerca del comportamiento que tendrán a corto y largoplazo estas variables. Tradicionalmente, en las evaluaciones se utilizan variables deter-ministas, lo cual significa que estas se mantienen constantes durante todo el período enel que se realiza la proyección. Adicionalmente, es común asumir que esos valores cons-tantes de estas variables corresponden a sus respectivos valores en el año de evaluacióno el promedio de los valores en una cierta cantidad de años anteriores a la fecha devaloración. Si el actuario desea estudiar el impacto de posibles cambios en las condicio-nes económicas, conocido como análisis de sensibilidad, lo que suele hacer es repetir elcálculo con valores distintos de las variables pero también manteniéndolos constantesen el tiempo. Generalmente se trabaja un escenario optimista, donde los rendimientosde las inversiones del fondo son mayores al promedio observado y uno pesimista en elcual estos rendimientos son más bajos de lo observado.

El tipo de análisis descrito en el párrafo anterior únicamente provee un estimador pun-

1

Page 18: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

2 Capítulo 1

tual del resultado de la evaluación actuarial, así como del resultado pesimista y elresultado optimista. Esto impide contar con una distribución probabilística que permi-ta realizar un análisis más profundo de los resultados. Por ejemplo, se podría contar conlos cuantiles para definir los escenarios optimistas y pesimistas. Varios autores han pro-puesto metodologías que utilizan simulaciones a través de series de tiempo para predecirel comportamiento de estas variables (ver por ejemplo [32] y [33]). Adicionalmente, lasvariables correlacionadas se pueden modelar de manera conjunta mediante estos méto-dos estocásticos para reflejar esta correlación.

A partir de las ideas anteriores, se propone aplicar estos métodos a un régimen depensiones hipotético. Las variables que se modelizarán mediante series de tiempo sonlas siguientes:

La tasa mensual real de los rendimientos de las inversiones del fondo

La inflación mensual

Las variaciones salariales mensuales reales de los afiliados al fondo

Las características y beneficios que otorga el fondo están explicados en el Capítulo 3.

1.2. Planteamiento

El tema del presente trabajo corresponde a la aplicación de series de tiempo en la eva-luación actuarial de regímenes de pensiones. Los objetivos propuestos son los siguientes:

Objetivo General

Investigar, desarrollar y utilizar modelos de series de tiempo en la evaluaciónactuarial de un fondo de pensiones

Objetivos Específicos

Realizar una investigación bibliográfica acerca de la teoría de series de tiempo ysu aplicación.

Page 19: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 1 3

Determinar el modelo de serie de tiempo que mejor ajuste el comportamientode algunas variables económicas que influyen en la evaluación de un fondo depensiones hipotético.

Efectuar la evaluación actuarial de un fondo de pensiones hipotético utilizandoel enfoque estocástico, a partir de las series de tiempo que mejor representen elcomportamiento de las variables económicas.

1.3. Antecedentes

Uno de los modelos estocásticos para inversiones más famosos es el propuesto por A. D.Wilkie, el cual fue desarrollado para explicar el comportamiento de distintas variableseconómicas del Reino Unido. Este modelo se encuentra descrito en detalle en [33]. Wilkieaclara que escogió este modelo luego de evaluar múltiples alternativas y concluir queéste era el más apropiado. El principal supuesto utilizado por este autor es asumir quetodas las variables de inversión dependen del índice de precios al consumidor. En sumodelo, considera 4 variables principales, e indica que son las mínimas necesarias paradescribir las inversiones de un fondo de pensiones:

Índice de Precios al Consumidor

Índice de cotización en bolsa

Rentabilidad por cotización, es decir, el índice de cotización en la fecha t entre elíndice de precios en esa misma fecha

Tasa de interés a largo plazo, medida a través de bonos perpetuos del gobiernobritánico, denominados consols.

En la Figura 1.1 se muestran las interrelaciones entre las variables anteriores según lodeterminó Wilkie.Este modelo fue introducido en 1984. El artículo original no aplica el modelo a unproblema en particular, sino que se limita a señalar los diversos escenarios en los queeste tipo de modelos pueden ser utilizados. Desde la publicación del artículo, múltiples

Page 20: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

4 Capítulo 1

Figura 1.1: Relación entre las principales variables del modelo de Wilkie

trabajos se han realizado con el objetivo de mejorar y actualizar el modelo, así comoinvestigar sus aplicaciones. Por ejemplo, en [32] se propone la aplicación de modelos conumbrales o thresholds y se invierte la dependencia entre la tasa de interés a largo plazoy la rentabilidad por cotización.

En el contexto de evaluaciones actuariales de regímenes de pensiones, se encuentra unaaplicación en [34], donde se presenta la deducción y aplicación de un modelo estocásticosencillo para realizar la evaluación de un régimen de pensiones canadiense hipotético.El autor aboga por considerar modelos más simples que el propuesto por Wilkie ysus múltiples actualizaciones, ya que de acuerdo con él los modelos simples facilitanel entendimiento de la dinámica de las series económicas por parte de los actores querequieren tomar las decisiones con respecto a la administración de estos regímenes depensiones y los afectados por éstas. Así, en su estudio se limita a los siguientes tipos demodelos:

Ruido blanco

AR(1): modelo autorregresivo de orden 1

ARCH(1): modelo autorregresivo con heterocedasticidad condicional de orden 1

«Regime switching» con dos casos: Estos modelos consideran las variaciones en elcomportamiento de una serie de tiempo económica asociadas con ciertos eventos

Page 21: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 1 5

o cambios de estado aleatorios.

Función de transferencia

En los anexos de [34] se incluyen las características de cada uno de los modelos ante-riores. Básicamente, el autor se dedica a buscar cuál de estos modelos explica mejor elcomportamiento de las variables económicas consideradas, las cuales son las siguientes:

Inflación

Índice de salarios

Tasa de interés a largo plazo

Retorno de capital canadiense

Retorno de capital global

En el contexto costarricense, no se encontraron trabajos que utilizaran este tipo de me-todologías en evaluaciones actuariales, por lo que esta aplicación constituye un aporteoriginal de este trabajo.

1.4. Descripción del trabajo

El desarrollo de este trabajo inicia con la investigación bibliográfica sobre los modelosde series de tiempo, tanto univariados como multivariados. Se pretende conocer las ca-racterísticas de estos y los procedimientos más utilizados para su análisis, estimación ydiagnóstico. Luego, se pasa a la etapa de modelización, la cual consiste en identificarpara cada una de las variables estudiadas (rendimiento del fondo, inflación y variacio-nes salariales) el modelo de serie de tiempo que presente el mejor ajuste a los datoscorrespondientes. Para esto, se aplicará el método conocido como Box-Jenkins, el cuales descrito y recomendado por múltiples autores. Ver por ejemplo [6], [11] y [30]. Enresumen, este proceso consiste en proponer uno o varios modelos de serie de tiempoa través del estudio de los datos con los que se cuenta, estimar los parámetros de los

Page 22: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

6 Capítulo 1

modelos y finalmente aplicar pruebas estadísticas para comprobar que cumplan las hi-pótesis requeridas y así poder seleccionar el modelo que presente el mejor ajuste.

Las series de rendimiento del fondo e inflación son univariadas, mientras que la serie devariaciones salariales es multivariada, ya que depende de la edad del funcionario. Dadoque se cuenta con 31 valores posibles para la edad, se optó por agrupar las distintasedades mediante el método de k-medias. Lo anterior se realiza antes de ajustar el mo-delo VARMA para reducir la cantidad de parámetros que se deben estimar. El objetivodel algoritmo de k-medias es crear una partición del conjunto de edades de forma quelos grupos queden bien separados y diferenciados, es decir, que las variaciones salarialesde los individuos que pertenezcan a un mismo grupo de edades se parezcan más entresí que a las variaciones salariales de los individuos de los otros grupos de edades. Esteprocedimiento se encuentra descrito en [29].

Con los tres modelos seleccionados, el siguiente paso consiste en ejecutar 10000 simula-ciones de cada modelo. Los resultados de las simulaciones son el insumo para realizar10000 evaluaciones actuariales del fondo hipotético y así construir la función de distri-bución muestral del denominado resultado actuarial (déficit o supéravit). La teoría yfórmulas utilizadas en el cálculo del balance actuarial fueron tomadas de [5]. Finalmen-te, se identifica un modelo teórico que ajuste la distribución empírica obtenida. Dada laforma del histograma de la función de densidad muestral, se decide trabajar con mezclasgaussianas.

El presente documento contiene 4 capítulos adicionales: el capítulo 2 corresponde almarco teórico, en el cual se exponen los conceptos y resultados de la teoría de seriesde tiempo relevantes al presente trabajo, así como una idea general del procedimientocomúnmente utilizado para realizar evaluaciones actuariales. En el capítulo 3 se explicanlos pasos seguidos para ajustar los modelos de series de tiempo a los datos y los supuestose insumos utilizados para realizar la evaluación actuarial. En el capítulo 4 se muestranlos resultados del desarrollo del trabajo. Finalmente, en el capítulo 5 se presentan lasconclusiones y recomendaciones, así como las limitaciones que se tuvo. En ese mismo

Page 23: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 1 7

capítulo se mencionan las posibles extensiones del trabajo para investigaciones futuras.

Page 24: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

8 Capítulo 1

Page 25: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2

Marco Teórico

En este capítulo se procederá a presentar los detalles teóricos más relevantes de lostemas que se utilizarán en el trabajo. Comprende cinco secciones, en la primera sehablará acerca de los modelos ARIMA univariados, mientras que en la segunda seprocederá a introducir los modelos multivariados. En la tercera sección se explicarábrevemente el método de k-medias y en la cuarta se dará una idea general de lo que sonlas evaluaciones actuariales. Finalmente, la quinta sección habla sobre los conceptosutilizados para ajustar la distribución muestral de los resultados. Se debe tomar encuenta que todos los temas mencionados son muy amplios, por lo que se presentaránunicamente las definiciones y resultados que se emplearán en el desarrollo de esta tesis.

2.1. Series de tiempo univariadas

El desarrollo de esta sección está basado principalmente en los trabajos de Cryer y Chan([11]) y Brockwell y Davis ([6] y [7]).

2.1.1. Conceptos preliminares

Una serie de tiempo es un conjunto de observaciones yt, cada una de las cuales fueregistrada en el momento específico t. En este trabajo se utilizarán series de tiempodiscretas, en las cuales el conjunto de los tiempos en el que se realizan las observaciones

9

Page 26: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

10 Capítulo 2

es discreto ([6]), es decir, t ∈ N o t ∈ Z.

Un modelo de serie de tiempo para los datos observados yt es una especificación delas distribuciones conjuntas de una sucesión de variables aleatorias Yt de la cual sepostula que yt es una realización. La sucesión Yt se llama proceso estocástico.

Para un un proceso estocástico Yt se define ([11]):

La función de media como µt = E(Yt) para t = 0,±1,±2, ....

La función de autocovarianza como γt,s = Cov(Yt, Ys) = E[(Yt−µt)(Ys−µs)] parat, s = 0,±1,±2, ....

La función de autocorrelación (ACF) como ρt,s = Corr(Yt, Ys) = γt,s/√γt,tγs,s

para t, s = 0,±1,±2, ....

Uno de los supuestos más comunes a la hora de estudiar modelos de series de tiempoes el de estacionariedad. El proceso Yt es débilmente estacionario si:

1. µt es independiente de t, y

2. γt,t+h es independiente de t para cada h.

En el caso anterior la notación se simplificará denotando µ = µt, γh = γt,t+h y ρh =

ρt,t+h.

Existe una definición más «fuerte» de estacionariedad, no obstante, para los propósitosde este trabajo únicamente se utilizará la definición anterior. Esto se debe al hecho deque se trabajará con modelos gaussianos (las distribuciones conjuntas del proceso Ytson normales multivariadas), en cuyo caso los conceptos de estacionariedad fuerte yestacionariedad débil son equivalentes. La idea básica detrás del concepto de estaciona-riedad es que las leyes de probabilidad que gobiernan el proceso no cambian en el tiempo.

Page 27: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 11

El ejemplo más común de proceso estacionario es el denominado ruido blanco, el cualconsiste en una sucesión de variables aleatorias independientes e idénticamente distri-buidas con varianza finita y se denota por et. A menos que se indique lo contrario, elproceso et tendrá media cero y varianza σ2

e . Generalmente se asume que et sigue unadistribución normal.

2.1.2. Modelos ARIMA

Definición 2.1.1 Yt es un proceso ARMA(p, q) si es estacionario y para todo t

cumple

Yt − φ1Yt−1 − ...− φpYt−p = et + θ1et−1 + ...+ θqet−q

donde et es un ruido blanco con media cero y varianza σ2e y los polinomios φ(x) =

1 − φ1x − ... − φpxp y θ(x) = 1 + θ1x + ... + θqx

q no tienen factores comunes, lo cualsignifica que el modelo no se puede reducir a uno más simple.

El proceso anterior se puede escribir en forma compacta como φ(B)Yt = θ(B)et parat = 0,±1, ..., donde B es el operador de rezago hacia atrás (Bj Yt = Yt−j, j = 0, 1, ...).

Cuando θ(x) ≡ 1 el proceso se denota por ARMA(p, 0) o AR(p) y se llama autorregre-sivo de orden p. En el caso de que φ(x) ≡ 1, el proceso se denota por ARMA(0, q) oMA(q) y se llama modelo de media móvil de orden q.

Definición 2.1.2 Sea Yt un proceso ARMA(p, q). Yt se denomina causal si existeuna secuencia de constantes ψj∞j=0 tal que

∑∞j=0 |ψj| < ∞ y Yt =

∑∞j=0 ψjet−j para

t = 0,±1, ...

El siguiente teorema señala el requisito para que un proceso ARMA sea causal. Sudemostración se puede encontrar en [7].

Page 28: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

12 Capítulo 2

Teorema 2.1.1 Sea Yt un proceso ARMA(p, q). Yt es causal si y sólo si φ(z) 6= 0

para todo z ∈ C tal que |z| ≤ 1. Los coeficientes ψj de la definición anterior sedeterminan a partir de la relación

ψ(z) =∞∑j=0

ψjzj = θ(z)/φ(z), |z| ≤ 1.

Definición 2.1.3 Sea Yt un proceso ARMA(p, q). Yt se denomina invertible siexiste una secuencia de constantes πj∞j=0 tal que

∑∞j=0 |πj| < ∞ y et =

∑∞j=0 πjYt−j

para t = 0,±1, ...

El siguiente teorema señala el requisito para que un proceso ARMA sea invertible. Sudemostración se puede encontrar en [7].

Teorema 2.1.2 Sea Yt un proceso ARMA(p, q). Yt es invertible si y sólo si θ(z) 6=0 para todo z ∈ C tal que |z| ≤ 1. Los coeficientes πj de la definición anterior sedeterminan a partir de la relación

π(z) =∞∑j=0

πjzj = φ(z)/θ(z), |z| ≤ 1.

De acuerdo con [6], la sucesión πj se puede obtener a partir de las ecuaciones

πj +

q∑k=1

θkπj−k = −φj, j = 0, 1, ...

donde φ0 := −1, φj := 0 para j > p y πj := 0 para j < 0.

Un resultado que será importante en el proceso de identificación de modelos es el com-portamiento de la función de autocorrelación de un proceso MA(q) ([11]):

Page 29: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 13

ρk =

−θk + θ1θk+1 + θ2θk+2 + ...+ θq−kθq

1 + θ21 + θ22 + ...+ θ2qpara k = 1, 2, ..., q

0 para k > q.

(2.1)

Es decir, la función de autocorrelación de un proceso MA(q) se vuelve cero a partir delrezago q.

Cuando se tienen n observaciones de una serie de tiempo desconocida, no se cuenta conla función de autocorrelación del proceso que la generó, por lo que ésta se debe estimara partir de la denominada función de autocorrelación muestral:

ρk =

∑nt=k+1(Yt − Y )(Yt−k − Y )∑n

t=1(Yt − Y )2para k = 1, 2, ...

donde Y = 1n

∑nt=1 Yt.

De acuerdo con [7], la distribución conjunta de ρk = (ρ1, ρ2, ..., ρk) es aproximadamenteN(ρk, n

−1W ), donde ρk = (ρ1, ρ2, ..., ρk) y W es la matriz cuya entrada (i, j) está dadapor la fórmula de Bartlett:

wij =∞∑k=1

[ρk+i + ρk−i − 2ρiρk][ρk+j + ρk−j − 2ρjρk].

Otra función importante es la denominada función de autocorrelación parcial (PACF),la cual representa la correlación entre Yt y Yt−k luego de eliminar el efecto de las variablesYt−1, Yt−2, ..., Yt−k+1. Esta función se define como:

αk =

1 para k = 0

φkk para k ≥ 1(2.2)

donde φkk satisface las denominadas ecuaciones de Yule-Walker:

ρj = φk1ρj−1 + φk2ρj−2 + ...+ φkkρj−k para j = 1, 2, ..., k (2.3)

Page 30: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

14 Capítulo 2

En el sistema de ecuaciones anterior se toman ρ1, ρ2,..., ρk como dados y se debe resolverpara φk1, φk2,..., φkk ([11]).

Se puede probar que para un proceso AR(p) se cumple φkk = 0 para k > p (ver elejemplo 3.2.6 de [6]).

La función de autocorrelación parcial muestral φkk se construye de la misma maneraque la teórica sustituyendo ρ por ρ en (2.2) y (2.3).

De acuerdo con [11], bajo la hipótesis de un modelo AR(p), la función de autocorrela-ción parcial muestral en rezagos mayores a p se distribuye aproximadamente como unadensidad normal con media cero y varianza 1/n. Para más detalle consultar la sección8.10 de [7].

La función de autocorrelación extendida (EACF) permite identificar los valores p y qde un modelo ARMA. Este método se basa en el hecho de que si se conoce la parteautorregresiva de un modelo ARMA, al filtrar esta parte de la serie observada se obtieneun modelo MA cuya función ACF cumple (2.1). Los coeficientes AR se pueden estimara partir de una secuencia de regresiones. Dado que los valores p y q del modelo ARMAno son conocidos, se debe utilizar un proceso iterativo, el cual se explica en [11]. Al final,lo que se obtiene es una tabla como la mostrada en el Cuadro 2.1, el cual es tomado de[11] y corresponde a un modelo ARMA(1,1). En este tipo de gráficos lo que se buscaes identificar la esquina del triángulo de O’s, la cual en este caso está marcada con unasterisco. El valor de p corresponde al de la fila en la que se encuentra ese punto y elvalor de q a la columna.

No obstante, no siempre es posible identificar un punto claramente definido a través dela EACF muestral.

Page 31: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 15

AR/MA 0 1 2 3 4 5 6 7 8 9 10 11 12 130 x x x x x x x x x x x x x x1 x o* o o o o o o o o o o o o2 x x o o o o o o o o o o o o3 x x x o o o o o o o o o o o4 x x x x o o o o o o o o o o5 x x x x x o o o o o o o o o6 x x x x x x o o o o o o o o7 x x x x x x x o o o o o o o

Cuadro 2.1: Función de autocorrelación extendida para un modelo ARMA(1,1)

Modelos no estacionarios

Una generalización de los modelos ARMA son los denominados modelos ARIMA, loscuales permiten representar algunas series que no necesariamente son estacionarias ([6]).

Definición 2.1.4 Si d es un entero no negativo, Yt es un proceso ARIMA(p, d, q) siZt = (1−B)d Yt es un proceso ARMA(p, q) causal.

Esta definición implica que Yt satisface una ecuación en diferencias de la formaφ∗(B)Yt ≡ φ(B)(1−B)d Yt = θ(B)et, donde φ(x) y θ(x) son polinomios de grado p y qrespectivamente y φ(x) 6= 0 para |x| ≤ 1. El polinomio φ∗(x) tiene un cero de orden d enx = 1. El proceso Yt es estacionario si y sólo si d = 0, en cuyo caso se reduce a un pro-ceso ARMA(p, q). Así, la estimación de φ, θ y σ2 se hace sobre las diferencias (1−B)dYt.

Una limitante de ajustar un proceso ARIMA(p, d, q) es que a la serie Yt se le permiteser no estacionaria únicamente en la forma descrita en el párrafo anterior: que el polino-mio φ∗(B) tenga un cero de multiplicidad d en el punto 1 del círculo unitario, lo cual sepuede evidenciar cuando la ACF muestral es una función positiva que decae lentamente.

Page 32: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

16 Capítulo 2

Para determinar si se está en presencia del caso descrito en el párrafo anterior y esnecesario diferenciar una serie, se puede aplicar una prueba estadística para ver si laserie posee raíces unitarias. Dos de estas pruebas son la Dickey-Fuller aumentada y laKPSS.

Se puede comprobar (Sección 6.4 de [11]) que una prueba de diferenciación equivalea realizar una prueba de raíz unitaria en el polinomio característico AR de una serie.Considere el modelo Yt = αYt−1 + Xt para t = 1, 2, ... con Xt un proceso AR(k):Xt = φ1Xt−1 + ...+ φkXt−k + et. Bajo la hipótesis nula α = 1 se tiene:

Xt = Yt − Yt−1 = aYt−1 + φ1(Yt−1 − Yt−2) + . . .+ φk(Yt−k − Yt−k−1) + et

con a = α−1. De acuerdo con [11], la hipótesis nula α = 1 (equivalentemente a = 0) sepuede probar haciendo una regresión de la primera diferencia de la serie observada enel primer rezago de la serie observada y los k rezagos pasados de la primera diferenciade la serie observada. Entonces, se prueba si el coeficiente a es cero (el proceso es no es-tacionario pero se vuelve estacionario al diferenciarlo una vez). La hipótesis alternativaes que a < 0 y por ende Yt es estacionario. El estadístico Dickey-Fuller aumentadoes el estadístico t del coeficiente de a de la regresión usando mínimos cuadrados. En lapráctica, aunque se haya diferenciado, el proceso puede no ser AR de orden finito, peropuede ser aproximado por un proceso de este tipo. El orden AR aproximado puede serestimado con un criterio de información1 antes de ejecutar la prueba ADF ([11]).

Por su parte, la hipótesis nula de la prueba KPSS es que el proceso es estacionario. Laderivación de la prueba inicia con el modelo

yt = β′Dt + µt + ut

con

µt = µt−1 + et

1Los criterios de información se explicarán en la sección 2.1.3

Page 33: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 17

donde et es un ruido blanco con media cero y varianza σ2e , Dt contiene componentes

deterministas (tendencias no estocásticas que siempre están presentes en el modelo, lasmás comunes son una constante o intercepto y la tendencia lineal) y ut es estacionario.La hipótesis nula se formula como H0 : σ2

e = 0, lo que implica que µt es constante.El estadístico KPSS es el multiplicador de Lagrange (LM) usado para probar σ2

e = 0

contra la alternativa σ2e > 0, el cual está dado por

KPSS =

(n−2

n∑t=1

S2t

)/λ2

donde n es el tamaño de la muestra, St =∑t

j=1 uj, uj es el residuo de la regresión deyt en Dt y λ2 es un estimador consistente de la varianza de ut. Bajo la hipótesis nula,Kwiatkowski, Phillips, Schmidt y Shin mostraron que KPSS converge a una función demovimiento Browniano estándar que depende de la forma de los términos deterministasDt pero no del valor de sus coeficientes. Para más detalle, revisar [19].

Estimación de parámetros

Existen varios métodos para estimar los parámetros de un modelo ARMA, los cualescorresponden a los coeficientes de los polinomios φ(x) y θ(x) y la varianza del ruidoblanco. En este trabajo se utilizará el método de máxima verosimilitud. El procedimien-to detallado para obtener este tipo de estimadores se puede encontrar en [7].

La función de verosimilitud gaussiana para un proceso ARMA es la siguiente:

L(φ, θ, σ2

)=

1√(2πσ2)n r0 · · · rn−1

exp

− 1

2σ2

n∑j=1

(Yj − Yj

)2rj−1

(2.4)

donde n es el tamaño de la muestra, Y1 = 0, Yj = E(Yj|Y1, ..., Yj−1) son los predictoresde un paso y ri son los correspondientes errores cuadráticos medios. Estos valores secalculan con las recursiones

Page 34: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

18 Capítulo 2

Yn+1 =

∑n

j=1 θnj

(Yn+1−j − Yn+1−j

)para 1 ≤ n < m

φ1Yn + ...+ φpYn+1−p +∑q

j=1 θnj

(Yn+1−j − Yn+1−j

)para n ≥ m

yrn =

vnσ2

=1

σ2E(Yn+1 − Yn+1

)donde m = max(p, q). Los valores de θnj y rn se obtienen recursivamente con la sucesiónque define el denominado algoritmo de innovaciones:

v0 = E(Y1Y1)

θn,n−k = v−1k

(E(Yn+1Yk+1)−

∑k−1j=0 θk,k−jθn,n−jvj

), 0 ≤ k < n

vn = E(Yn+1Yn+1)−∑n−1

j=0 θ2n,n−jvj

Derivando parcialmente la función (2.4) con respecto a σ2 y notando que Yj y rj sonindependientes de σ2, se encuentra que los estimadores de máxima verosimilitud φ, θ yσ2 satisfacen:

σ2 = n−1S(φ, θ)

donde

S(φ, θ)=

n∑j=1

(Yj − Yj

)2/rj−1

y φ, θ son los valores de φ, θ que minimizan

l(φ, θ) = ln(n−1S (φ, θ)

)+ n−1

n∑j=1

ln(rj−1)

Para más detalles, ver [6] o [7].

2.1.3. Especificación del modelo

El primer paso para especificar un modelo para una serie de datos consiste en determi-nar tentativamente el orden, es decir, los valores de p y q. Para esto se pueden utilizar

Page 35: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 19

las funciones ACF, PACF y EACF. Primero se observa la ACF muestral, si existe unrezago q a partir del cual los rezagos mayores a q no son significativos, se propone unmodelo MA(q) de acuerdo con (2.1). En el caso de la función PACF muestral, si existeun rezago p a partir del cual los rezagos mayores a p no son significativos, se proponeun modelo AR(p). Para la función EACF, se construye una tabla como la del Cuadro2.1 y se eligen los valores de p y q que señalen el vértice de un triángulo de O’s.

En caso de que las funciones anteriores no indiquen con claridad un modelo a ajustar, sedeben probar varios modelos distintos y luego compararlos mediante criterios de infor-mación (AIC, AICc y BIC) o pruebas de cociente de verosimilitud, lo cual se explicarámás adelante.

Criterios de información

Se considerarán 3 de estos criterios: AIC, AICc y BIC. El AIC (criterio de informaciónde Akaike) es un estimador del índice de divergencia de Kullback-Leibler del modeloajustado con respecto al modelo real. Sea p(y1, y2, ..., yn) la función de densidad deprobabilidad (pdf) real de Y1, Y2, ..., Yn y qθ(y1,y2,...,yn) la pdf correspondiente bajo elmodelo con vector de parámetros θ. La divergencia Kullback-Leibler de qθ con respectoa p se define como ([11])

D(p, qθ) =

∫ ∞

−∞

∫ ∞

−∞· · ·∫ ∞

−∞p(y1, y2, ..., yn) log

[p(y1, y2, ..., yn)

qθ(y1, y2, ..., yn)

]dy1dy2 · · · dyn

El AIC estima E [D (p, qθ)], donde θ es el estimador de máxima verosimilitud del vectorde parámetros θ. El criterio señala que se debe escoger el modelo en el que se minimice:

AIC = −2 log(L) + 2k

donde L es el valor máximo de la función de verosimilitud del modelo y k es el númerode parámetros estimados: p+ q + 1 si el modelo contiene un término constante y p+ q

en otro caso ([11]).

Page 36: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

20 Capítulo 2

No obstante, el AIC es sesgado, por lo que se definió un AIC corregido (AICc) queintenta eliminar el sesgo (ver [11]):

AICc = AIC+2(k + 1)(k + 2)

n− k − 2

donde n es el tamaño de la muestra.

Otro método para seleccionar los órdenes de un modelo ARMA es seleccionar el modeloque minimice el criterio de información bayesiano de Schwarz (BIC) definido como:

BIC = −2 log(L) + k log(n)

Si el proceso sigue un modelo ARMA, de acuerdo con [11], los órdenes obtenidos porminimización del BIC son consistentes, es decir, tienden a los órdenes reales al incre-mentarse el tamaño de la muestra. No obstante, si el proceso real no es ARMA, laminimización del AIC permite obtener el modelo ARMA más cercano al proceso real.La cercanía se mide en términos de la divergencia Kullback-Leibler.

Prueba de cociente de verosimilitud

Esta prueba es utilizada para comparar la bondad de ajuste de dos modelos anidados,uno de los cuales (el que rige bajo la hipótesis nula) es un caso particular del otro (elque rige bajo la hipótesis alternativa). Se basa en el cociente de verosimilitud, el cualexpresa cuántas veces es más probable que los datos fueron generados por uno de losmodelos. Al modelo bajo la hipótesis nula se le suele llamar modelo reducido, y al mo-delo bajo la hipótesis alternativa se le llama modelo completo.

Para poder efectuar la prueba, el modelo reducido debe corresponder a un caso particu-lar del modelo completo al que se le han establecido restricciones en uno o varios de susparámetros. Por ejemplo, un modelo AR(1) puede visualizarse como un modelo AR(2)con la restricción φ2 = 0.

Page 37: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 21

Para efectuar la prueba, se ajustan los dos modelos candidatos a los datos y se calculala verosimilitud de cada uno. El estadístico de prueba se calcula como:

Λ = −2 ln(L0) + 2 ln(L1)

donde L0 corresponde a la verosimilitud del modelo nulo y L1 a la verosimilitud delmodelo alternativo.

La distribución de probabilidad de Λ bajo la hipótesis nula es aproximadamente chicuadrado con df1 − df0 grados de libertad, donde df0 es la cantidad de parámetros delmodelo nulo y df1 la cantidad de parámetros del modelo alternativo. Para más detallesobre el uso de esta prueba en el contexto de series de tiempo se puede revisar [14].

Análisis de residuos

Los residuos del ajuste de un modelo ARMA se definen a partir de la forma invertidadel modelo como

et = Yt − π1Yt−1 − π2Yt−2 − ...

donde los valores de los π’s son estimados implícitamente como funciones de los φ’s yθ’s (ver Teorema 2.1.2).

Si el modelo propuesto fue especificado correctamente, se espera que estos residuos secomporten como un ruido blanco (ver [7]), por lo que se debe de verificar que seanestacionarios e independientes. Adicionalmente, dado que se utilizarán métodos de ve-rosimilitud para la estimación de parámetros, se verificará que los residuos sigan unadistribución normal.

Para el caso de estacionariedad se pueden aplicar pruebas como la de Dickey-Fuller au-mentada y la KPSS. Por otra parte, para la independencia se puede graficar la funciónde autocorrelación muestral de los residuos. Para un verdadero ruido blanco se esperaque las autocorrelaciones muestrales estén distribuidas normalmente con media cero y

Page 38: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

22 Capítulo 2

varianza 1/n (para más detalle ver la sección 9.4 de [7]). Se busca entonces que ningunode los rezagos de orden mayor que cero de la función de autocorrelación muestral seasignificativo.

La prueba anterior revisa la correlación en rezagos individuales, por lo que para tomaren cuenta la posibilidad de que los rezagos sean significativos en forma conjunta, seutiliza el estadístico Ljung-Box, definido como ([11]):

Q = n(n+ 2)

(K∑j=1

ρ2jn− j

)

donde K es el máximo rezago considerado, n es la cantidad de observaciones de la seriey ρj el valor de la ACF residual en el rezago j. Cuando n→ ∞, la distribución de Q esaproximadamente chi cuadrado con K − p− q grados de libertad (ver [11] y [7]).

En cuanto a la normalidad de los residuos, ésta se puede revisar gráficamente medianteun gráfico cuantil-cuantil o mediante pruebas estadísticas como la de Shapiro-Wilk o lade Jarque-Bera. Un gráfico cuantil-cuantil o gráfico QQ permite comparar una distribu-cion muestral con una distribucion teórica en particular, que en este caso corresponde ala normal. El gráfico despliega los cuantiles muestrales de los residuos contra los cuan-tiles teóricos de la distribución normal. Así, si los residuos se distribuyen normalmente,el gráfico QQ se debería asemejar a la función identidad.

Por su parte, la prueba de Shapiro-Wilk esencialmente calcula la correlación entre losresiduos y los correspondientes cuantiles normales. La hipótesis nula es que una muestrax1, ..., xn fue generada por una distribución normal. El estadístico de prueba es:

W =

(∑ni=1 aix(i)

)2∑ni=1(xi − x)2

donde x(i) es el i-ésimo estadístico de orden, x es la media muestral y las constantes aiestán dadas por

Page 39: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 23

(a1, ..., an) =mTV −1

(mTV −1V −1m)1/2

donde m = (m1, ...,mn)T , m1, ...,mn son los valores esperados de los estadísticos de

orden de una muestra de tamaño n de una distribución normal y V es la matriz decovarianzas de esos estadísticos ([22]).

La prueba Jarque-Bera utiliza el hecho de que la distribución normal tiene coeficientede asimetría (skewness) y kurtosis iguales a cero. Asumiendo datos independientes eidénticamente distribuidos, el estadístico Jarque-Bera se define como

JB =ng216

+ng2224

donde g1 es el coeficiente de asimetría muestral, g2 la kurtosis muestral y n es la canti-dad de observaciones de la serie. Bajo la hipótesis nula de normalidad, JB se distribuyeaproximadamente como una chi cuadrado con 2 grados de libertad ([11]).

2.1.4. Estacionalidad

Si d y D son enteros no negativos, Yt es un proceso estacional ARIMA(p, d, q) ×(P,D,Q)s de período s si la serie diferenciada Zt = (1−B)d(1−Bs)DYt es un procesoARMA causal definido por ([7])

φ(B)Φ(Bs)Zt = θ(B)Θ(Bs)et

donde

φ(x) = 1− φ1x− ...− φpxp

Φ(x) = 1− Φ1x− ...− ΦPxP

θ(x) = 1− θ1x+ ...+ θqxq

Θ(x) = 1 + Θ1x+ ...+ΘQxQ

Page 40: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

24 Capítulo 2

Para identificar un modelo de este tipo se puede observar el gráfico de la serie paraidentificar algún tipo de ciclo. También, al graficar la ACF se debería de notar ciclicidaden la significancia de los rezagos. Otra opción consiste en ajustar un modelo de estetipo a los datos y compararlo con uno sin componente estacional mediante criterios deinformación o una prueba de cociente de verosimilitud ([11]).

2.1.5. Datos atípicos

Los datos observados de una serie de tiempo pueden contener observaciones atípicaso outliers. El método más usado para estudiar y compensar sus efectos es el conocidocomo de diagnóstico [20]. Básicamente consiste en estudiar los residuos obtenidos luegode ajustar el modelo a los datos para identificar posibles observaciones atípicas y pro-poner un modelo que las incorpore. Así, los parámetros del modelo y los efectos de losdatos atípicos se estiman conjuntamente.

Existen cuatro tipos principales de outliers, los demás se pueden construir a partir de es-tos: aditivos (AO), innovacionales (IO), cambios de nivel (LS) y cambio temporal (TC).

Aditivos

Un outlier aditivo (AO) corresponde a un cambio exógeno del valor observado de unaserie de tiempo de un punto temporal particular. En vez de observar la serie originalYt, se observa Zt:

Zt =

Yt si t 6= T

Yt + ωA si t = T

donde ωA es la magnitud del AO.

Un outlier aditivo no afecta las observaciones de ningún otro punto de la serie. Otras

Page 41: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 25

formas de representar este tipo de outlier son:

Zt = ωAI(T )t + ψ(B)et

π(B)(Zt − ωAI

(T )t

)= et

donde I(T )t vale 1 cuando t = T y cero en los demás puntos.

Se puede mostrar (ver [20]) que un outlier aditivo puede contaminar los p residuosposteriores de la serie. Además, provocará que los parámetros de la parte autorregresivase sesgen hacia cero. Como es de esperar, el efecto se reduce conforme aumenta el tamañode la muestra.

Innovacionales

Este tipo puede ser generado por un cambio interno en el ruido del proceso. El modelopara un outlier innovacional (IO) se construye agregando un efecto de impulso al ruidodel proceso original ([20]):

Zt = ψ(B)(ωII

(T )t + et

)La ecuación anterior también se puede escribir como

π(B)Zt = ωII(T )t + et

Mientras que la relación entre el modelo original Yt y el afectado Zt está dada por

Zt =

Yt si t < T

Yt + ωIψj si t = T + j, j > 0

donde los coeficientes ψj vienen de la representación causal de la serie (ver Teorema2.1.1). Se puede mostrar ([20]) que un IO sólo afecta el residuo del momento en el queinicia su efecto, por lo que su impacto es menor que el de un AO.

Page 42: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

26 Capítulo 2

Cambio de nivel

Un cambio de nivel (LS) corresponde a una modificación de la media o nivel del procesoque inicia en un punto en específico y continúa hasta el final del periodo de observación.En un proceso estacionario el cambio en la media provocado por un LS transforma elproceso en uno no estacionario. La relación entre la serie real y la observada está dadapor:

Zt =

Yt si t < T

Yt + ωL si t ≥ T

El modelo para este tipo de outlier es

Zt = ωLS(T )t + ψ(B)et

donde

S(T )t = [1/(1−B)]I

(T )t

El modelo también se puede escribir como

π(B)(Zt − ωLS

(T )t

)= et

De acuerdo con [20], un LS puede afectar a todos los residuos que lo suceden, por loque el efecto va a depender de la distancia entre el período en el que sucede y la últimaobservación de la serie.

Cambio temporal

Este tipo de outlier es el más general. Intuitivamente se puede ver como un outlieraditivo cuyo efecto no desaparece inmediatamente en la siguiente observación sino quelo hace gradualmente. El modelo para este tipo de outlier está dado por

Zt = ωTCS∗(T )t + ψ(B)et

donde

Page 43: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 27

S∗(T )t = [1/(1− δB)]I

(T )t

El modelo también se puede escribir como

π(B)(Zt − ωTCS

∗(T )t

)= et

Note que cuando δ = 0, el TC corresponde a un AO, mientras que si δ = 1 correspondea un LS.

Identificación y estimación de datos atípicos

Diversos autores han propuesto diversos métodos para identificar y tomar en cuenta elefecto de las observaciones atípicas en el ajuste de modelos de series de tiempo. En elpresente trabajo se utilizará la metodología propuesta por Chen y Liu en [10].

Para identificar un outlier individual, se puede examinar el valor máximo de los esta-dísticos estandarizados de los efectos de los datos atípicos:

τIO(t) = et/σe (2.5)

τAO(t) =

∑nj=t ejx2j

σe∑n

j=t x22t

(2.6)

τLS(t) =

∑nj=t ejx3j

σe∑n

j=t x23t

(2.7)

τTC(t) =

∑nj=t ejx4j

σe∑n

j=t x24t

(2.8)

donde xij = 0 para todo i y j < t, xit = 1 para todo i, x2(t+k) = −πk, x3(t + k) =

1 −∑k

j=1 πj y x4(t + k) = δk −∑k−1

j=1 δk−jπj − πk. Los valores de πk se determinan

dependiendo del tipo del modelo de datos atípicos.

Ahora, suponga que la serie Yt está sujeta a m outliers de varios tipos en los tiempos

Page 44: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

28 Capítulo 2

t1, t2, ..., tm. El modelo para Yt puede expresarse como

Yt =m∑j=1

ωjLj(B)It(tj) +θ(B)

φ(B)(1−B)det (2.9)

donde

Lj(B) =

1 para un AO

θ(B)/[φ(B)(1−B)d] para un IO

1/(1−B) para un LS

1/(1− δB) para un TC

Sin distinguir la notación de los parámetros reales y los estimados, los residuos deajustar un modelo ARMA a Yt pueden expresarse como

et =m∑j=1

ωjπ(B)Lj(B)It(tj) + et (2.10)

cuando el modelo se especifica correctamente sin tomar en cuenta los efectos de losoutliers.

El procedimiento propuesto por los autores consiste de 3 etapas ([10]):

Etapa I: Estimación inicial de parámetros y detección de observaciones atípicas

1. Se calculan los estimadores de máxima verosimilitud de los parámetros delmodelo con la serie original (en la primera iteración) o la ajustada (siguientesiteraciones) y se obtienen los residuos.

2. Para t = 1, ..., n se calcula ηt = max|τIO(t)|, |τAO(t)|, |τLS(t)|, |τTC(t)| conla ecuación (2.8). Si max ηt = |τtp(t)| > C, donde C es un valor críticopredeterminado2, existe la posibilidad de un outlier tipo tp en el momento t;tp puede ser IO, AO, LS o TC.

2En [20] se recomienda un valor de 3,5 o 4.

Page 45: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 29

3. Si no se encontraron outliers se continúa al paso siguiente, de lo contrario,se corrige el efecto del outlier en los residuos y se devuelve al paso anteriorpara ver si se encuentra otro outlier.

4. Si no se encontraron outliers en la primera iteración de este bucle hay quedetenerse ya que la serie no tiene outliers. De lo contrario, devuélvase al paso1 y vuelva a estimar los parámetros. Si el número total de outliers en todoslos bucles es mayor a cero y no se detectan outliers adicionales en el bucleactual, pasar a la siguiente etapa.

Etapa II: Estimación conjunta de efectos de los datos atípicos y los parámetrosdel modelo

1. Suponga que los m puntos en el tiempo t1, t2, ..., tm son identificados co-mo posibles outliers. Sus efectos ωj pueden estimarse conjuntamente conel modelo de regresión múltiple (2.10), con et como variable dependiente yLj(B)It(tj) como las independientes.

2. Calcule los estadísticos τ de los ωj estimados, donde τj = ωj/std(ωj)3 para

j = 1, ...,m. Si min|τj| := τν ≤ C, donde C es el mismo valor crítico dela etapa anterior, elimine el outlier del tiempo tν del conjunto de outliersidentificados y vaya al paso anterior con los m − 1 outliers restantes. De locontrario vaya al paso siguiente.

3. Obtenga la serie ajustada eliminando los efectos de los outliers usando losωj estimados más recientes del paso 1 de esta etapa.

4. Calcule los estimadores de máxima verosimilitud de los parámetros del mo-delo basado en la serie ajustada obtenida en el paso anterior. Si el cambiorelativo en el error estándar del residuo con respecto al estimador anterior esmayor a ε4, vaya al primer paso de esta etapa y siga iterando, de lo contrario,pase a la siguiente etapa.

3std denota desviación estándar4La tolerancia ε es una constante seleccionada por el usuario para controlar la precisión de los

estimadores de los parámetros

Page 46: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

30 Capítulo 2

Etapa III: Detección de datos atípicos basándose en los estimadores finales delos parámetros

1. Calcule los residuos filtrando la serie original basándose en los estimadoresde los parámetros obtenidos en el paso 4 de la etapa anterior.

2. Utilice los residuos obtenidos en el paso anterior e itere sobre las etapas I yII con las siguientes modificaciones:

• los estimadores de parámetros usados en la etapa I se establecen demanera fija como los obtenidos en el paso 4 de la etapa II

• se omiten los pasos 3 y 4 de la etapa II

Los ωj estimados en la última iteración del paso 1 de la etapa II son losestimadores finales de los efectos de los outliers detectados.

Entre las ventajas del método anterior, se encuentra la reducción del efecto de enmas-caramiento generado por la existencia de múltiples datos atípicos en la serie. Además,se reduce el sesgo en la estimación de los parámetros producido por los datos atípicos([10]).

2.1.6. Modelos de Heterocedasticidad

La exposición de esta sección sigue las ideas de [11]. La varianza condicional de la serieYt dados los valores pasados de Y mide la incertidumbre en la desviación de Yt de sumedia condicional E(Yt|Yt−1, Yt−2, ...). Si Yt sigue un modelo ARIMA, la varianza condi-cional siempre es igual a la varianza del ruido para cualquier valor presente y pasado delproceso. No obstante, existen casos en los cuales la varianza condicional puede variarcon los valores actuales y pasados del proceso, por lo que la varianza condicional esun proceso aleatorio en sí mismo, haciendo necesario utilizar un modelo que tome encuenta la heterocedasticidad.

Para determinar si se debe considerar un modelo de este tipo, Cryer y Chan señalanque se debe identificar si los residuos del ajuste de un modelo ARIMA elevados al cua-drado están autocorrelacionados ([11]). Esto se puede verificar a través de la función de

Page 47: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 31

autocorrelación o una prueba Ljung-Box, que en este contexto se denomina prueba deMcLeod-Li. En caso de que se tenga evidencia de autocorrelación, se debe ajustar unmodelo que permita modelizarla. Los modelos más usuales para esto son los denomi-nados ARCH y GARCH, aunque también existen otros más complejos que se puedenconsultar en [20].

Dado que, como se verá en el capítulo de Desarrollo, en ningún caso se encontró evi-dencia de autocorrelación en los residuos al cuadrado de los modelos ajustados, no seahondará más en este tema.

2.2. Modelos multivariados

2.2.1. Conceptos preliminares

El desarrollo de esta sección está basado principalmente en el trabajo de Tsay ([30]).Una serie de tiempo k-dimensional zt = (z1t, ..., zkt)

′ es un vector de k variables aleato-rias. Se asumirá que el dominio de t (el tiempo) es discreto. En el resto de esta sección, amenos que se indique lo contrario, cuando se mencione una serie de tiempo se entenderáque es multivariada.

Al igual que en las series de tiempo univariadas, una serie de tiempo k-dimensional esdébilmente estacionaria si su esperanza y su covarianza son independientes del tiempo.La matriz de covarianza en este caso se denota por Cov(zt) = E[(zt−µ)(zt−µ)′] = Σz.A menos que se señale lo contrario, cuando se hable de una serie estacionaria se estaráhaciendo referencia al concepto de estacionariedad débil.

Para medir la dependencia dinámica lineal de una serie de tiempo estacionaria zt, sedefine su matriz de covarianza cruzada en el rezago ` como

Page 48: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

32 Capítulo 2

Γ` = Cov(zt, zt−`) = E[(zt − µ)(zt−` − µ)′]

=

E(z1tz1,t−`) E(z1tz2,t−`) · · · E(z1tzk,t−`)

... ... . . . ...E(zktz1,t−`) E(zktz2,t−`) · · · E(zktzk,t−`)

donde µ = E(zt) y zt = (z1t, ..., zkt)

′ ≡ zt−µ. Note que para ` = 0 se obtiene la matrizde covarianza de zt, es decir, Γ0 = Σz. El elemento (i, j) de Γ` se denota por γ`,ij ycorresponde a la covarianza entre zi,t y zj,t−`, la cual mide la dependencia lineal de lai-ésima componente zit con respecto al `-ésimo rezago de la j-ésima componente zjt.

Para una serie estacionaria zt la matriz de correlación cruzada (CCM) en el rezago ` sedefine como

ρ` =D−1Γ`D

−1 = [ρ`,ij]

donde D = diag(σ1, ..., σk) es la matriz diagonal de las desviaciones estándar de loscomponentes de zt.

La matriz de covarianza muestral en el rezago ` corresponde a

Γ` =1

T − 1

T∑t=`+1

(zt − µ)(zt−` − µ)′

donde µz =1T

∑Tt=1 zt es la media muestral y T es la cantidad de datos de la muestra.

La matriz de correlación cruzada muestral en el rezago ` se calcula como

ρ` = D−1Γ`D

−1

donde D = diag(γ1/20,11, ..., γ1/20,kk), siendo γ0,ii el elemento (i, i) de Γ0.

Sea ρk(X,Y ) la correlación cruzada muestral entre dos series univariadas de datos X yY . Según el Teorema 11.2.2 de [7], esta correlación se distribuye asintóticamente comouna normal con media cero y varianza

Page 49: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 33

1

n

[1 + 2

∞∑k=1

ρk(X)ρk(Y )

](2.11)

Dado que la varianza anterior depende de las autocorrelaciones de ambas series, no sepuede estudiar la independencia entre ambas series sin tomar en cuenta la naturalezade éstas. Esta dificultad se puede evitar si se realiza un «preblanqueo» a las series.Este procedimiento consiste en aplicar una transformación para convertir estas seriesen procesos de ruido blanco, de forma que la varianza en 2.11 sea 1/n.

Tanto [11] como [6] recomiendan ajustar un modelo ARIMA a cada una de las seriesy calcular la correlación cruzada muestral usando los residuos de los modelos. De estamanera, se puede estudiar la significancia de esta correlación comparando los valores deésta con el valor crítico 1,96/

√n. No obstante, ambas fuentes difieren en un aspecto de

este procedimiento. Cryer y Chan ([11]) indican que se debe buscar el modelo ARIMAque mejor ajuste a una de las series (por ejemplo X) y aplicar ese modelo a ambasseries. En este caso, los residuos de la aplicación a la serie Y no necesariamente secomportarán como ruido blanco. No obstante, estos autores señalan que se debe aplicarla misma transformación a ambas series para preservar las relaciones lineales entre éstas.

Por otra parte, Brockwell y Davis ([6]) señalan que se debe garantizar que los residuosde ambas transformaciones deben ser ruido blanco, por lo que a cada serie se le debeaplicar el modelo ARIMA apropiado, a pesar de que no sea el mismo para ambas.

A continuación se presentan dos conceptos similares a los de las series univariadas.

Definición 2.2.1 Una serie de tiempo k-dimensional es lineal si

zt = µ+∞∑i=0

ψiat−i (2.12)

donde µ es un vector constante k-dimensional, ψ0 = Ik, la matriz identidad k × k,ψi (i > 0) son matrices constantes k × k y at es una sucesión de vectores aleatorios

Page 50: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

34 Capítulo 2

independientes e idénticamente distribuidos con media cero y matriz de covarianza Σa

definida positiva.

Para que una serie lineal sea estacionaria, las matrices de coeficientes ψi deben satisfacer

∞∑i=1

‖ψi‖ <∞

donde ‖A‖ denota la norma de la matriz A.La ecuación (2.12) se conoce como la representación MA de la serie. El procedimientopara obtener los coeficientes ψi se puede consultar en la sección 1.2.2 de [30].

Definición 2.2.2 Una serie de tiempo k-dimensional es invertible si

zt = c+ at +∞∑j=1

πjzt−j (2.13)

donde c es un vector constante k-dimensional, πj son matrices constantes k × k y at

es una sucesión de vectores aleatorios independientes e idénticamente distribuidos conmedia cero y matriz de covarianza Σa definida positiva.

La ecuación (2.13) se conoce como la representación AR o autorregresiva de la serie. Elprocedimiento para obtener los coeficientes πj se puede consultar en la sección 1.2.3 de[30].

2.2.2. Modelos VARMA

Un modelo VARMA(p, q) puede escribirse como

zt = φ0 +

p∑i=1

φizt−i + at −q∑

i=1

θiat−i

donde p y q son enteros no negativos, φ0 es un vector constante k-dimensional, φi y θjson matrices constantes k×k y at es una sucesión de vectores aleatorios independientese idénticamente distribuidos con media cero y matriz de covarianzaΣa definida positiva.Usando el operador back-shift B, el modelo VARMA se puede escribir como

Page 51: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 35

φ(B)zt = φ0 + θ(B)at

donde φ(B) = Ik − φ1B − ...− φpBp y θ(B) = Ik − θ1B − ...− θqBq son polinomios

matriciales en B. Cuando q = 0 el proceso se denota por VAR(p), mientras que cuandop = 0, la notación es VMA(q).

Definición 2.2.3 Un modelo VARMA se llama identificable si sus polinomios matri-ciales φ(B) y θ(B) están determinados de manera única por las matrices de peso ψi

de la ecuación (2.12).

Otra forma de determinar la identificabilidad de un modelo VARMA(p, q) radica enverificar que cumpla las siguientes condiciones (ver [30]):

1. φ(B) y θ(B) son coprimos por la izquierda, es decir, si u(B) es un factor comúnpor la izquierda de φ(B) y θ(B), entonces |u(B)| es una constante distinta decero.

2. El orden q es tan pequeño como sea posible, el orden p es tan pequeño como seaposible para ese valor de q, y las matrices φp y θq (con p, q > 0) satisfacen lacondición de que el rango de la matriz [φp,θq] es k, la dimensión de zt.

Por otra parte, para que el modelo sea débilmente estacionario, la condición necesaria ysuficiente que se debe cumplir es que las soluciones de |φ(B)| = 0 estén fuera del círculounitario. Cuando zt es estacionario, posee una representación MA.

Finalmente, para que sea invertible, es necesario y suficiente que todas las solucionesde |θ(B)| = 0 estén fuera del círculo unitario.

Función de verosimilitud

La estimación de los modelos VARMA puede realizarse usando el método de verosimi-litud condicional o el de verosimilitud exacta. Para el presente trabajo se utilizará elmétodo de verosimilitud condicional.

Page 52: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

36 Capítulo 2

Para un modelo estacionario e invertible VARMA(p, q), la función de verosimilitudcondicional puede evaluarse recursivamente asumiendo que at = 0 para t ≤ 0 y zt = zpara t ≤ 0, donde z denota la media muestral de zt. Para simplificar, se asume queE(zt) = 0, por lo que todos los valores de premuestra son 0, es decir, at = 0 = zt parat ≤ 0. Dados los datos zt|t = 1, ..., T, se definen las matrices kT -dimensionales Z =

(z′1, z′2, ..., z

′T )

′ y A = (a′1,a

′2, ...,a

′T )

′. Con las condiciones de simplificación at = zt = 0

para t ≤ 0 se obtiene:

ΦZ = ΘA

donde Φ y Θ son las matrices kT × kT :

Φ =

Ik 0k 0k · · · 0k

−φ1 Ik 0k · · · 0k

−φ2 −φ1 Ik · · · 0k

... ... ... . . . ...0k 0k 0k · · · Ik

, θ =

Ik 0k 0k · · · 0k

−θ1 Ik 0k · · · 0k

−θ2 −θ1 Ik · · · 0k

... ... ... . . . ...0k 0k 0k · · · Ik

donde 0k denota una matriz de ceros k × k. Se puede demostrar (sección 3.9.1 de [30])que A ∼ N(0, IT ⊗Σa), donde ⊗ denota el producto de Kronecker. Dado lo anterior,el logaritmo de la función de verosimilitud condicional de los datos es

`(β,Σa;Z) = −kT2

log(2π)− T

2log(|Σa|)−

T

2

T∑t=1

a′tΣ

−1a at (2.14)

donde β = vec[φ1, ...,φp,θ1, ...,θq] es el vector de parámetros AR y MA. Es fácil mostrarque el estimador de máxima verosimilitud condicional de Σa es Σa = (1/T )

∑Tt=1 ata

′t.

No obstante, no existe una forma cerrada para los estimadores de β.

2.2.3. Especificación del modelo

Estimación preliminar de órdenes

Las técnicas utilizadas para estimar de manera preliminar los valores p y q de un mode-lo VARMA que se desea ajustar a un conjunto de observaciones generalmente utilizan

Page 53: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 37

simplificaciones y aproximaciones para evitar el tener que calcular los parámetros deuna gran cantidad de modelos, lo cual es computacionalmente costoso y además puedetomar bastante tiempo.

Para modelos VAR, las dos maneras explicadas en [30] para realizar esta estimacióncorresponden a pruebas de cociente de verosimilitud aplicadas a modelos ajustados me-diante regresiones lineales multivariadas o utilizando criterios de información.

En el primer caso, los pasos a seguir son:

1. Definir el valor máximo de p a considerar, denotado por P .

2. Para ` = 0, ..., P , obtener el estimador de mínimos cuadrados β` del modelo

z′t = x′tβ + a′

t

donde xt = (1, z′t−1, · · · , z′t−p)′ es un vector de dimensión kp+1 y β′ = [φ0,φ1, · · · ,φp]

es una matriz k × (kp+ 1). Para ` = 0, β′ es el vector constante φ0.

3. Calcular Σa,` = (1/T − P )A′`A`, donde A` = Z −Xβ` es la matriz residual del

modelo VAR(`) ajustado.

4. Calcular el estadístico

M(`) = −(T − P − 1,5− k`) ln

(|Σa,`||Σa,`−1|

)

y su valor p basado en la distribución asintótica chi cuadrado con k2 grados delibertad.

5. Examinar los estadísticos secuencialmente iniciando con ` = 1. Si todos los valoresp de los estadísticos M(`) son mayores que el error tipo I especificado para ` > p,se selecciona un modelo VAR(p).

Page 54: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

38 Capítulo 2

La otra forma de seleccionar el orden del modelo VAR es usando los siguientes criteriosde información:

AIC(`) = ln |Σa,`|+2

T`k2

BIC(`) = ln |Σa,`|+ln(T )T

`k2

HQ(`) = ln |Σa,`|+2 ln[ln(T )]

T`k2

Los criterios AIC y BIC fueron explicados en la sección 2.1.3. El criterio HQ (Hannany Quinn) sigue las mismas ideas de los otros dos.

El procedimiento para escoger el orden consiste en calcular los tres criterios anteriorespara distintos valores de ` y seleccionar el que minimice cada valor. Es posible que cadacriterio seleccione un orden distinto.

Por otra parte, para los procesos VMA, el orden se puede identificar a partir de lasmatrices de correlación cruzada, ya que de manera similar al caso univariado, para unmodelo VMA(q) éstas deben satisfacer la condición ρj = 0 para j > q (ver la sección3.1 de [30]). Así, para un j dado se puede considerar la hipótesis nula H0 : ρj = ρj+1 =

· · ·ρm = 0 contra la alternativa Ha : ρ` 6= 0 para algún ` entre j y m, donde m es unentero positivo especificado con anterioridad. El estadístico a utilizar es

Qk(j,m) = T 2

m∑`=j

1

T − `tr(Γ

′`Γ

−1

0 Γ`Γ−1

0

)(2.15)

Qk(j,m) se distribuye asintóticamente como una chi cuadrado con k2(m− j+1) gradosde libertad si zt es un proceso VMA(q) y j > q. Para un modelo VMA(q), el valor deQk(q,m) debe ser significativo y los de Qk(j,m) no significativos para j > q.

En el caso de los modelos VARMA, se utiliza un método similar al de la función EACFpara los procesos univariados, denominado Matrices de correlación cruzada extendidas(ECCM). El procedimiento consiste en obtener estimadores consistentes del polinomio

Page 55: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 39

φ(B) de un modelo VARMA(p, q) estacionario e invertible. Luego, éste puede trans-formarse en una serie tipo VMA cuyo valor de q puede estimarse a través de matricesde correlación cruzada. El detalle del proceso se encuentra explicado en [30]. Al finali-zar este algoritmo, se construye una tabla como la mostrada en el Cuadro 2.2, la cualcorresponde a la forma teórica que se obtendría para un modelo VARMA(2,1). Paraestablecer los valores de p y q se debe identificar el vértice superior izquierdo del rec-tángulo de O’s que se debería de formar. No obstante, al igual que en el caso univariadocon la EACF, no hay garantía de que a partir de la ECCM muestral se pueda observarel rectángulo teórico.

p / q 0 1 2 · · · `− 1

0 X X X · · · X1 X X X · · · X2 X O O · · · O3 X O O · · · O4 X O O · · · O

Cuadro 2.2: Comportamiento teórico de las matrices de correlación cruzada extendidaspara un modelo VARMA(2,1)

Análisis de residuos

Para revisar el ajuste de un modelo, al igual que en el caso univariado lo que se realizaes un estudio de los residuos de éste:

at = zt − φ0 −p∑

i=1

φizt−i +

q∑j=1

θjat−j

donde φi y θj son los estimadores de máxima verosimilitud de φi y θj respectivamente.Si el modelo ajustado es adecuado, se espera que la serie residual at se comporte comoun ruido blanco k-dimensional, por lo que se puede aplicar el estadístico Ljung-Boxmultivariado para revisar las correlaciones de los residuos, el cual en este caso está dadopor

Page 56: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

40 Capítulo 2

Qk(m) = T 2

m∑`=1

1

T − `tr(C ′

`C−10 C`C

−10

)donde

C` =1

T

T∑t=`+1

ata′t−` ≡ [C`,ij]

Bajo el supuesto que zt sigue un modelo VARMA(p, q) y at es una serie de ruido blan-co con media cero, covarianza definida positiva y cuartos momentos finitos, Qk(m) sedistribuye asintóticamente como una chi cuadrado con k2(m−p−q) grados de libertad.

Otro detalle que se debe verificar es que los residuos sigan una distribución normalmultivariada, esto debido a que es una hipótesis utilizada a la hora de realizar las si-mulaciones. Para esto se aplicarán tres pruebas: la de Mardia, la de Henze-Zirkler y lade Royston.

La prueba de Mardia se basa en versiones multivariadas de la asimetría (b1,k) y lakurtosis (b2,k):

b1,k =1

n2

n∑i=1

n∑j=1

g3ij

b2,k =1

n

n∑i=1

n∑j=1

g2ii

donde gij = (xi − x)′Σ−1(xj − x) es la distancia de Mahalanobis al cuadrado de

los datos (en este caso los residuos) y k es el número de variables. Los estadísticoscorrespondientes son:

z1 =(k + 1)(n+ 1)(n+ 3)

6[(n+ 1)(k + 1)− 6]b1,k

z2 =b2,k − k(k + 2)√

8k(k + 2)/n

Page 57: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 41

z1 se distribuye aproximadamente como una χ2 con 16k(k + 1)(k + 2) grados de liber-

tad y z2 es aproximadamente normal con media 0 y varianza 1. Para más detalle ver [23].

La prueba de Henze-Zirkler tiene la ventaja de ser consistente. Se basa en una distanciafuncional no negativa de dos funciones de distribución. El estadístico está dado por

HZ =1

n

n∑i=1

n∑j=1

exp(−β

2

2Dij

)−2(1+β2)−k/2

n∑i=1

exp(− β2

2(1 + β2)Di

)+n(1+2β2)−k/2

donde k es el número de variables,

β =1√2

(n(2k + 1)

4

) 1k+4

,

Dij = (xi − xj)′Σ

−1(xi − xj), y

Di = (xi − x)′Σ−1(xi − x)

Si los datos son normales multivariados, el estadístico sigue una distribución lognormalde parámetros:

µ = 1− a−k/2(1 + kβ2/a + k(k + 2)β4)

2a2

σ2 = 2(1 + 4β2)−k/2 +2a−k(1 + 2kβ4)

a2+

3k(k + 2)β8

4a4

−4w−k/2β

(1 +

3kβ4

2wβ

+k(k + 2)β8

2w2β

)

donde a = 1 + 2β2 y wβ = (1 + β2)(1 + 3β2). Para más detalles ver [18].

La prueba de Royston está basada en el estadístico de Shapiro-Wilk. Sea Wj este esta-dístico para la j-ésima variable marginal, defina

rj =

Φ−1

[1

2Φ−((1−Wj)

λ − µ)/σ]2

Page 58: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

42 Capítulo 2

donde λ, µ y σ se calculan a partir de aproximaciones polinomiales dadas en [25] yΦ denota la función de distribución de la normal estándar. Si los datos son normalesmultivariados, H = e

∑kj=1 ri/k se distribuye aproximadamente como χ2

e, donde

e = k/[1 + (k − 1)c]

y c es un estimador de la correlación promedio entre los rj’s. Para más detalle de estaprueba se puede revisar [25].

2.2.4. Cointegración

En la sección de modelos univariados de series de tiempo se señaló que una serie uni-variada zt es un proceso integrado de orden d, representado por I(d) si (1 − B)dzt esestacionario e invertible con d > 0. En los procesos multivariados zt, si las componenteszit son I(d) pero una combinación lineal no trivial β′zt es una serie I(h) con h < d,entonces se dice que zt es cointegrado. El caso más común en las aplicaciones es cuandod = 1 y h = 0. El vector β se conoce como el vector de cointegración.

Las pruebas de cointegración trabajan con la siguiente representación de los modelosVARMA(p, q):

∆zt = Πzt−1 +

p−1∑i=1

Φ∗i∆zt−1 + c(t) +Θ(B)at (2.16)

donde c(t) corresponde a la parte determinista del modelo y

Φ∗j = −(Φj+i + · · ·+Φp), j = 1, . . . , p− 1

∆ = Φ1 + · · ·+Φp − Ik

La representación anterior se conoce como forma de corrección de errores (ECM). Laspruebas de cointegración se basan en determinar el rango de la matriz Π. Dada la difi-cultad del problema, las pruebas disponibles como la de Johansen se basan en modelostipo VAR y luego se utilizan aproximaciones para aplicarlas a los modelos VARMA. Silas series marginales zit tienen una raíz unitaria y

Page 59: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 43

1. Rango(Π) = 0, implica que Π = 0 lo cual significa que no hay vector de cointe-gración.

2. Rango(Π) = m > 0, implica que zt tiene m vectores de cointegración.

Una descripción detallada de estas pruebas se encuentra en la sección 5.9 de [30].

2.2.5. Pruebas de heterocedasticidad

En las secciones anteriores se ha asumido que la matriz de covarianzas de at es invarian-te con respecto al tiempo. Cuando esta hipótesis no se cumple, es necesario considerarmodelos distintos para explicar la volatilidad multivariada. En esta sección se presentanlas pruebas estadísticas recomendadas por Tsay en [30] para determinar la existenciade heterocedasticidad en los datos.

Si at no posee heterocedasticidad condicional, su matriz de covarianza condicional Σt

es invariante con el tiempo, por lo que a2t no depende de a2

t−i para i > 0. Así, se puedeprobar la hipótesis H0 : ρ1 = · · · = ρm = 0 contra Ha : ρi 6= 0 para algún i entre 1 ym, donde ρi es la i-ésima matriz de correlación cruzada de a2

t , mediante el estadísticoLjung-Box

Q∗k(m) = T 2

m∑i=1

1

T − ib′i(ρ

−10 ⊗ ρ−1

0 )bi (2.17)

donde T es el tamaño de muestra, k es la dimensión de at, bi = vec(ρ′i) y ρj es la matriz

muestral de correlación cruzada del rezago j de a2t . Bajo la hipótesis nula de que at no

posee heterocedasticidad condicional, Q∗k(m) se distribuye asintóticamente como χ2

k2m.

Alternativamente, se puede aplicar la prueba univariada de Ljung-Box a la serie

et = a′tΣ

−1at − k (2.18)

donde Σ denota la matriz de covarianza incondicional de at, y considerar H0 : ρ1 =

· · · = ρm = 0 contra Ha : ρi 6= 0 para algún i entre 1 y m, donde ρi es la auto-correlación en el rezago i de et. El estadístico en este caso corresponde a Q∗(m) =

Page 60: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

44 Capítulo 2

T (T + 2)∑m

i=1 ρ2i /(T − i), el cual se distribuye como χ2

m bajo la hipótesis nula.

La prueba anterior puede presentar problemas en muestras donde at tiene cola pesada,por lo que Tsay ([30]) propone robustecer la prueba. Sea q0,95 el cuantil 95 empírico delos residuos et. Lo que se hace es eliminar de zt las observaciones cuyo correspondientevalor de et excede q0,95, y se utilizan únicamente los puntos restantes para calcular elestadístico 2.17.

Otra forma de corregir el problema de las colas gruesas es trabajando con Rt, el rangode et. El rango de autocorrelación de et en el rezago ` se puede definir como

ρ` =

∑Tt=`+1(Rt − R)(Rt−` − R)∑T

t=1(Rt − R)2, ` = 1, 2, . . .

donde

R =T∑t=1

Rt/T = (T + 1)/2

T∑t=1

(Rt − R)2 = T (T 2 − 1)/12

Se puede mostrar que

E(ρ`) = −(T − `)/[T (T − 1)]

Var(ρ`) =5T 4 − (5`+ 9)T 3 + 9(`− 2)T 2 + 2`(5`+ 8)T + 16`2

5(T − 1)2T 2(T + 1)

Entonces, se puede utilizar el siguiente estadístico, el cual se distribuye asintóticamentecomo χ2

m si et no posee dependencia serial ([30]):

QR(m) =m∑t=1

[ρi − E(ρi)]2

Var(ρi)

Page 61: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 45

2.3. Método de k-medias

Como se explicará en el capítulo de Metodología, se pretende utilizar un modelo de seriede tiempo multivariada para explicar las variaciones salariales de los afiliados del fondode pensiones, ya que éstas además del tiempo dependen de la edad de cada persona.No obstante, dado el amplio rango de edades de los trabajadores, se formarán gruposde edad que permitan disminuir la cantidad de parámetros que se debe estimar.

Para realizar la agrupación se aplicará el denominado método de k-medias. Este méto-do busca crear una partición del conjunto de edades de forma que los grupos quedenbien separados y diferenciados. Cada edad está descrita por las variaciones salarialesen los 148 meses de historia con los que se cuenta. Lo que el método busca es que lasvariaciones salariales de los individuos que pertenezcan a un mismo grupo de edadesse parezcan más entre sí que a las variaciones salariales de los individuos de los otrosgrupos de edades.

Sea Ω el conjunto de las n edades que se van a clasificar en los grupos C1, ..., CK , lascuales están descritas por p observaciones de variaciones salariales x1, x2, ..., xp. Denotepor xi el vector de estas variaciones para la edad i y d(xi,xj) la distancia euclídea entrexi y xj. El algoritmo de clasificación es el siguiente ([29]):

Page 62: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

46 Capítulo 2

Algoritmo 1: Algoritmo de k-mediasDatos: Edades representadas por vectores con las observaciones de variación

salarial en los 148 meses. El conjunto de estas edades se denota por Ω.Resultado: K grupos C1, ..., CK en los que cada uno contiene una o varias

edades

Paso 1. Inicialización.Seleccionar aleatoriamente K objetos g1, ..., gK de Ω, los cuales servirán comonúcleos iniciales.

Paso 2. Preparación.para k ∈ 1, ..., K hacer

Ck := ∅

Paso 3. Asignación.# Asignar cada objeto a la clase del centro de gravedad más

cercano:

para i ∈ Ω hacersi d(xi, gk∗) ≤ d(xi, gk) para todo k = 1, ..., K entonces

asignar xi a la clase Ck∗

Paso 4. Representación.# Calcular los centros de gravedad de la partición:

para k ∈ 1, ..., K hacergk :=

1|Ck|∑

xi∈Ckxi

W := 1n

∑Kk=1

∑xi∈Ck

‖xi − gk‖2

Paso 5. Control de parada.si la variación en W entre la iteración anterior y la siguiente es menor a unumbral dado o se sobrepasa un número dado de iteraciones entonces

detenersede lo contrario

ir al Paso 2

Page 63: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 47

Se puede probar que el algoritmo converge, ver [29].

2.4. Evaluaciones actuariales

De acuerdo con la Superintendencia de Pensiones, una evaluación actuarial es un “Estudiotécnico que permite, mediante la aplicación de un método de evaluación específico, de-terminar la viabilidad financiera de un régimen de seguridad social”[27].

Para estimar esta viabilidad, se compara el denominado valor presente actuarial de lasobligaciones futuras del fondo con el valor presente actuarial de los futuros ingresos delfondo. Si los activos (la reserva con la que cuenta el fondo actualmente y los futuros) sonmayores a los pasivos futuros se dice que hay superávit, lo cual significa que los ingresosesperados serán suficientes para cubrir los egresos esperados. En el caso contrario, setendría un déficit actuarial en el fondo. La prima de equilibrio es aquella con la que losactivos futuros son iguales a los pasivos futuros.

Para poder realizar una comparación en tiempo presente de flujos de efectivo contingen-tes en distintas fechas futuras se debe tomar en cuenta el valor del dinero en el tiempo(a través de la tasa de interés) y la probabilidad de ocurrencia de cada uno de los pagosfuturos (a través de las probabilidades de decremento).

2.4.1. Tasa de interés

De acuerdo con [16], el interés se puede definir como la compensación que un prestatariopaga a un prestamista por el uso del capital. Es decir, si una persona presta un montoX por un período determinado, al final de ese período recibirá el monto original Xmás un monto adicional por haber prestado el dinero. El monto invertido inicialmentese conoce como Principal y el monto recibido al final del período se denomina Valoracumulado.

Definición 2.4.1 La tasa efectiva de interés i es el monto de dinero que una unidad

Page 64: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

48 Capítulo 2

invertida al inicio del período ganará durante éste, en el cual el interés es pagado alfinal.

El vocablo «efectiva» se refiere al hecho de que se sólo se paga interés una vez por cadaperíodo de medición, el cual generalmente es un año.

Para poder comparar montos de dinero definidos en distintos momentos en el tiempo,se debe considerar el cambio del valor del dinero en el tiempo. Para esto se utilizanlos denominados factores de acumulación y de descuento: el factor de acumulación dael valor acumulado al tiempo t de una inversión original de 1, mientras que el factorde descuento da el valor al inicio del período de un monto acumulado al final del período.

Generalmente, en los estudios actuariales se trabaja con interés compuesto. Esto quieredecir que el interés ganado es reinvertido en cada período junto al principal. Si la tasade interés se mantiene constante en todos los períodos de estudio, el factor de acumu-lación al final de t períodos está dado por (1 + i)t, mientras que el factor de descuentoes (1 + i)−t.Para la deducción de estas fórmulas ver [16].

El supuesto de que la tasa de interés i se mantiene constante durante todo el período esmuy utilizado en las evaluaciones actuariales. No obstante, para este trabajo se consideraque la tasa es distinta en cada año k. En este caso, el factor de descuento para t añoscorresponde a

vt =t∏

k=1

(1 + ik)−1 (2.19)

donde ik es la tasa de interés en el año k. El factor de acumulación para el mismoperíodo es

t∏k=1

(1 + ik)

Note que en el desarrollo anterior las tasas de interés no son aleatorias, sino determi-nistas.

Page 65: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 49

Así, si se quiere comparar dos montos de dos fechas distintas, se debe descontar o acu-mular cada monto con las tasas de interés correspondientes para obtener sus valores enuna fecha común.

Es importante mencionar que no se considerará descuentos a través de tasas libres deriesgo, sino solamente a través de la modelización de las tasas de rendimiento observadasen el fondo en cuestión. La sustitución de un modelo propio de tasas libres de riesgono afectaría la metodología en el resto del trabajo, por lo tanto por cuestiones desimplicidad se consideró la modelización de las tasas de rendimiento como un primerpaso.

2.4.2. Valor presente actuarial

Considere ahora un pago que se hará en una fecha futura aleatoria. En este caso, elfactor de descuento de ese pago será una variable aleatoria, la cual se denotará por Z.Usando los supuestos y notación de la ecuación (2.19), se tiene

Z =T∏

k=1

(1 + ik)−1

donde T es la variable aleatoria que representa el tiempo que transcurrirá para que sedé el pago.

Se tiene entonces la siguiente definición:

Definición 2.4.2 El valor presente actuarial de un monto contingente es la esperanzao valor esperado de la variable aleatoria del valor presente de ese monto.

En un fondo de pensiones, la aleatoriedad de los pagos futuros puede analizarse desdeel punto de vista de la ocurrencia de cada pago. Por ejemplo, suponga que a un tra-bajador activo le faltan n años para jubilarse y que cotiza una suma al final de cadaaño. El que pague cada cotización dependerá del hecho de que en el momento que lecorresponda pagarla el trabajador mantenga su estado de activo. Esta aleatoriedad de

Page 66: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

50 Capítulo 2

los pagos aplica tanto para los flujos que entran al fondo (las cotizaciones de los em-pleados activos) como para los beneficios que paga el fondo a las personas que tienenderecho a estos. Las cuotas que paga cada afiliado a un fondo generalmente cesan en elmomento de su salida del grupo de los activos, ya sea por separación, muerte, invalidezo vejez. Esta fecha de salida es aleatoria, por lo que se vuelve necesario trabajar con lasprobabilidades de salida para cada una de las causas contempladas. Además, esa mismafecha de salida determina el momento en el cual afiliado empieza a recibir un beneficio.

La notación actuarial comúnmente utilizada para las probabilidades mencionadas en elpárrafo anterior es la siguiente:

tq(j)x denota la probabilidad de que una persona de edad x sufra la causa del

decremento j antes de alcanzar la edad x + t o equivalentemente que la sufradentro de t años.

tp(j)x denota la probabilidad de que una persona de edad x sobreviva al decremento

j por al menos t años.

Cuando t = 1 las probabilidades anteriores se denotan q(j)x y p(j)x respectivamente.

Como insumo para el cálculo de las probabilidades anteriores se trabaja con tablas dedecrementos. Una tabla de decremento presenta para cada edad x la correspondienteprobabilidad de que una persona con esa edad sufra el decremento correspondiente enel transcurso de un año. El cálculo de distintas probabilidades a partir de las entradasde estas tablas se puede revisar en [5].

Cuando se quiere representar la probabilidad de que una persona de edad x sobreviva atodos los decrementos por al menos t años se usa la representación tp

(τ)x . Esto se refiere

a la probabilidad de que la persona se mantenga en el grupo de los activos por al menost años.

La técnica para realizar la evaluación actuarial consiste en considerar todos los esce-narios posibles de pagos para cada afiliado. Cada uno de estos pagos se multiplica por

Page 67: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 51

el factor de descuento actuarial para considerar el valor de ese pago en las unidadesmonetarias actuales y la probabilidad de que ocurra ese pago. Por ejemplo, considereun individuo de edad x. El valor presente actuarial de la cotización que pagará cuandotenga x+ t años estaría dado por:

P · vt tp(τ)x

donde P es el pago que se asume realizará, vt representa el descuento por tasa de interésy tp

(τ)x es la probabilidad de que a la edad x + t esa persona aún está activa, es decir,

que haya sobrevivido en los próximos t años a todas las causas de salida.

Debe tenerse en cuenta que el cálculo de un valor presente actuarial depende en granmedida de las políticas y requisitos establecidos por cada fondo de pensiones para quesus afiliados accedan a los beneficios. Si se desea conocer más en detalle la teoría yprocedimientos para realizar este tipo de cálculos se recomienda revisar [5].

2.5. Ajuste de Distribuciones

En esta sección se describen los temas utilizados para realizar el ajuste de una distri-bución teórica a los datos muestrales que se obtendrán a partir de las simulaciones. Eldesarrollo está basado en el libro [17].

El primer concepto es la función de distribución muestral, la cual se construye a partirde los datos observados y cuya definición es la siguiente:

Definición 2.5.1 La función de distribución muestral o empírica está dada por

Fn(x) =número de observaciones ≤ x

n

donde n es el número de observaciones.

Para definir los escenarios pesimistas de la distribución del resultado actuarial se em-plearán medidas de riesgo. Éstas permiten cuantificar el riesgo mediante un mapeo de

Page 68: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

52 Capítulo 2

la variable aleatoria que representa la pérdida a un número real. Las dos medidas quese utilizarán son el valor en riesgo y el valor en riesgo condicional, cuyas definiciones sepresentan a continuación ([17]):

Definición 2.5.2 Sea X una variable aleatoria. El valor en riesgo de X al nivel 100p%,denotado por V aRp(X), es el percentil 100p de la distribución de X. Algebraicamente,este valor debe satisfacer:

Pr(X > V aRp(X)) = 1− p

Definición 2.5.3 Sea X una variable aleatoria. El valor en riesgo condicional de Xal nivel 100p%, denotado por CV aRp(X), es el valor esperado de X dado que su valorexcede el percentil 100p de la distribución de X:

CV aRp(X) = E(X|X > V aRp(X))

En muchos casos, se desea encontrar la distribución teórica que generó los datos obte-nidos. Generalmente, a partir de gráficos o histogramas de la función de distribuciónmuestral se define una distribución teórica tentativa y se aplica una prueba estadísticaque brinde evidencia acerca de la conformidad entre la función muestral y la teórica.Este tipo de pruebas consideran las hipótesis

H0 : Los datos provinieron de una población con el modelo establecido.

H1 : Los datos no provinieron de esa población.

Los estadísticos de prueba corresponden a una medida de la cercanía entre la función dedistribución teórica y la función de distribución muestral. En este trabajo se utilizaránpara este propósito las pruebas de Kolmogorov-Smirnov y de Anderson-Darling. En elcaso de la primera el estadístico está dado por

D = maxx

|Fn(x)− F ∗(x)|

Page 69: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 2 53

donde Fn corresponde la función de distribución muestral y F ∗ es la función de distri-bución teórica. Por otra parte, el estadístico de la prueba de Anderson-Darling es

A2 = −nF ∗(u) + n

k∑j=0

[1− Fn(yj)]2ln[1− F ∗(yj)]− ln[1− F ∗(yj+1)]+

+ nk∑

j=0

Fn(yj)2[lnF ∗(yj+1)− lnF ∗(yj)]

donde los datos observados son t = y0 < y1 < · · · < yk < yk+1 = u.

Los valores críticos de ambos estadísticos se pueden revisar en [17]. De acuerdo con losautores, estos valores críticos son válidos únicamente cuando la hipótesis nula especificael modelo completamente. No obstante, lo más común es que la hipótesis nula establezcael tipo de modelo pero no los parámetros, sino que estos son estimados a partir de losdatos. Esto implica que los estadísticos tienden a ser menores de lo que hubieran sidoen el primer caso y las pruebas de hipótesis se vuelven aproximadas. Esta aproximaciónprovoca que aumente la probabilidad de cometer errores tipo II (concluir que un modeloes adecuado cuando no lo es) y disminuya la probabilidad del error tipo I (rechazar unmodelo adecuado).

Para finalizar, se presenta la definición del tipo de distribuciones teóricas que se buscaráajustar.

Definición 2.5.4 Una variable aleatoria Y es una mezcla de k puntos de las variablesaleatorias X1, X2, . . . , Xk si su función de distribución está dada por

FY (y) = α1FX1(y) + α2FX2(y) + . . .+ αkFXk(y)

donde αj > 0 para todo j y∑k

j=1 αj = 1.

Cuando cada una de las variables X1, X2, . . . , Xk sigue una distribución normal, Y seconoce como mezcla gaussiana.

Page 70: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

54 Capítulo 2

Page 71: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 3

Metodología

En este capítulo se describe la metodología utilizada para obtener los resultados deltrabajo. En la primera parte se expone el proceso de obtención y manipulación de losinsumos para el desarrollo del trabajo. En la segunda sección se describe el procedi-miento general seguido para obtener el modelo de serie de tiempo ajustado para cadavariable. En la tercera sección, se detallan los parámetros utilizados en la evaluaciónactuarial realizada. Finalmente, en la cuarta sección se describe el proceso de ajuste dela distribución teórica a los resultados obtenidos en la evaluación actuarial.

3.1. Obtención de datos

Como se ha mencionado, se busca encontrar modelos tipo ARIMA para ajustar 3 va-riables económicas: el rendimiento del fondo de pensiones, la inflación y el crecimientosalarial. Para las dos primeras se utilizarán modelos univariados que dependen úni-camente del tiempo, mientras que para el crecimiento salarial se optó por ajustar unmodelo multivariado que dependa del tiempo y de la edad de la persona.

Como se señaló en el Capítulo 1, el fondo que se estudiará es hipotético, pero con el finde modelizar la tasa de rendimiento se utilizarán las tasas observadas de rendimientopara un fondo de pensiones real. Para medir el rendimiento de este fondo se utiliza lametodología de valor cuota autorizada por la SUPEN ([26]). Esta variable se trabajará

55

Page 72: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

56 Capítulo 3

en términos reales, es decir, descontando el efecto de la inflación. El Fondo realiza elcálculo del valor cuota con la metodología actual desde el mes de enero de 2007, y elcálculo se realiza mes a mes. El rendimiento en un mes en particular se mide como lavariación de este valor entre el mes en estudio y el mes inmediatamente anterior. Elúltimo dato con el que se disponía para la fecha en la que se inició el análisis es el delmes de mayo de 2015. Se cuenta entonces con 100 observaciones del rendimiento delFondo para ajustar la serie.

En el caso de la inflación, los valores se obtuvieron del sitio web del Banco Centralde Costa Rica ([2]). En esa fuente se encuentra una serie histórica de la inflación queinicia en febrero de 1976. En la Figura 3.1 se muestra el gráfico de la serie. No obstante,como se se puede observar, el comportamiento de la inflación ha sufrido importantesvariaciones a lo largo del tiempo debido a factores externos como cambios en su meto-dología de cálculo y en las políticas económicas y gubernamentales. De acuerdo a unestudio realizado por el Banco Central, en noviembre de 2008 se presenta un quiebreestructural en la serie (ver [9]), por lo que se decidió considerar únicamente los datosde inflación a partir de ese mes. Al igual que con los valores de rendimiento del Fondo,el último dato de inflación con el que se contaba para la fecha en la que se inició elanálisis es el del mes de mayo de 2015. Se cuenta entonces con 79 observaciones de lainflación.

Para la serie de variaciones salariales por productividad, se utilizaron datos transfor-mados de la planilla semanal de los afiliados a un fondo de pensiones real desde enerode 2003. Las variaciones salariales para los afiliados a este fondo se generan a partir dedos efectos:

Aumentos salariales de ley cada 6 meses, los cuales generalmente corresponden ala inflación registrada en el semestre anterior.

Productividad: contempla las variaciones por cualquier motivo distinto a la infla-ción, como los aumentos de categoría profesional y las horas extra trabajadas.

Los montos de los pagos se tienen en forma semanal, por lo que para formar la serie se

Page 73: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 3 57

Tiempo

Infla

ción

1980 1990 2000 2010

−2

02

46

810

Figura 3.1: Gráfico de los valores mensuales de inflación desde Febrero de 1976

toma para cada mes el pago de una de sus semanas para asegurar que las cantidadessean comparables. La decisión de cuál semana tomar para cada uno de los meses sebasó en un análisis exhaustivo de los datos, identificando aquellas que no presentaranpagos particulares. Por ejemplo, generalmente el aumento por inflación rige a partir delos meses de enero y julio de cada año, no obstante, este se define hasta los meses defebrero y agosto respectivamente, por lo que el aumento se aplica en estos meses y enla misma fecha se genera un pago extraordinario que corresponde al retroactivo de losmeses de enero y julio. Luego, para trabajar con incrementos reales (independientes dela inflación), se descontaron los aumentos que se realizan semestralmente para ajustarlos salarios por inflación. Así, el salario real de la persona i para cada mes t se calculacomo:

Page 74: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

58 Capítulo 3

Si,t = SNi,t · fact_desc(t)

donde SNi,t es el salario nominal de la persona i en el mes t y fact_desc(t) es el factor de

descuento en el mes t. Este factor se calcula recursivamente con la siguiente fórmula:

fact_desc(t) = fact_desc(t− 1)

1 + aumento(t)

con la condición inicial fact_desc(0) = 1. Además, aumento(t) representa el aumentopor inflación en el mes t.

Las variaciones salariales por edad se calculan de la siguiente manera: en cada mes tse toman todos los afiliados de edad x que también se encuentran en el mes t + 1 y secompara el promedio de sus salarios en ese mes t con el promedio de sus salarios en elmes t+1. Así, se calcula el porcentaje de incremento o decremento comparando los dospromedios. Algebraicamente se tiene:

yt+1,x =

1nx,t

∑i∈(Ax,t∩Ax,t+1)

Si,t+1 − 1nx,t

∑i∈(Ax,t∩Ax,t+1)

Si,t

1nx,t

∑i∈(Ax,t∩Ax,t+1)

Si,t

=

∑i∈(Ax,t∩Ax,t+1)

(Si,t+1 − Si,t)∑i∈(Ax,t∩Ax,t+1)

Si,t

donde

yt+1,x = variación salarial promedio en el mes t+ 1 para las personas de edad x

Ax,t = conjunto de trabajadores de edad x en el mes t

nx,t = cardinalidad del conjunto Ax,t ∩ Ax,t+1

Si,t = salario real de la persona i en el mes t

Este cálculo se realiza para todos los meses y edades en los que se cuenta con datos. Noobstante, para algunas edades existen muy pocos afiliados, por lo que para no afectarel análisis estadístico se excluyeron las edades menores a 21 y mayores a 51. Al final deeste proceso se obtienen 31 series de tiempo, una para cada edad de las comprendidas

Page 75: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 3 59

en el rango de 21 a 51 años, ambas inclusive. Cada una de estas series posee 148 obser-vaciones, las cuales comprenden el período de febrero de 2003 a mayo 2015.

Como se mencionó, la variable edad posee 31 valores posibles. Esto implica que paraajustar un modelo multivariado, la cantidad de parámetros que se necesitaría estimarsería muy elevada. Por ejemplo, en el caso más simple de un modelo VAR(1) o VMA(1)habría que encontrar una matriz de dimensión 31× 31 para el coeficiente, es decir, 961parámetros y 496 entradas para la matriz de covarianzas del ruido blanco. Debido aesto, se optó por agrupar las edades en categorías para simplificar el modelo. Se aplicóel algoritmo de k-medias para realizar la agrupación, tomando k = 6. La razón para laescogencia de este valor radica en que la cantidad de parámetros a estimar es manejable.Además, este valor de k permitió alcanzar un cierto grado de estabilidad en los gruposobtenidos al comparar con escogencias de k cercanas. Si bien se intentó aplicar algunamedida de escogencia para justificar el valor de k, pruebas preliminares resultaron envalores de k distintos para cada medida. Dado que el estudio y selección de una medidaen particular no se encuentra entre los objetivos de este trabajo, se desistió de esta idea.

3.2. Ajuste de series temporales

El procedimiento de ajuste de las series de tiempo a los datos de rendimiento e inflaciónbásicamente sigue el propuesto por Box y Jenkins y que también es utilizado por variosotros autores (ver por ejemplo [11] para el caso univariado y [30] para el caso multivaria-do), el cual se divide en tres etapas, las cuales se explican en las siguientes subseccionestanto para los modelos univariados como para los multivariados. Cabe resaltar que elprocedimiento es casi el mismo para ambos casos, las diferencias se presentan en laspruebas estadísticas aplicadas y los paquetes y funciones del programa R utilizados.

3.2.1. Series univariadas

El detalle de las tres etapas se presenta a continuación.

Page 76: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

60 Capítulo 3

1. Especificación del modelo

En esta etapa se propone el modelo ARIMA que mejor se ajusta a los datos. Estose decide de dos maneras: cualitativamente usando herramientas exploratorias dedatos y cuantitativamente, a partir de las funciones muestrales de autocorrelación,autocorrelación parcial y autocorrelación extendida para determinar tentativa-mente los órdenes del modelo. Se debe recordar del capítulo anterior que para unmodelo MA(q), la ACF se hace cero a partir del rezago q y para un modelo AR(p)la PACF se hace cero a partir del rezago p. En cuanto a los modelos ARMA(p, q)se puede observar el gráfico de la EACF e identificar el patrón mostrado en elCuadro 2.1 para definir los órdenes apropiados.También en esta etapa se deben aplicar las pruebas ADF y KPSS para decidir sise debe diferenciar la serie.

2. Ajuste del modelo En esta etapa se ejecuta el algoritmo de selección automáticadel modelo ARIMA. Este algoritmo se encuentra implementado en el paqueteforecast para R y el procedimiento que realiza está explicado en [15]. Básicamente,ajusta varios modelos para distintos valores de p, d, q, P,D,Q y selecciona aquelcon el menor criterio de información (el usuario puede seleccionar el criterio AIC,el BIC o el AICc). Para este caso el algoritmo se ejecuta para cada uno de lostres criterios, y si todos escogen el mismo modelo se pasa a la etapa siguiente.De lo contrario, se aplica una prueba de cociente de verosimilitud (en el caso demodelos anidados) para seleccionar el modelo o sino este se define en la etapasiguiente. Dentro del mismo procedimiento, se ejecuta el algoritmo propuesto porChen y Liu ([10]) para detectar datos atípicos (outliers), ya que como se explicóen la sección 2.1.5, con este algoritmo los parámetros del modelo y los efectos delos datos atípicos se estiman en forma conjunta.

3. Diagnóstico del modelo Finalmente, se realiza un análisis de los residuos de elo los modelos seleccionados en la etapa anterior. El estudio verifica:

estacionariedad a través de las pruebas Dickey-Fuller aumentada y KPSS,

Page 77: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 3 61

independencia a través de la prueba Ljung-Box y la función de autocorrela-ción,

normalidad utilizando las pruebas de Shapiro-Wilk y Jarque-Bera.

Si el modelo supera todas las pruebas anteriores se toma como el definitivo. Adi-cionalmente, se revisa si es necesario aplicar un modelo que considere heteroce-dasticidad, para lo cual se examina la independencia de los residuos al cuadradoa través de la función de correlación y la prueba de McLeod-Li. Si se cumple laindependencia, se descartan los modelos heterocedásticos.

Los paquetes de R utilizados en el ajuste univariado son TSA [8], tsoutliers [12], uroot[13] y forecast [15].

3.2.2. Series multivariadas

El detalle de las tres etapas se presenta a continuación.

1. Especificación del modelo

En esta etapa se propone el modelo VARMA que mejor se ajusta a los datos deforma exploratoria. En el caso multivariado se utilizó la estrategia explicada en laSección 2.2.3 para determinar tentativamente los órdenes de un modelo VAR, unmodelo VMA y un modelo VARMA.Para comprobar la estacionariedad de la serie, se aplican las pruebas ADF y KPSSa las series marginales y la prueba de cointegración de Johansen.

2. Ajuste del modelo En esta etapa se deben ajustar modelos VARMA de variosórdenes y seleccionar el que presente mejor ajuste. Se siguieron los siguientespasos:

Se ajusta un modelo VAR(1) y un modelo VAR(2) y se aplica una prueba decociente de verosimilitud para identificar si el modelo con más parámetros(el VAR(2)) presenta un ajuste mejor que el modelo con menos parámetros(el VAR(1)). Si la prueba indica que se debe seleccionar el modelo con menos

Page 78: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

62 Capítulo 3

parámetros se finaliza este paso. De lo contrario, se ajusta un modelo con unorden mayor y se repite el procedimiento hasta que la prueba seleccione elmodelo con menos parámetros.

Se repite el paso anterior con modelos tipo VMA.

Se repite el primer paso con modelos tipo VARMA, iniciando con el modeloVARMA(1,1) y aumentando los valores de p y q individualmente.

Así, se tendrán 3 modelos tentativos: uno tipo VAR, uno tipo VMA y uno tipoVARMA. Para seleccionar uno de los tres se utilizan los criterios de informaciónBIC y AIC.

3. Diagnóstico del modelo Finalmente, se realiza un análisis de los residuos de elo los modelos seleccionados en la etapa anterior. El estudio verifica:

estacionariedad a través de las pruebas Dickey-Fuller aumentada y KPSSaplicadas a los residuos marginales y la prueba de Johansen para cointegra-ción,

independencia a través de la prueba Ljung-Box,

multinormalidad utilizando las pruebas de Mardia, Henze-Zirkler y de Roys-ton.

Si el modelo supera todas las pruebas anteriores se toma como el definitivo. Adi-cionalmente, se revisa si es necesario aplicar un modelo que considere heteroce-dasticidad, para lo cual se ejecuta la prueba de McLeod-Li.

Los paquetes de R utilizados en el ajuste multivariado son MVN [18], urca [21] y MTS[31].

Una vez obtenido el modelo para cada una de las variables, se procede a ejecutar 10000simulaciones de cada una de éstas (rendimiento, inflación y variación salarial) para unperíodo de 1380 meses, lo cual corresponde a 115 años. Este es el período de tiemponecesario para llevar a todas las vidas del colectivo hasta el último año de vida de la

Page 79: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 3 63

tabla de mortalidad empleada.

Dado que la evaluación actuarial considera períodos anuales, se deben transformar lastasas mensuales correspondientes a cada una de las variables en tasas anuales equiva-lentes, lo cual se realiza de la siguiente manera:

i(a)t =

12∏j=1

(1 + i(m)t,j )− 1

donde i(a)t es la tasa anual para el año t e i(m)t,j es la tasa mensual para el mes m del año

t.

3.3. Evaluación actuarial

En esta sección se describe el procedimiento, los supuestos y los insumos utilizados pararealizar la evaluación actuarial del fondo de pensiones hipotético. Se aclara que si bienalgunos de los datos de entrada están basados en datos de un fondo de pensiones real,se aplicaron transformaciones a los insumos y se modificó el perfil de beneficios. Loanterior implica que los resultados que se obtendrán no son de ningún modo aplicablesal fondo que facilitó los datos.

3.3.1. Perfil de beneficios y requisitos

Cada trabajador aporta el 5% de su salario y el patrono el 10% del mismo, por lo queen total el Fondo se financia con el 15% de los salarios de todos los afiliados activos,además de los rendimientos de las carteras del Fondo.

Los beneficios se determinan sobre un salario de referencia, equivalente al promedioaritmético del valor actual de los salarios recibidos en los 25 años anteriores de la fechade pensión. En caso de que la persona tenga menos de 25 años de cotizar, se toma estepromedio sobre los salarios que se tengan.

Page 80: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

64 Capítulo 3

Se consideran dos tipos de beneficios: uno por vejez y uno por muerte. Para tener de-recho a los beneficios de jubilación por vejez, el integrante tiene que haber alcanzadolos 62 años de edad y haber cotizado al menos 10 años al Fondo. El beneficio a recibirserá igual al 10% del salario de referencia si cuenta con diez años cotizados. El montoanterior se incrementará en un 0,125% del salario de referencia por cada mes cotizadodespués de los primeros diez años.

Con respecto a la pensión por sucesión, si el afiliado tiene más de 10 años de cotizaral Fondo, en caso de fallecimiento de éste las siguientes personas tendrán derecho apensión:

Cónyuge (hasta que establezca un nuevo vínculo matrimonial o unión de hecho)

Hijos menores de 18 años

Hijos con edades entre 18 y 25 que se mantengan estudiando

Hijos de cualquier edad que sufran alguna discapacidad

El beneficio a otorgar para todas las personas que tengan derecho dependerá de la pen-sión que hubiere recibido el integrante si se hubiese jubilado a la hora de su fallecimientoo bien, del monto de la jubilación o pensión que venía disfrutando en caso de que ya noestuviera activo. El detalle de la división es el siguiente:

Cuando no existan sobrevivientes por orfandad, le corresponderá un 70% al cón-yuge o conviviente supérstite.

Cuando exista un único beneficiario a la pensión por orfandad, y además hayaderecho de sucesión por viudez, le corresponderá un 50% al cónyuge o convivientesupérstite del causante y un 20% para el hijo único con derecho.

Cuando existan dos o más hijos con derecho a la pensión por orfandad y ademásconcurra un derecho de pensión por viudez, le corresponderá un 40% al cónyugeo conviviente supérstite del causante y se distribuirá un 30% proporcionalmenteentre los hijos con derecho.

Page 81: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 3 65

Cuando existan solo hijos con derecho a una pensión por orfandad, se prorrateaentre ellos en forma equivalente al 70%, del monto.

3.3.2. Insumos

Las tablas de mortalidad utilizadas son las establecidas en el Reglamento de Ta-blas de Mortalidad de la SUPEN ([28]).

Las características de los miembros activos y los que actualmente reciben bene-ficios fueron proporcionadas por la dirección del Fondo. La información de losmiembros activos incluye la fecha de nacimiento, sexo, salario actual semanal,régimen salarial en el que se encuentra, la fecha de ingreso al Fondo y la fechaestimada de pensión por vejez. En el caso de los beneficiarios actuales, se cuentacon la fecha de nacimiento, la fecha en la que empezó a recibir el beneficio, elbeneficio inicial y el beneficio actual, ambos en forma mensual. La fecha de cortede esta información es el 30 de junio de 2015. Estos datos demográficos fueronlos que se tomaron para el análisis con el fin de hacer la composición demográficamás cercana a la realidad.

Los datos de proporción de miembros casados, el número promedio de hijos decada uno y la edad promedio de éstos fueron propocionados por el Fondo.

3.3.3. Supuestos

A continuación se presentan los supuestos que se incorporaron en la programación dela evaluación:

Los empleados cotizan durante el año con base en 13 salarios, que corresponde alos 12 meses del año y el salario escolar.

Los beneficios corresponden a 13 pagos por año: uno por mes y el aguinaldo.

Los salarios se actualizan de acuerdo a la inflación y por productividad según elmodelo VARMA que se seleccionará.

Page 82: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

66 Capítulo 3

Se trabajará con una población cerrada, lo cual significa que se asume que no in-gresan nuevos afiliados al Fondo. Se optó por utilizar este supuesto para simplificarel cálculo y reducir el tiempo de ejecución de los programas utilizados.

La metodología de revalorización de pensiones con respecto a la inflación es lasiguiente:

• Los derechos que actualmente se encuentren en el monto mínimo (¢192 mil)se incrementarán un 100% de la inflación. Se escogió este monto debido aque es el utilizado por el Fondo.

• Los derechos de los demás beneficiarios aumentan cada año un 50% de lainflación.

La edad máxima de sobrevivencia es 115 años.

Se asume que todos los miembros activos se acogen a la pensión por vejez a laedad de 62 años. En el caso de personas que se encuentran laborando a la fechay tienen más de 62 años, se asume que se pensionan inmediatamente.

Se asume que todos los huérfanos del afiliado mantienen los beneficios hasta laedad de 25 años.

No se consideran los beneficios vitalicios de huérfanos con alguna discapacidad.

Se asume que el cónyuge que recibe un beneficio por sucesión lo conserva hastasu muerte, es decir, no se considera el hecho de que se vuelva a casar o establezcauna unión de hecho.

No se consideran los gastos administrativos del fondo.

Se asume que todas las contingencias ocurren a final de año.

Para descontar tanto los activos como los pasivos se utiliza el rendimiento delfondo y no un rendimiento benchmark de mercado con el fin de facilitar el cálculoy reducir el tiempo de ejecución del programa.

Page 83: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 3 67

3.3.4. Cálculos realizados

A continuación se presenta el procedimiento seguido para realizar la evaluación actua-rial. La implementación se realizó en el programa Matlab. Los cálculos de los beneficiosy contribuciones se realizaron de manera separada para la población de miembros acti-vos y los que en la fecha actual reciben un beneficio.

La notación a utilizar es la siguiente:

inflt es el valor de la inflación anual en el año t,rt es la tasa anual de rendimiento real del fondo en el año t,it = rt(1+ inflt)+ inflt es la tasa de interés anual que considera el efecto de la inflaciónen el año t,vt,i =

∏tk=1(1+ ik)

−1 es el factor de descuento para el año t usando la tasa que contieneel efecto de la inflación,vt,r =

∏tk=1(1 + rk)

−1 es el factor de descuento para el año t usando la tasa de rendi-miento del fondo,porc corresponde al porcentaje de incremento del beneficio con respecto a la inflación:

porc =

1 si PA = 192000

0,5 de lo contrario

donde PA es el valor de la pensión que recibe actualmente el beneficiario.

La siguiente función representa el valor presente actuarial del beneficio futuro de unafiliado de edad x el cual se encuentra actualmente recibiendo un beneficio de 1 queaumenta todos los años un cierto porcentaje de la inflación y se extinguirá cuando elafiliado muera o dentro de n años, lo que ocurra primero:

a(x, n) =n−1∑t=0

(1 + porc · inflt+1)t vt+1,i tpx

Por convención, la función anterior se toma como cero cuando n < 1.

Page 84: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

68 Capítulo 3

Beneficiarios actuales

Estos individuos se separaron en dos grupos según el motivo por el cual disfrutan elbeneficio:

Sucesión

Vejez

La proyección se realiza individualmente para cada beneficiario, considerando el tipo debeneficio y la revalorización de éste de acuerdo a los criterios mencionados anteriormen-te. El monto de pensión de los beneficiarios actuales se asume como una transformaciónde los montos reales percibidos por los beneficiarios del Fondo. Por motivos de confi-dencialidad, esta transformación no se especifica en este trabajo.

El valor presente de los beneficios por sucesión para un viudo o viuda de edad y que enel momento en el que se realiza la evaluación se encuentra recibiendo un beneficio es lasiguiente:

V PAwy = 13 · PA · a(y, 115− y)

donde PA corresponde a la pensión actual del viudo o viuda.

El valor presente de los beneficios por sucesión para un huérfano de edad z que en elmomento en el que se realiza la evaluación se encuentra recibiendo un beneficio es lasiguiente:

V PAoz = 13 · PA · a(z, 25− z)

donde PA corresponde a la pensión actual del huérfano.

Para el valor presente actuarial de un afiliado de edad x que actualmente recibe unbeneficio por vejez, la fórmula es la siguiente:

Page 85: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 3 69

V PAvx = 13 · PA

[a(x, 115− x) +

115−x−1∑t=0

(1 + porc · inflt+1)t vt+1,i tpx qx+t·

·[pcony · a(yt, 115− yt) + phij · a(zt, 25− zt)

]]

donde pcony corresponde al porcentaje del beneficio original que le corresponde al cónyu-ge, phij es el porcentaje del beneficio original que se le reparte a los hijos con derecho, ytes la edad promedio del cónyuge de una persona de edad x+ t y zt es la edad promediode los hijos de una persona de edad x+ t.

Miembros activos

Esta población se subdividió en dos grupos de acuerdo al sexo. Para cada uno de losgrupos se promediaron por edad los salarios y los años de servicio. Así, los cálculos serealizaron por edad para una persona “promedio”. Luego, se multiplicaron los resultadosobtenidos por el número de individuos de la edad correspondiente. El monto de sala-rio de los afiliados cotizantes se asume como una transformación de los montos realespercibidos por los afiliados cotizantes del Fondo. Por motivos de confidencialidad, estatransformación no se especifica en este trabajo.

Para obtener el valor presente actuarial de las cotizaciones se usó el siguiente cálculo:

V PAcotizx = 0,15 · 13 · SA ·

62−x−1∑t=0

(1 + incr(x+ t, t+ 1)) vt+1,r tpx

donde incr(x, t) corresponde al porcentaje de incremento salarial real de una personade edad x en el año t y SA es el salario actual.

Por otra parte, el valor presente actuarial de los beneficios por vejez y muerte despuésde la jubilación para un activo cotizante corresponde a

Page 86: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

70 Capítulo 3

V PAa,vx = 13 · SA · vk+1,r kpx ·Bk

[a(x+ k, 115− x− k)+

+115−x−k−1∑

t=0

(1 + porc · inflt+k+1)t vt+k+1,i tpx+k qx+k+t·

·[pcony · a(yt+k, 115− yt+k) + phij · a(zt+k, 25− zt+k)

]]

donde k = max(0, 62 − x) es la cantidad de años restantes para la jubilación y Bk

corresponde al beneficio que se obtendría en la fecha de jubilación.

Finalmente, el valor presente actuarial de los beneficios por muerte antes de la jubilaciónpara el mismo activo se calcula como:

V PAa,mx =

62−x−1∑k=0

13 · SA · vk+1,r kpx ·Bk·

·

[115−x−k−1∑

t=0

(1 + porc · inflt+k+1)t vt+k+1,i tpx+k qx+k+t·

·[pcony · a(yt+k, 115− yt+k) + phij · a(zt+k, 25− zt+k)

]]

Balance Actuarial

El balance es el resultado final de la evaluación, este valor es el que indica si los activosfuturos podrán cubrir los pasivos futuros. Su cálculo es el siguiente

BA = V PAcotiz +Reserva− V PAs − V PAv − V PAa,v − V PAa,m

donde:V PAcotiz es el valor presente actuarial de todas las cotizaciones futuras.

Page 87: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 3 71

V PAs es el valor presente actuarial de todos los beneficios actuales por sucesión.V PAv es el valor presente actuarial de todos los beneficios actuales por vejez.V PAa,v es el valor presente actuarial de todos los beneficios por vejez para los afiliadosactualmente activos.V PAa,m es el valor presente actuarial de todos los beneficios por muerte para los afilia-dos actualmente activos.Reserva es el valor de la reserva disponible en el momento de la evaluación. Este montoes ficticio y no corresponde a la reserva del fondo real que facilitó los datos.

Según el valor de BA, así será el estado del fondo: si es positivo se dice que posee unsuperávit, si es negativo se dice que tiene déficit y si es cero se dice que está en equilibrio.

3.4. Ajuste de distribución teórica

Se ejecutaron 10000 evaluaciones del fondo, una por cada escenario de simulación delas variables estocásticas. Luego, se construyó la función de distribución empírica parasu análisis y se definieron los siguientes valores de interés:

Promedio de la distribución (Escenario esperado).

Valor en Riesgo (VaR) al 95% y al 99%.

Valor en Riesgo condicional (CVaR) al 95% y al 99% (Escenarios pesimistas).

Cuantil al 25% (Escenario optimista).

Adicionalmente, se intentó encontrar una distribución teórica que aproxime la distri-bución empírica obtenida. Usando como base los gráficos de la densidad de la muestra,se optó por utilizar distribuciones tipo mezcla para el ajuste. Tomando en cuenta elsoftware disponible, se limitó el análisis a mezclas gaussianas. Para esto se utilizó el pa-quete de R denominado mixtools [4], el cual hace uso del algoritmo EM para estimar losparámetros de la mezcla. La descripción del algoritmo se encuentra en [4]. El paquete

Page 88: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

72 Capítulo 3

citado no estima la cantidad de componentes de la mezcla, denotada por k, sino queeste valor debe indicarlo el usuario como un parámetro de entrada.

La función del paquete se ejecutó para varios valores de k y se aplicaron las pruebasde Kolmogorov-Smirnov y Anderson-Darling para evaluar el ajuste. Esta última se en-cuentra implementada en el paquete ADGofTest [3] de R. Con el mismo propósito seutilizaron los gráficos QQ. Finalmente, para la selección de k se utilizaron los criteriosde información BIC y AIC y pruebas de cociente de verosimilitud.

Page 89: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4

Desarrollo

Este capítulo presenta los resultados que se obtuvieron en el desarrollo del trabajo.Está dividido en cuatro apartados: los tres primeros describen el proceso de obtenciónde la serie de tiempo para cada una de las variables económicas (rendimiento del Fondo,inflación y variación salarial por productividad) y el último presenta los resultados dela evaluación actuarial.

4.1. Rendimiento del Fondo

4.1.1. Especificación del modelo

Se cuenta con 100 observaciones de este valor desde febrero de 2007 hasta mayo de 2015(una por mes). En la Figura 4.1 se muestra el comportamiento de la serie a través deltiempo. Se puede notar el efecto que tuvo en los rendimientos la crisis económica delaño 2008. Con base en el gráfico, parece que la serie es estacionaria.

Lo primero que se hizo fue aplicar las pruebas de estacionariedad: la Dickey-Fuller au-mentada (ADF) y la KPSS. Los resultados en ambos casos presentan evidencia de quela serie es estacionaria. Esto se observa en el Cuadro 4.1. Se debe recordar que la hi-pótesis nula de la prueba ADF es que la serie tiene una raíz unitaria, mientras que lahipótesis nula de la prueba KPSS es que la serie es estacionaria.

73

Page 90: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

74 Capítulo 4

Tiempo

Ren

dim

ient

os

2008 2010 2012 2014

−0.

010.

000.

010.

02

Figura 4.1: Gráfico de los valores mensuales de rendimiento del Fondo

Page 91: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 75

Prueba Estadístico Valor pADF -0,613 0,01KPSS 0,4362 0,06156

Cuadro 4.1: Resultados de las pruebas de raíz unitaria para la serie de rendimientosmensuales del Fondo

Seguidamente, se procede a analizar las funciones muestrales de autocorrelación. En laFigura 4.2 se observa la función de autocorrelación muestral de la serie de rendimientosy en la Figura 4.3 la función de autocorrelación parcial. Las bandas discontinuas enambas figuras se encuentran colocadas en cero más y menos dos errores estándar delas autocorrelaciones muestrales, por lo que representan pruebas individuales de auto-correlación. Así, se consideran significativos aquellos rezagos que se encuentran fueradel rango definido por estas líneas. En el caso de la ACF sólo es significativo el primerrezago, por lo que se podría considerar un modelo MA(1). Por otra parte, la PACFsugiere un modelo AR(1), ya que únicamente el primer rezago es significativo.

La función de autocorrelación extendida (EACF) mostrada en la Figura 4.4 sugiereun modelo MA(1). Finalmente, la función armasubsets del paquete TSA selecciona unmodelo AR(1). Esto se observa en la Figura 4.5.

Page 92: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

76 Capítulo 4

2 4 6 8 10 12 14 16 18 20

−0.

2−

0.1

0.0

0.1

0.2

Lag

AC

F

Figura 4.2: Función de autocorrelación de los valores mensuales de rendimiento delFondo

Page 93: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 77

2 4 6 8 10 12 14 16 18 20

−0.

2−

0.1

0.0

0.1

0.2

Lag

Par

tial A

CF

Figura 4.3: Función de autocorrelación parcial de los valores mensuales de rendimientodel Fondo

AR/MA

0 1 2 3 4 5 6 7 8 9 10 11 12 13

0 x o o o o o o o o o o o o o

1 x o o o o o o o o o o o o o

2 x o o o o o o o o o o o o o

3 o o x o o o o o o o o o o o

4 x o o o o o o o o o o o o o

5 x o o o o o o o o o o o o o

6 x x o x o o o o o o o o o o

7 x o x x o o o o o o o o o o

Figura 4.4: Función de autocorrelación extendida de los valores mensuales de rendi-miento del Fondo

Page 94: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

78 Capítulo 4

BIC

(Int

erce

pt)

test

−la

g1te

st−

lag2

test

−la

g3te

st−

lag4

test

−la

g5te

st−

lag6

test

−la

g7te

st−

lag8

test

−la

g9te

st−

lag1

0te

st−

lag1

1te

st−

lag1

2er

ror−

lag1

2er

ror−

lag1

erro

r−la

g2er

ror−

lag3

erro

r−la

g4er

ror−

lag5

erro

r−la

g6er

ror−

lag7

erro

r−la

g8er

ror−

lag9

erro

r−la

g10

erro

r−la

g11

34

30

26

22

18

15

12

9

6.5

Figura 4.5: Resultado de la función armasubsets para los valores mensuales de rendi-miento del Fondo

Page 95: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 79

Modelo ARIMA(1,0,0)ar1 intercepto TC10 AO22

Coeficiente 0,2600 0,0049 -0,0186 -0,0239Error est. 0,1005 0,0007 0,0046 0,0051

σ2 2,734e-05

Cuadro 4.2: Modelo seleccionado para la serie de rendimientos mensuales del Fondo

4.1.2. Ajuste del modelo

Para esta etapa se ejecutó el algoritmo del paquete forecast junto con la función parabuscar puntos atípicos del paquete tsoutliers. Se hicieron corridas usando los criteriosAIC, BIC y AICc. Los tres dieron como resultado el mismo modelo: un autorregresivode orden 1 con dos datos atípicos. En la Figura 4.6 se muestran los outliers encontrados,mientras que los parámetros del modelo se presentan en el Cuadro 4.2.

Dado que los tres criterios seleccionaron el mismo modelo, se procede a la etapa dediagnóstico del modelo.

Page 96: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

80 Capítulo 4

Original and adjusted series

−0.

010

0.01

Outlier effects

−0.

025

−0.

010

0 20 40 60 80 100

Figura 4.6: Efecto de los puntos atípicos en los valores mensuales de rendimiento delFondo

Page 97: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 81

Prueba Estadístico Valor pADF -0,971 0,01KPSS 0,0768 0,1

Cuadro 4.3: Resultados de las pruebas de raíz unitaria para los residuos del modelo dela serie de rendimientos del Fondo

4.1.3. Diagnóstico del modelo

Como se explicó en el capítulo de Metodología, se debe analizar el ajuste del modelo alos datos, lo cual se logra a través del estudio de los residuos. Primero, se les aplican laspruebas de estacionaridad ADF y KPSS, cuyos resultados se muestran a continuación.Como se puede ver en el Cuadro 4.3, la evidencia estadística señala que los residuos sonestacionarios.

Luego, se estudia la independencia de los residuos. La Figura 4.7 muestra tres herra-mientas de diagnóstico: en la parte superior se presenta el gráfico de los residuos, enla parte del medio se grafica la función de autocorrelación muestral de éstos y en laparte inferior se muestran los valores p obtenidos al aplicar la prueba de Ljung-Boxpara distintos rezagos. Para esta prueba se maneja un nivel de significancia de 5%. Losresultados no presentan evidencia de que haya problemas con la independencia de losresiduos.

Finalmente, se aplican los tests de normalidad a los residuos. En la Figura 4.8 se ob-serva el gráfico QQ de los residuos. Pareciera haber un leve problema en las colas, noobstante, en los resultados de las pruebas de Shapiro-Wilk y de Jarque-Bera mostradosen el Cuadro 4.4 no se rechaza la hipótesis de normalidad.

Para revisar si es necesaria la aplicación de un modelo heterocedástico, se obtuvo lafunción de autocorrelación muestral de los residuos al cuadrado mostrada en la Figura4.9. Ningún rezago es significativo, por lo que no hay evidencia de heterocedasticidad.Adicionalmente, los valores p de la prueba de McLeod-Li graficados en la Figura 4.10

Page 98: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

82 Capítulo 4

Time

Sta

ndar

dize

d R

esid

uals

0 20 40 60 80 100

−3

03

2 4 6 8 10 12 14

−0.

20.

1

Lag

AC

F o

f Res

idua

ls

2 4 6 8 10 12 14

0.0

0.6

Number of lags

P−

valu

es

Figura 4.7: Diagnósticos de los residuos del modelo de la serie de rendimientos del Fondo

Prueba Estadístico Valor pShapiro-Wilk 0,9869 0,4305Jarque-Bera 1,0915 0,5794

Cuadro 4.4: Resultados de las pruebas de normalidad aplicadas a los residuos del modelode la serie de rendimientos del Fondo

Page 99: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 83

−2 −1 0 1 2

−0.

02−

0.01

0.00

0.01

0.02

Normal Q−Q Plot

Theoretical Quantiles

Sam

ple

Qua

ntile

s

Figura 4.8: Gráfico QQ de los residuos del modelo de la serie de rendimientos del Fondo

Page 100: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

84 Capítulo 4

5 10 15 20

−0.

2−

0.1

0.0

0.1

0.2

Series residuals(modauto$fit)^2

Lag

AC

F

Figura 4.9: Función de autocorrelación muestral de los residuos al cuadrado del modelode la serie de rendimientos del Fondo

son mayores a 5% por lo que no se puede puede rechazar la hipótesis nula bajo cada unode los rezagos. Con base en estos resultados, no se considera un modelo heterocedásticopara el rendimiento del Fondo.

Page 101: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 85

5 10 15

0.0

0.2

0.4

0.6

0.8

1.0

Lag

P−

valu

e

Figura 4.10: Valores p de la prueba de McLeod-Li de los residuos del modelo de la seriede rendimientos del Fondo

Page 102: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

86 Capítulo 4

Tiempo

Infla

ción

2009 2010 2011 2012 2013 2014 2015

−0.

50.

00.

51.

01.

5

Figura 4.11: Gráfico de los valores mensuales de inflación

4.2. Inflación Mensual

4.2.1. Especificación del modelo

Como se explicó en el capítulo de Metodología, se va a trabajar con 79 datos de lainflación correspondientes al período de noviembre de 2008 hasta mayo de 2015 (unopor mes). En la Figura 4.11 se muestra el gráfico de la serie a partir de noviembre de2008. Con base en el gráfico, parece que la serie es estacionaria.

Se inicia el análisis aplicando las pruebas de estacionariedad Dickey-Fuller aumentada(ADF) y la KPSS. La prueba ADF presenta evidencia de que la serie podría no serestacionaria. No obstante, el resultado de la prueba KPSS señala que no se debe recha-zar la hipótesis nula de estacionariedad. Ambos resultados se muestran en el Cuadro 4.5.

Page 103: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 87

Prueba Estadístico Valor pADF -0,597 0,075KPSS 0,1968 0,1

Cuadro 4.5: Resultados de las pruebas de raíz unitaria para la serie de inflación

Al igual que en la serie anterior, se procede a analizar las funciones muestrales de auto-correlación. En la Figura 4.12 se observa la función de autocorrelación de la inflación.Solamente los rezagos 1, 7, 8 y 9 son significativos, por lo que esta función parece sugerirun modelo MA(9). Por otra parte, en la función de autocorrelación parcial (Figura 4.13)únicamente el primer rezago es significativo, por lo que sugiere un modelo AR(1).

La función de autocorrelación extendida (EACF) mostrada en la Figura 4.14 tambiénsugiere ajustar un modelo AR(1). Finalmente, la función armasubsets del paquete TSAindica que el modelo debe incluir el noveno rezago y tal vez el rezago de error número7. Esto se observa en la Figura 4.15.

Page 104: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

88 Capítulo 4

5 10 15 20

−0.

2−

0.1

0.0

0.1

0.2

Lag

AC

F

Figura 4.12: Función de autocorrelación de los valores mensuales de inflación

Page 105: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 89

5 10 15 20

−0.

2−

0.1

0.0

0.1

0.2

Lag

Par

tial A

CF

Figura 4.13: Función de autocorrelación parcial de los valores mensuales de inflación

AR/MA

0 1 2 3 4 5 6 7 8 9 10 11 12 13

0 x o o o o o x o o o o o o o

1 o o o o o o o o o o o o o o

2 x o o o o o o o o o o o o o

3 x o o o o o o o o o o o o o

4 x o o o o o o o o o o o o o

5 x o o o o o o o o o o o o o

6 x o o o o o o o o o o o o o

7 x o x o o o o o o o o o o o

Figura 4.14: Función de autocorrelación extendida de los valores mensuales de inflación

Page 106: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

90 Capítulo 4

BIC

(Int

erce

pt)

test

−la

g1te

st−

lag2

test

−la

g3te

st−

lag4

test

−la

g5te

st−

lag6

test

−la

g7te

st−

lag8

test

−la

g9te

st−

lag1

0te

st−

lag1

1te

st−

lag1

2er

ror−

lag1

erro

r−la

g2er

ror−

lag3

erro

r−la

g4er

ror−

lag5

erro

r−la

g6er

ror−

lag7

erro

r−la

g8er

ror−

lag9

erro

r−la

g10

erro

r−la

g11

erro

r−la

g12

12

10

7.4

5.2

3.2

1.4

−0.47

−0.67

Figura 4.15: Resultado de la función armasubsets para los valores mensuales de inflación

Page 107: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 91

Modelo ARIMA(1,0,1)ar1 ma1 intercepto

Coeficiente -0,5382 0,8216 0,3561Error est. 0,1970 0,1320 0,0534

σ2 0,161

Cuadro 4.6: Modelo seleccionado por los criterios AIC y AICc para la serie de inflación

Modelo ARIMA(0,0,1)ma1 intercepto

Coeficiente 0,2819 0,3551Error est. 0,1295 0,0587

σ2 0,1665

Cuadro 4.7: Modelo seleccionado por el BIC para la serie de inflación

4.2.2. Ajuste del modelo

Luego, se ejecutó el algoritmo del paquete forecast junto con la función para buscarpuntos atípicos del paquete tsoutliers. Se hicieron corridas usando los criterios AIC,BIC y AICc. Los criterios AIC y AICc escogen un modelo ARMA(1,1) sin puntosatípicos, el cual se muestra en el Cuadro 4.6. El criterio BIC selecciona un modelo MAde orden 1 sin puntos atípicos, mostrado en el Cuadro 4.7.Al comparar ambos modelos, se observa que en el modelo MA(1) los valores de AIC yAICc son ligeramente mayores pero el valor del BIC es ligeramente menor. Para escogeruno de los modelos se optó por aplicar una prueba de cociente de verosimilitud, debidoa que el modelo ARIMA(0,0,1) es un caso particular del modelo ARIMA(1,0,1) cuandose restringe el coeficiente del primer rezago a valer cero. El valor p de esta prueba es0.118976, por lo que con un nivel de confianza de 95% el valor del coeficiente del primerrezago no se considera significativo y se selecciona el modelo MA(1).

Page 108: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

92 Capítulo 4

Prueba Estadístico Valor pADF -0,786 0,01KPSS 0,1893 0,1

Cuadro 4.8: Resultados de las pruebas de raíz unitaria aplicadas a los residuos delmodelo de inflación

Prueba Estadístico Valor pShapiro-Wilk 0,9852 0,4928Jarque-Bera 0,7736 0,6792

Cuadro 4.9: Resultados de las pruebas de normalidad para los residuos del modelo dela serie de inflación

4.2.3. Diagnóstico del modelo

Una vez seleccionado el modelo, se debe analizar su ajuste a los datos, para lo cualse procede a estudiar los residuos. Primero, se les aplica las pruebas de estacionaridadADF y KPSS, ambas presentan evidencia a favor de la estacionariedad de los residuos.Los resultados se presentan en el Cuadro 4.8.

Luego, se estudia la independencia de los residuos. La Figura 4.16 muestra tres herra-mientas de diagnóstico: en la parte superior se presenta el gráfico de los residuos, enla parte del medio se grafica la función de autocorrelación muestral de éstos y en laparte inferior se muestran los valores p obtenidos al aplicar la prueba de Ljung-Boxpara distintos rezagos. Los resultados no presentan evidencia de que haya problemascon la independencia.

Finalmente, se aplican los tests de normalidad a los residuos. En la Figura 4.17 seobserva el gráfico QQ de los residuos. Pareciera haber un leve problema en las colas,no obstante, en los resultados de las pruebas de Shapiro-Wilk y de Jarque-Bera no serechaza la hipótesis de normalidad, como se puede observar en el Cuadro 4.9.

Para revisar si es necesaria la aplicación de un modelo heterocedástico, se obtuvo la

Page 109: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 93

Time

Sta

ndar

dize

d R

esid

uals

0 20 40 60 80

−2

02

2 4 6 8 10 12 14

−0.

20.

1

Lag

AC

F o

f Res

idua

ls

2 4 6 8 10 12 14

0.0

0.6

Number of lags

P−

valu

es

Figura 4.16: Diagnósticos de los residuos del modelo de la serie de inflación

Page 110: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

94 Capítulo 4

−2 −1 0 1 2

−1.

0−

0.5

0.0

0.5

1.0

Normal Q−Q Plot

Theoretical Quantiles

Sam

ple

Qua

ntile

s

Figura 4.17: Gráfico QQ de los residuos del modelo de la serie de inflación

Page 111: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 95

5 10 15

0.0

0.2

0.4

0.6

0.8

1.0

Lag

P−

valu

e

Figura 4.18: Función de autocorrelación muestral de los residuos al cuadrado del modelode la serie de inflación

función de autocorrelación muestral de los residuos al cuadrado mostrada en la Figura4.18. Ningún rezago es significativo, por lo que no hay evidencia de heterocedasticidad.Adicionalmente, los valores p de la prueba de McLeod-Li graficados en la Figura 4.19son mayores a 5% por lo que no se puede puede rechazar la hipótesis nula bajo cada unode los rezagos. Con base en estos resultados, no se considera un modelo heterocedásticopara la inflación.

Page 112: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

96 Capítulo 4

5 10 15

−0.

2−

0.1

0.0

0.1

0.2

Series residuals(modauto$fit)^2

Lag

AC

F

Figura 4.19: Valores p de la prueba de McLeod-Li de los residuos del modelo de la seriede inflación

Page 113: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 97

4.3. Variaciones salariales

4.3.1. Especificación del modelo

Se cuenta con 148 observaciones de este valor desde febrero de 2003 hasta mayo de 2015(una por mes y por grupo de edad). En la Figura 4.20 se observan las series marginalespara cada grupo de edad.

El agrupamiento seleccionado por el algoritmo de k-medias para k = 6 se muestra enel Cuadro 4.10.

Grupo Edades1 212 223 23, 264 24, 25, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 38, 395 37, 40, 41, 42, 43, 44, 45, 46, 47, 48, 50, 516 49

Cuadro 4.10: Grupos generados por el algoritmo de k-medias para k = 6

Las edades que no formaron parte del proceso anterior debido a la falta de datos seinsertaron en el grupo con la edad más cercana: las menores a 21 entraron en el grupo1 y las mayores a 51 en el grupo 5.

Luego, se procedió a aplicar el proceso de preblanqueo para determinar si existe de-pendencia entre las 6 series marginales. Como se mencionó en el marco teórico, seencontraron dos procedimientos distintos para realizar el preblanqueo en dos fuentesdistintas, por lo que se decidió aplicar ambos. En el Cuadro 4.11 se muestran los rezagosde las correlaciones cruzadas entre las 6 series que resultaron significativos aplicando elprocedimiento descrito por Cryer y Chan [11]. La entrada NA indica que la correlación

Page 114: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

98 Capítulo 4

0 50 100 150

−6

−4

−2

02

46

Grupo 1

0 50 100 150

−1

01

2

Grupo 2

0 50 100 150

−2

02

4

Grupo 3

0 50 100 150

−6

−4

−2

02

4

Grupo 4

0 50 100 150

−2

−1

01

2

Grupo 5

0 50 100 150

−2

02

4

Grupo 6

Figura 4.20: Gráfico de las series de variaciones salariales para cada grupo de edad

Page 115: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 99

cruzada entre esas dos series no tiene ningún rezago significativo. El Cuadro 4.12 pre-senta los mismos resultados pero usando el procedimiento recomendado por Brockwelly Davis [7]. En ambos casos se observa que las correlaciones justifican la aplicación deun modelo multivariado de series de tiempo.

Grupo 1 2 3 4 5 61 0 -10, 0 -11, -4, -2, 0, 4 -17, 0, 3 -2 -10, -32 0, 3, 4, 10 0 -4, 0, 1 8 -9, 0, 1 0, 13 0, 2, 11 -1, 0 0 -15, -1, 0, 9 -1, 0 14 -2, 0, 2 -8 -9, 0, 1, 15 0 NA NA5 4 0, 9 0, 1 NA 0 -17, 06 3, 10, 12 0 -1 13, 17 0, 17 -17, -13, 0, 13, 17

Cuadro 4.11: Rezagos significativos de la función muestral de correlación cruzada deacuerdo al procedimiento de Cryer y Chan

Grupo 1 2 3 4 5 61 0 -10, 9 -11, 0 4, 8 -4, -2, 3 -10, -32 -9, 10 -8, 0, 8 0 NA -4, 0, 1, 8 -17, 0, 1, 73 0, 11 0 0 -15, 1 0, 17 1, 6, 74 -8, -4 NA -1, 15 0 -15, -9 NA5 -3, 2, 4 -8, -1, 0, 4 -17, 0 9, 15 0 -17, -6, 0, 16 3, 10 -7, -1, 0, 17 -7, -6, -1 NA -1, 0, 6, 17 -17, 0, 17

Cuadro 4.12: Rezagos significativos de la función muestral de correlación cruzada deacuerdo al procedimiento de Brockwell y Davis

El primer paso para la especificación del modelo fue aplicar las pruebas de estacio-nariedad a las series marginales: la Dickey-Fuller aumentada (ADF) y la KPSS. Losresultados en ambos casos presentan evidencia de que estas series son estacionarias.Esto se puede observar en el Cuadro 4.13. Luego se aplicó la prueba de cointegraciónde Johansen, la cual indica que la serie multivariada es I(0). El resultado se muestra

Page 116: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

100 Capítulo 4

ADF KPSSGrupo Estadístico Valor p Estadístico Valor p

1 -0,7764 0,01 0,1860 0,12 -1,0869 0,01 0,1138 0,13 -0,8984 0,01 0,1909 0,14 -0,6972 0,01 0,3603 0,094285 -1,8519 0,01 0,1015 0,16 -2,1427 0,01 0,0570 0,1

Cuadro 4.13: Resultados de las pruebas de raíz unitaria para las series marginales devariaciones salariales de los afiliados al fondo

10pct 5pct 1pctr ≤ 5 31,61773 7,52 9,24 12,97r ≤ 4 65,97634 13,75 15,67 20,20r ≤ 3 77,94623 19,77 22,00 26,81r ≤ 2 91,67354 25,56 28,14 33,24r ≤ 1 106,70229 31,66 34,40 39,79r = 0 141,58640 37,45 40,30 46,82

Cuadro 4.14: Resultado de la prueba de cointegración de Johansen para la serie devariaciones salariales

en el Cuadro 4.14.

Seguidamente, se ejecutan las funciones de selección de orden del paquete MTS. Paralos modelos VAR, cada criterio selecciona un orden distinto, como se puede apreciaren el Cuadro 4.15. En el caso de los modelos tipo VMA(q), los valores p de la pruebaLjung-Box (ver Ecuación (2.15)) están graficados en la Figura 4.21 y se selecciona q = 2.

Finalmente, se calculan los valores de la función Eccm, a partir de la cual se escogenlos valores p = 1 y q = 3. El resultado se muestra en la Figura 4.22.

Page 117: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 101

p AIC BIC HQ M(p) Valor p0 -2,1180 -2,1180 -2,1180 0,0000 0,00001 -2,4565 -1,7275 -2,1603 105,1885 0,00002 -2,6191 -1,1610 -2,0267 78,8647 0,00003 -2,5992 -0,4120 -1,7106 53,8861 0,02804 -2,3859 0,5303 -1,2010 29,9126 0,75255 -2,1353 1,5100 -0,6542 24,4121 0,92886 -2,0323 2,3420 -0,2550 37,3938 0,40497 -1,7402 3,3631 0,3332 17,7895 0,99538 -1,7382 4,0943 0,6315 41,4159 0,24629 -1,7453 4,8161 0,9206 39,2478 0,326410 -1,7704 5,5201 1,1917 37,5984 0,395911 -1,7047 6,3149 1,5536 28,4037 0,812512 -1,5601 7,1886 1,9945 21,0232 0,977913 -1,7419 7,7357 2,1088 37,0933 0,4184Orden según AIC: 2Orden según BIC: 0Orden según HQ: 1

Cuadro 4.15: Estimación preliminar del orden para un modelo VAR(p) para la serie devariaciones salariales

Page 118: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

102 Capítulo 4

5 10 15 20

0.0

0.2

0.4

0.6

0.8

1.0

p−values: Q(j,m) Statistics

j

prob

Figura 4.21: Gráfico de los valores p de la prueba Ljung-Box para seleccionar el ordenVMA

AR/MA

0 1 2 3 4 5 6

0 X X X O O O O

1 O O O O O O O

2 O O O O O O O

3 O O O O O O O

4 O O O O O O O

5 O O O O O O O

Figura 4.22: Función de correlación cruzada extendida de los valores mensuales de va-riaciones salariales

Page 119: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 103

4.3.2. Ajuste del modelo

Como se describió en el capítulo de metodología, la escogencia del modelo se realiza endos fases: en la primera se selecciona uno tipo VAR, uno tipo VMA y uno tipo VARMAa través de pruebas de cociente de verosimilitud. En la segunda se selecciona uno de losmodelos de la primera fase con base en los criterios de información (BIC y AIC). Losmodelos escogidos de la primera fase son:

VAR(3): se seleccionó según la prueba de cociente de verosimilitud.

VMA(5): los modelos cuyo orden se encuentra entre 6 y 11 resultaron no invertiblessegún la Definición 2.2.2, mientras que no fue posible calcular modelos de ordenmayor o igual a 12 debido a la singularidad de las matrices usadas en el cálculo.Así, únicamente se compararon mediante pruebas de cociente de verosimilitudmodelos con orden menor o igual a 5. Las pruebas seleccionaron el modelo deorden 5.

VARMA(1,1): no fue posible probar modelos de este tipo con órdenes mayoresdebido a que resultaron no invertibles según la Definición 2.2.2.

Los tres modelos anteriores se compararon con los criterios de información y tanto elAIC como el BIC seleccionaron el modelo VARMA(1,1). Adicionalmente, se comparóel VARMA(1,1) con los modelos VAR(1) y VMA(1) mediante pruebas de cociente deverosimilitud y en ambos casos se seleccionó el VARMA(1,1), por lo que este es el mode-lo que pasa a la siguiente etapa. Los parámetros del modelo se presentan a continuación:

Page 120: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

104 Capítulo 4

φ0 =[-0,4922166 0,6819349 0,5743882 -0,9012822 0,3883306 0,4176569

]T

φ1 =

-0,3142 1,3023 0,3456 -0,04183 1,0452 -1,18110,1022 -0,5040 0,1488 0,00751 -0,0563 -0,04840,3125 -1,5555 0,2452 0,11533 2,5343 -0,7314-0,0351 0,1333 1,4152 0,34596 1,7007 -0,93180,1894 0,0601 -0,0804 -0,05699 -0,7564 0,14710,3728 -0,8847 0,4995 0,12483 0,0660 -0,1320

θ1 =

-0,232 1,398 -0,1454 -0,0256 1,614 -1,321750,074 -0,586 -0,0722 0,0364 0,245 -0,021230,298 -2,061 0,4350 0,1805 2,872 -0,63742-0,165 0,975 1,0446 0,4631 0,600 -0,786190,167 -0,173 -0,1129 -0,0607 -0,391 0,187650,514 -1,548 0,3933 0,1979 1,012 -0,00563

La matriz de covarianza de los residuos es:

2,00848133 0,13866439 0,4115067 0,55686715 0,08505424 0,206891590,13866439 0,21684233 0,2174970 0,05707454 0,12546590 0,113521070,41150668 0,21749703 0,6138584 0,30837371 0,12651573 0,008999800,55686715 0,05707454 0,3083737 2,86591205 -0,01078257 0,056607460,08505424 0,12546590 0,1265157 -0,01078257 0,14203086 0,133627090,20689159 0,11352107 0,0089998 0,05660746 0,13362709 1,03228026

Page 121: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 105

ADF KPSSGrupo Estadístico Valor p Estadístico Valor p

1 -0,8950 0,01 0,1524 0,12 -1,1925 0,01 0,1000 0,13 -0,8420 0,01 0,2126 0,14 -0,8154 0,01 0,2143 0,15 -2,0282 0,01 0,0542 0,16 -1,8120 0,0189 0,0305 0,1

Cuadro 4.16: Resultados de las pruebas de raíz unitaria para los residuos marginalesdel modelo de variaciones salariales de los afiliados al fondo

10pct 5pct 1pctr ≤ 5 52,66970 7,52 9,24 12,97r ≤ 4 54,50191 13,75 15,67 20,20r ≤ 3 63,81890 19,77 22,00 26,81r ≤ 2 72,63076 25,56 28,14 33,24r ≤ 1 74,26474 31,66 34,40 39,79r = 0 88,36145 37,45 40,30 46,82

Cuadro 4.17: Resultado de la prueba de cointegración de Johansen para los residuos delmodelo de variaciones salariales

4.3.3. Diagnóstico del modelo

Ahora se debe analizar el ajuste del modelo a los datos, lo cual se logra a través delestudio de los residuos. Primero, se revisa la estacionariedad de los residuos margina-les (pruebas ADF y KPSS), cuyos resultados se muestran en el Cuadro 4.16. Como sepuede observar, la evidencia estadística señala que son estacionarios. En la prueba decointegración de Johansen también se obtiene estacionariedad, como se muestra en elCuadro 4.17.

Con repecto a la independencia de los residuos, se aplica la prueba Ljung-Box. Losvalores p resultantes se pueden observar en la Figura 4.23. No hay evidencia estadística

Page 122: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

106 Capítulo 4

5 10 15 20

0.0

0.2

0.4

0.6

0.8

1.0

p−values of Ljung−Box statistics

m

prob

Figura 4.23: Gráfico de los valores p de la prueba Ljung-Box para los residuos del modelode la serie de variaciones salariales

para rechazar la hipótesis de independencia.

Para revisar la normalidad, se aplicaron las pruebas de Mardia, Henze-Zirkler y Roys-ton. Como se muestra en el Cuadro 4.18, las tres pruebas rechazan la hipótesis denormalidad multivariada.

Para intentar resolver el problema de normalidad, se revisaron los posibles puntos atípi-cos en los residuos del modelo. Para esto se utilizó la distancia robusta de Mahalanobis,la cual utiliza el determinante de covarianza mínima en lugar de la covarianza muestral,para más detalles ver [24]. Así, se calculan estas distancias para cada uno de los residuosdel modelo y se sigue el siguiente procedimiento:

Se elimina de la serie el punto cuyo residuo posee la mayor distancia robusta de

Page 123: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 107

Prueba Estadístico Valor pMardia (asimetría) 11,38718 2,3848e-31Mardia (kurtosis) 73,86344 0Henze-Zirkler 1,367277 3,2196e-15Royston 112,753 4,9949e-22

Cuadro 4.18: Resultado de las pruebas de normalidad multivariada para los residuosdel modelo de variaciones salariales

Prueba Estadístico Valor pQ(m) 3,96151 0,94907Prueba de rango 11,72596 0,30382Qk(m) 277,2733 0,99957Prueba robusta (5%) 313,9348 0,96171

Cuadro 4.19: Resultado de las pruebas de heterocedasticidad para los residuos del mo-delo de variaciones salariales

Mahalanobis.

Se ajusta un nuevo modelo VARMA(1,1) con la nueva serie.

Se aplican las pruebas de normalidad a los residuos del nuevo modelo, si no sesuperan las pruebas, se vuelve al primer paso.

No obstante, no se obtuvieron los resultados esperados al ejecutar los pasos anteriores,ya que al eliminar el tercer punto atípico el modelo VARMA(1,1) no resulta invertible(ver Definición 2.2.2), por lo que se debió detener el procedimiento. Esto indica que elmodelo no es robusto.

Finalmente, se aplica la prueba de heterocedasticidad multivariada y como se puedeobservar en el Cuadro 4.19, ninguno de los estadísticos indica que sea necesario aplicarun modelo de este tipo.

Page 124: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

108 Capítulo 4

Así, se concluye que los residuos de este modelo cumplen todas las hipótesis necesariasexceptuando la de normalidad multivariada. No obstante, se decide trabajar con estemodelo debido a que la búsqueda de otro tipo de modelos para estos residuos se saledel alcance de este trabajo.

4.4. Evaluación Actuarial

Una vez seleccionados los modelos para cada variable, se procede a ejecutar las 10000simulaciones mensuales para un plazo de 1380 meses. Luego, las tasas mensuales ob-tenidas se transforman a anuales como se explicó en el capítulo de Metodología. Enlas Figuras 4.24 y 4.25 se presentan los histogramas de los valores de rendimiento einflación anual respectivamente para los primeros 10 años de la simulación. En el casode los rendimientos reales, la mayoría de valores se encuentra entre 5% y 7%, mientrasque para la inflación la mayoría está entre 3% y 5%. Cabe resaltar que el ProgramaMacroeconómico del Banco Central de Costa Rica para el período 2015-2016 estableceuna meta de inflación de 4% para el año 2016 ([1]).

Después, se ejecutaron las 10000 evaluaciones actuariales del fondo, una por cada es-cenario de simulación, y se construyó la función de distribución empírica del balanceo resultado actuarial, cuya gráfica se muestra en la Figura 4.26. Además, en la Figura4.27 se muestra el histograma de la función de densidad empírica de la variable. Elíndice de asimetría muestral es de -0.4121, lo cual significa que la distribución poseeuna asimetría hacia la izquierda, aunque esto no es tan evidente a partir de la Figura4.27.

La función de distribución obtenida puede ser analizada de diversas maneras, en estecaso se busca definir algunos escenarios clave utilizados en las evaluaciones actuaria-les: el base o esperado, el optimista y el pesimista. En el Cuadro 4.20 se muestran losdetalles de los escenarios seleccionados en millones de colones. El escenario promediocorresponde al esperado y es básicamente la media muestral de los datos. Por otra parte,el escenario optimista corresponde al percentil 25 de la distribución, mientras que los

Page 125: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 109

Figura 4.24: Histograma de las tasas de rendimiento anual en los primeros 10 años delas simulaciones

Page 126: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

110 Capítulo 4

Figura 4.25: Histograma de las tasas de inflación anual en los primeros 10 años de lassimulaciones

Page 127: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 111

Figura 4.26: Función de distribución empírica del balance actuarial en miles de millonesde colones

Page 128: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

112 Capítulo 4

Datos

Den

sida

d

−50000 0 50000

0.0e

+00

1.0e

−05

2.0e

−05

−75000 −50000 −25000 0 25000 50000 75000

Figura 4.27: Función de densidad empírica del balance actuarial

Page 129: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 113

escenarios denotados por V aR95, V aR99, CV aR95 y CV aR99 corresponden a diversosescenarios pesimistas. V aRp denota el valor en riesgo p y CV aRp el valor en riesgocondicional p.

EscenarioPromedio Optimista VaR95 VaR99 CVaR95 CVaR99

PASIVOSEn curso de pagoBeneficiarios 8.451,91 7.893,91 9.084,72 9.595,93 10.341,75 9.372,75Pensionados 94.458,26 87.488,49 102.525,57 108.130,86 117.423,61 105.954,17

Empleados ActivosVejez1 149.928,72 136.312,37 182.921,88 198.146,33 188.655,74 210.222,61Muerte2 3.792,58 3.400,34 4.510,07 4.805,22 4.820,48 5.050,14

ACTIVOSCotizaciones 122.987,67 115.552,54 131.109,99 135.509,37 142.328,92 134.890,99Reserva 155.000,00 155.000,00 155.000,00 155.000,00 155.000,00 155.000,00

BALANCE 21.355,85 35.457,42 (12.932,24) (30.168,97) (23.918,85) (40.675,30)

PRIMA 12,39 % 10,40 % 16,48 % 18,34 % 17,52 % 19,53 %

Cuadro 4.20: Escenarios seleccionados de la función de distribución del balance actuarialen millones de colones

Como se puede observar, en el escenario esperado el fondo posee un superávit de 21.356millones de colones y la prima de equilibrio es de 12,39%. En el escenario optimista elsupéravit aumenta a más de 35 mil millones de colones y la prima de equilibrio baja a10,40%. En los escenarios pesimistas no se alcanza el equilibrio, ya que los 4 escenariosindican que hay déficit y que la prima actual de 15% no es suficiente. En el caso extremo(CV aR99) el déficit es de más de 40 mil millones de colones y la prima de equilibrioaumenta a 19,53%.

1incluye beneficios por muerte ocurrida después de la jubilación2corresponde a beneficios por muerte ocurrida antes de la jubilación

Page 130: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

114 Capítulo 4

Comp. 1 Comp. 2α 0,474381 0,525619µ 11206,53 30515,80σ 19931,65 14590,77

Cuadro 4.21: Parámetros de la mezcla gaussiana ajustada a la función de densidadempírica del balance actuarial

Para finalizar, se procede a buscar un modelo teórico que ajuste la distribución empí-rica de pérdidas obtenida. Al observar la Figura 4.27, se nota asimetría en las colase indicios de bimodalidad. Al tomar en cuenta que se realizaron 10000 simulaciones,parece factible utilizar una mezcla para ajustar las colas por separado. Como se explicóen el capítulo de metodología, únicamente se considerarán mezclas en las cuales todassus componentes sean gaussianas. Se ajustaron tres modelos: uno con dos componentes,otro con tres y el último con cuatro. En todos los casos se superaron las pruebas deKolmogorov-Smirnov y de Anderson-Darling. Además los tres gráficos QQ asemejanuna línea recta. La prueba de cociente de verosimilitud indica que se debe seleccionar elmodelo con k = 2. Por otra parte, según el AIC se debe seleccionar en primer lugar elmodelo con k = 4 y en segundo lugar el modelo con k = 2. Finalmente, el menor valordel BIC se obtiene para k = 2. Considerando los criterios anteriores y el principio deparsimonia se decide escoger la mezcla con dos componentes gaussianas, la cual, comose mostrará a continuación, provee un ajuste apropiado.

Los parámetros estimados del modelo se muestran en el Cuadro 4.21, y en la Figura4.28 se puede observar el histograma de los datos muestrales junto a las componentesindividuales de la mezcla (curvas sin grosor) y la densidad de la mezcla (curva gruesa).En la Figura 4.29 se presenta el gráfico QQ de la mezcla y los datos. Se puede apreciarque este asemeja una línea recta.

El valor p de la prueba Kolmogorov-Smirnov no da evidencia para rechazar la hipótesisnula de que los datos observados provienen de la mezcla. Un resultado similar se obtiene

Page 131: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 115

Prueba Estadístico Valor pKolmogorov-Smirnov 0,0066 0,7715Anderson-Darling 0,8630 0,4377

Cuadro 4.22: Resultados de las pruebas de ajuste de la mezcla gaussiana a la funciónde densidad empírica del balance actuarial

con la prueba de Anderson-Darling. Los resultados de ambas pruebas se observan en elCuadro 4.22.

Page 132: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

116 Capítulo 4

Datos

Den

sida

d

−50000 0 50000

0.0e

+00

1.0e

−05

2.0e

−05

−75000 −50000 −25000 0 25000 50000 75000

Figura 4.28: Función de densidad empírica del balance actuarial y la mezcla gaussianacon k = 2

Page 133: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 4 117

−50000 0 50000

−50

000

050

000

1000

00

Mezcla gaussiana con k=2

Puntos muestrales

Pun

tos

teór

icos

Figura 4.29: Gráfico QQ de los resultados del balance actuarial y la mezcla gaussianacon k = 2

Page 134: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

118 Capítulo 4

Page 135: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 5

Conclusiones y Recomendaciones

En este capítulo se presentan los principales resultados logrados durante el desarrollode este trabajo. Adicionalmente, se sugieren algunas extensiones que se podrían realizaren futuras investigaciones.

En el capítulo 2 se presentó un compendio de la bibliografía analizada para cumplircon el primer objetivo, el cual planteaba investigar la teoría de series de tiempo y suaplicación. En ese capítulo se explicaron los aspectos más importantes de los modelosde series de tiempo, tanto univariados como multivariados, incluyendo los métodos uti-lizados para identificar el tipo de modelo que mejor ajusta una serie de datos observada.

Para cumplir el segundo objetivo, se realizó el estudio de tres variables económicas queinfluyen directamente en el resultado actuarial de un fondo de pensiones hipotético:los rendimientos históricos de este, las variaciones salariales de sus afiliados y la infla-ción costarricense, para así determinar el modelo de serie de tiempo que mejor ajustea cada una. En el capítulo 3 se describió el procedimiento seguido y en el capítulo 4 sepresentaron los resultados obtenidos. Para el rendimiento real del fondo y la inflaciónse logró identificar un modelo tipo ARMA univariado que cumple todas las hipótesisnecesarias. No obstante, en el caso de las variaciones salariales, no fue posible ajustarun modelo VARMA cuyos residuos cumplieran la hipótesis de normalidad multivariada.Además, el modelo utilizado para esta variable no es robusto. Esto se comprobó cuando

119

Page 136: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

120 Capítulo 5

se intentó estudiar el impacto de posibles puntos atípicos en la serie observada.

En cuanto al tercer y último objetivo, se logró realizar la evaluación actuarial del fondohipotético utilizando el enfoque estocástico propuesto. Una vez seleccionados los mode-los de serie de tiempo para cada variable económica, se realizaron 10000 simulacionesdel comportamiento de estas para los próximos 115 años, que corresponde al períodode tiempo necesario para llevar a todas las vidas del colectivo hasta el último año devida en la tabla de mortalidad empleada. Estas simulaciones sirvieron como insumopara ejecutar las 10000 evaluaciones actuariales que permitieron construir la función dedistribución empírica del denominado balance o resultado actuarial y definir a partirde esta los distintos escenarios que se incluyen en una evaluación actuarial: el esperado,el optimista y el pesimista. Finalmente, se logró ajustar una mezcla gaussiana de doscomponentes a la distribución muestral. El ajuste obtenido superó todas las pruebasestadísticas aplicadas.

Durante el desarrollo del trabajo se presentaron las siguientes limitaciones:

A la hora de aplicar el algoritmo de k-medias para la agrupación de las edades delos afiliados del fondo con respecto a su comportamiento salarial, no se verificóque el número de grupos utilizado fuera el óptimo, sino que este valor se definió demanera conveniente de acuerdo a la cantidad de parámetros del modelo VARMAque se debían estimar.

Hubiera sido deseable haber realizado más de 10000 evaluaciones actuariales. Noobstante, esto no se pudo dado el tiempo que tardaba la ejecución de cada eva-luación.

No fue posible encontrar un modelo VARMA que cumpliera la hipótesis de nor-malidad multivariada de los residuos para ajustar las variaciones salariales de losafiliados del fondo.

No fue posible reducir el impacto de los puntos atípicos en la serie de las varia-ciones salariales.

Page 137: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Capítulo 5 121

En cuanto a posibles extensiones de este trabajo se tienen las siguientes:

Determinar la factibilidad de aplicar modelos de cópulas a los residuos de losmodelos VARMA que no cumplen la hipótesis de normalidad multivariada.

Investigar y aplicar métodos para reducir el impacto de puntos atípicos en seriesmultivariadas.

Utilizar un criterio estadístico para seleccionar la cantidad de grupos a utilizar ala hora de aplicar el algoritmo de agrupación de k-medias.

Probar ajustes de la distribución muestral a mezclas cuyas componentes no seangaussianas.

Mejorar el tiempo de ejecución de la evaluación actuarial. Si bien ninguno de losobjetivos planteados se relaciona con los tiempos de ejecución, la realización de las10000 evaluaciones de este trabajo tardó unas 23 horas en una computadora tipoworkstation con 12 cores que permiten calcular los distintos escenarios en formaparalela, lo cual se considera demasiado si se toma en cuenta que no se incluyeronnuevos ingresos al fondo ni decrementos adicionales a los de vejez y muerte.

El punto anterior permitiría además reducir el número de simplificaciones utiliza-das en la evaluación actuarial.

Modelizar la tasa benchmark de mercado y utilizarla para descontar los activos ypasivos actuariales en lugar del rendimiento del fondo.

Utilizar series de tiempo para modelizar las probabilidades de muerte de los afi-liados al fondo.

Page 138: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

122 Capítulo 5

Page 139: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Bibliografía

[1] Banco Central de Costa Rica. Programa Macroeconómico 2015-2016.

[2] Banco Central de Costa Rica. Índices de Precios, 2015.

[3] Bellosta, C. J. G. ADGofTest: Anderson-Darling GoF test, 2011. R packageversion 0.3.

[4] Benaglia, T., Chauveau, D., Hunter, D. R., and Young, D. mixtools: AnR Package for Analyzing Finite Mixture Models. Journal of Statistical Software32, 6 (2009), 1–29.

[5] Bowers, N. L., Gerber, H. U., Hickman, J. C., Jones, D. A., and Nes-bitt, C. J. Actuarial Mathematics, 2 ed. Society of Actuaries, 1997.

[6] Brockwell, P. J., and Davis, R. A. Introduction to Time Series and Fore-casting, 2 ed. Springer, 2002.

[7] Brockwell, P. J., and Davis, R. A. Time Series: Theory and Methods, 2 ed.Springer, 2006.

[8] Chan, K.-S., and Ripley, B. TSA: Time Series Analysis, 2012. R packageversion 1.01.

[9] Chaverri, C., and Torres, C. Dinámica inflacionaria y persistencia en CostaRica: Periodo 1953-2009. Tech. rep., Banco Central de Costa Rica, 2010.

123

Page 140: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

124 Bibliografía

[10] Chen, C., and Liu, L.-M. Joint Estimation of Model Parameters and OutlierEffects in Time Series. Journal of the American Statistical Association 88, 421(1993), 284–297.

[11] Cryer, J. D., and Chan, K.-S. Time Series Analysis With Applications in R,2 ed. Springer, 2008.

[12] de Lacalle, J. L. tsoutliers: Detection of Outliers in Time Series, 2015. Rpackage version 0.6.

[13] de Lacalle, J. L., and Díaz-Emparanza, I. uroot: Unit Root Tests andGraphics for Seasonal Time Series, 2005. R package version 1.4-1.

[14] Hamilton, J. D. Time Series Analysis. Princeton University Press, 1994.

[15] Hyndman, R. J., and Khandakar, Y. Automatic Time Series Forecasting:The forecast Package for R. Journal of Statistical Software 27, 3 (2008).

[16] Kellison, S. The Theory of Interest, 3 ed. McGraw-Hill, 2009.

[17] Klugman, S. A., Panjer, H. H., and Willmot, G. E. Loss Models: FromData to Decisions, 3 ed. John Wiley & Sons, Inc., 2008.

[18] Korkmaz, S., Goksuluk, D., and Zararsiz, G. MVN: An R Package forAssessing Multivariate Normality. The R Journal 6, 2 (2014), 151–162.

[19] Kwiatkowski, D., Phillips, P. C., Schmidt, P., and Shin, Y. Testing theNull Hypothesis of Stationarity against the Alternative of a Unit Root. Journal ofEconometrics 88, 421 (1992), 284–297.

[20] Peña, D., Tiao, G. C., and Tsay, R. S. A Course in Time Series Analysis.Wiley, 2001.

[21] Pfaff, B. Analysis of Integrated and Cointegrated Time Series with R, second ed.Springer, New York, 2008. ISBN 0-387-27960-1.

Page 141: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

Bibliografía 125

[22] Razali, N. M., and Wah, Y. B. Power Comparisons of Shapiro–Wilk, Kol-mogorov–Smirnov, Lilliefors and Anderson–Darling Tests. Journal of StatisticalModeling and Analytics 2, 1 (2011), 21–33.

[23] Rencher, A. C. Methods of Multivariate Analysis, 2 ed. Wiley, 2002.

[24] Rousseeuw, P. J., and Driessen, K. V. A Fast Algorithm for the MinimumCovariance Determinant Estimator. Technometrics 41 (1999), 212–223.

[25] Royston, J. P. Some Techniques for Assessing Multivariate Normality based onthe Shapiro-Wilk W. Applied Statistics 36, 2 (1983), 121–133.

[26] Superintendencia de Pensiones. Disposiciones Generales acerca del Cálculode la Rentabilidad de los Fondos Administrados por las Operadoras de PensionesComplementarias y el uso de esta Información en la Publicidad, 2002.

[27] Superintendencia de Pensiones. Reglamento Actuarial para los Regímenesde Pensiones Creados por Leyes Especiales y Regímenes Públicos Sustitutos alRégimen de Invalidez, Vejez y Muerte, 2005.

[28] Superintendencia de Pensiones. Reglamento de Tablas de Mortalidad, 2014.

[29] Trejos, J., Castillo, W., and González, J. Análisis Multivariado de Datos:Métodos y Aplicaciones. Editorial UCR, 2014.

[30] Tsay, R. S. Multivariate Time Series Analysis. Wiley, 2014.

[31] Tsay, R. S. MTS: All-Purpose Toolkit for Analyzing Multivariate Time Series(MTS) and Estimating Multivariate Volatility Models, 2015. R package version0.33.

[32] Whitten, S., and Thomas, R. A Non-Linear Stochastic Asset Model for Ac-tuarial Use. British Actuarial Journal 5 (1999), 919–953.

[33] Wilkie, A. D. A Stochastic Investment Model for Actuarial Use. Transactionsof the Faculty of Actuaries 39 (1984), 341–403.

Page 142: UNIVERSIDADDECOSTARICA FACULTADDECIENCIAS ...ciencias.ucr.ac.cr/sites/default/files/José Fabio... · Las variables que se modelizarán mediante series de tiempo son lassiguientes:

126 Bibliografía

[34] Yuen, H. Stochastic Modeling of Economic Variables for Pension Plan Projec-tions. Master’s thesis, Universidad Simon Fraser, Vancouver, Columbia Británica,Canadá, 2011.