Herramientas para Pronósticos de Series de Tiempo en Python — Parte 6: 1ra Evaluación

Gonzalezhomar
tacosdedatos
Published in
5 min readFeb 25, 2022

Un primer vistazo a cómo le fue a los pronósticos.

Foto: Ralfs Blumbergs en Unsplash

1. Introducción

Hace mucho tiempo, en una galaxia muy lejana, comencé este proyecto para hacer pronósticos de series de tiempo, para evaluar los resultados de diferentes modelos y metodologías, desde una óptica ex-post. Es decir, quiero evaluar los modelos de series de tiempo, en función de que tan bien ajustan los pronósticos que generan y no en función del ajuste histórico.

Resumiendo el proyecto, utilicé difentes herramientas para hacer pronósticos de los principales impuestos que componen una bolsa llamada Recaudación Federal Participable (RFP). Dicha bolsa es importante en México para las Entidades Federativas, puesto que a partir de la RFP se determinan las participaciones que reciben las Entidades Federativas y los Municipios.

Han pasado algunos meses, y apenas tengo 2 nuevas observaciones, pero veamos como le fue a los competidores:

Las bases de datos y las notebooks con el código completo de esta serie de publicaciones se pueden encontrar en mi repositorio de [Github](https://github.com/gonzalezhomar/articulos_pronosticos).

2. Resultados

Luego de tener estos modelos guardados en el cajón, para el tercer trimestre de 2021 tenía los siguientes pronósticos:

E inclusive, ya tenía los siguientes pronósticos para el cuarto trimestre de 2021:

Antes de adelantarnos y ver como le fue a la RFP, veamos cómo le fue estas proyecciones para cada uno de los impuestos, utilizando la clásica y simple medida de la suma de los errores cuadrados (SSR).

2.1 Impuesto Sobre la Renta

En cuanto al Impuesto Sobre la Renta (ISR), que es el principal componente de la RFP, el pronóstico más cercano fue el que obtuve con SARIMAX.

2.2 Impuesto al Valor Agregado

En cuanto al Impuesto al Valor Agregado (IVA), que es el segundo principal componente de la RFP, el pronóstico más cercano fue el que obtuve con SARIMAX, aunque con excepción de Holt-Winters, todos los modelos generan muy buenos resultados.

2.3 IEPS Gasolinas y Diésel

En cuanto al Impuesto Especial sobre Producción y Servicios (IEPS) a la venta final de gasolinas y diésel, el pronóstico más cercano fue también con SARIMAX… lo que no me gusta porque la proyección de este modelo es una simple constante.

2.4 IEPS Bebidas Alcohólicas

En cuanto al IEPS a las bebidas alcohólicas, el pronóstico más cercano fue Holt-Winters.

2.5 IEPS Cervezas

En cuanto al IEPS a las cervezas, el pronóstico más cercano fue Holt-Winters.

2.6 IEPS Tabacos

En cuanto al IEPS a los tabacos, el pronóstico más cercano fue Holt-Winters.

2.7 IEPS Bebidas Saborizadas

En cuanto al IEPS a las bebidas saborizadas, el pronóstico más cercano fue Neural Prophet.

2.8 IEPS Alimentos

En cuanto al IEPS a los alimentos de alta densidad calórica, el pronóstico más cercano fue *Holt-Winters*.

2.9 Impuesto a la Importación

En cuanto al impuesto a la importación, el pronóstico más cercano fue Holt-Winters.

2.10 Ingresos Petroleros

En cuanto a los ingresos petroleros que forman parte de la RFP, el pronóstico más cercano fue *SARIMAX*.

3. ¿Y quién ganó?

En cuanto a la estimación del gran total de la Recaudación Federal Participable, el ganador en esta primera observación es el modelo SARIMAX, seguido muy de cerca por Prophet y Neural Prophet.

Pero ¡no tan rápido! Si bien, el modelo SARIMAX tuvo una mejor precisión ello es porque no incluí todas las series de la RFP en mi análisis. Si me enfocó sólo en las series que estoy pronósticando, es decir, una RFP que solo tenga estas series, Neural Prophet resulta más cercana:

O en cambio, puedo hacer la suma cuadrada de los errores de cada serie, para considerar el total de los errores… dónde también gana *SARIMAX*:

4. Continuará

Si bien, en el objetivo original de estimar la RFP ganó el módelo *SARIMAX*, en general, me parece que los modelos generaron muy buenos pronósticos de la RFP, pues se ajustaron bastante bien a lo observado realmente, por lo que no actualizaré las proyecciones, sino que continuaré evaluando estos mismos pronósticos para el siguiente trimestre. Para la siguiente observación estimó lo siguiente:

Sin más por el momento, nos vemos en 3 meses más… o en 6. Que siga la carrera, y ¡date prisa Gokú!

--

--

Gonzalezhomar
tacosdedatos

Economista y entusiasta de modelación matemática, estadística, teoría de juegos y ciencia de datos. English spoken. https://gonzalezhomar.netlify.app