tl;dr: operaciones básicas de tratamiento y visualización de Series de Tiempo con pandas y matplotlib.

Una serie de tiempo es una colección ordenada por tiempo de ocurrencia de cualquier evento o fenómeno, para su estudio, tal como puede ser la temperatura diaria medida cada hora, la producción mensual de una planta industrial, el consumo eléctrico diario de un hogar, o el valor de un activo financiero.

Desarrollaré una serie de 5 posts en los que la mayor parte de los desarrollos serán trabajados con el valor diario de cierre BitCoin desde sus inicios en abril de 2013.

Precio cierre de BitCoin desde abril 2013

En este primer post, son revisadas algunas de las prestaciones que ofrece Python para tratar con series de tiempo, de forma “inteligente”. En particular se verán las facilidades que ofrece la librería pandas, que incorpora varios métodos para simplificar el trabajo, tales como los métodos to_datetime, o parse_dates que sirven para transformar la data en formato timedate.

Junto con los métodos básicos de trabajo, también se revisan las visualizaciones básicas de series de tiempo, tales como: slices temporales, comparación de una serie vs una versión shifted/lagged de la misma, utilización de subplots, y comparación contra benchmarks (Standard & Poor 500).

El repositorio con todos los códigos y archivos puede ser descargado desde mi Github.

Leave a Reply

Your email address will not be published. Required fields are marked *