Publicar series de tiempo
Andino permite documentar archivos CSV como series de tiempo (indicadores con evolución temporal) para que aparezcan en la API de Series de Tiempo y en el Explorador de Series de Tiempo.
Indice
- 1. Crear una distribución de series de tiempo
- 2. Documentar la distribución en Andino
- 3. Dar aviso a Datos Argentina
- 4. Activar el explorador de series en tu Andino
1. Crear una distribución de series de tiempo
Una distribución de series de tiempo es un archivo CSV donde la primer columna contiene las fechas y cada una de las otras columnas es una serie de tiempo.
Así se ve una tabla de series de tiempo en una planilla de cálculo como Excel, Libre Office o Google Spreadsheet:
indice_tiempo | oferta_global_pib | oferta_global_importacion | demanda_global_exportacion | demanda_global_ibif | demanda_global_consumo_priv |
---|---|---|---|---|---|
1993-01-01 | 236520.0336 | 22027.59999 | 16340.95975 | 45069.41348 | 31952.717 |
1994-01-01 | 250307.886 | 26682.25975 | 18840.403 | 51231.4255 | 32094.804 |
1995-01-01 | 243186.1018 | 24065.62925 | 23084.79625 | 44528.27725 | 32338.89925 |
1996-01-01 | 256626.244 | 28284.11475 | 24850.043 | 48483.8615 | 33040.55475 |
1997-01-01 | 277441.3173 | 35884.496 | 27876.14225 | 57047.5 | 34104.32325 |
1998-01-01 | 288123.3068 | 38903.79175 | 30837.53425 | 60780.6695 | 35249.1645 |
1999-01-01 | 278369.0138 | 34520.59125 | 30448.89575 | 53116.3155 | 36173.34075 |
La tabla puede ser generada con un software de planilla de cálculo, una rutina programada o incluso a mano con un editor de texto! Pero en cualquier caso tenés que guardarla como un archivo CSV:
indice_tiempo,oferta_global_pib,oferta_global_importacion,demanda_global_exportacion,demanda_global_ibif,demanda_global_consumo_priv 1993-01-01,236520.033577,22027.5999938,16340.9597519,45069.4134803,31952.717001 1994-01-01,250307.886,26682.25975,18840.403,51231.4255,32094.804 1995-01-01,243186.10175,24065.62925,23084.79625,44528.27725,32338.89925 1996-01-01,256626.244,28284.11475,24850.043,48483.8615,33040.55475 1997-01-01,277441.31725,35884.496,27876.14225,57047.5,34104.32325 1998-01-01,288123.30675,38903.79175,30837.53425,60780.6695,35249.1645 1999-01-01,278369.01375,34520.59125,30448.89575,53116.3155,36173.34075
Es muy importante que el archivo CSV cumpla con estas condiciones:
Fechas en formato YYYY-MM-DD
El índice de tiempo debe tener las fechas en formato YYYY-MM-DD
. Este es el estándar ISO 8601.
Por ejemplo: 12/03/2001 no está soportado, debe escribirse 2001-03-12.
Fechas estandarizadas en planillas de cálculo
Las planillas de cálculo suelen leer de distintas maneras las fechas y a veces es difícil controlar en qué formato se guardan cuando "exportás a CSV" o "guardás como CSV". El mejor consejo: seleccioná la columna completa que va a ser el índice de tiempo, asignale un formato de "Texto" y escribí las fechas después, como cadenas de texto (así evitás que la planilla de cálculo las lea como fechas).
Fecha más antigua primero a la más reciente al final
El indice de tiempo debe comenzar por la fecha más antigua y terminar por la más reciente. Menor a mayor, orden ascendente.
indice_tiempo_correcto | indice_tiempo_incorrecto |
---|---|
1993-01-01 | 1999-01-01 |
1994-01-01 | 1998-01-01 |
1995-01-01 | 1997-01-01 |
1996-01-01 | 1996-01-01 |
1997-01-01 | 1995-01-01 |
Fechas continuas
Al índice de tiempo no le pueden faltar valores intermedios. Si no hay datos de una serie para determinado período, debe estar la celda en blanco.
indice_tiempo_correcto | indice_tiempo_incorrecto |
---|---|
1993-01-01 | 1993-01-01 |
1994-01-01 | 1994-01-01 |
1995-01-01 | 1997-01-01 |
1996-01-01 | 1998-01-01 |
1997-01-01 | 1999-01-01 |
Fecha inicial del período
Para representar períodos más largos que una fecha (el caso de todas las frecuencias de tiempo más bajas que la diaria) debe usarse siempre la fecha completa del comienzo del período.
Mensual
indice_tiempo_correcto | indice_tiempo_incorrecto |
---|---|
1980-01-01 | 1980-01-31 |
1980-02-01 | 1980-02-28 |
1980-03-01 | 1980-03-31 |
Trimestral
indice_tiempo_correcto | indice_tiempo_incorrecto |
---|---|
1980-01-01 | 1980-02-01 |
1980-04-01 | 1980-05-01 |
1980-07-01 | 1980-08-01 |
1980-10-01 | 1980-11-01 |
Semestral
indice_tiempo_correcto | indice_tiempo_incorrecto | indice_tiempo_incorrecto |
---|---|---|
1980-01-01 | 1980-01-01 | 1980-01-31 |
1980-07-01 | 1980-08-01 | 1980-07-31 |
1981-01-01 | 1981-01-01 | 1981-01-31 |
Usar "," como separador de columnas
Las columnas del CSV deben estar separadas con ",". No con ";", "|" ni ningún otro caracter.
Correcto
indice_tiempo,oferta_global_pib,oferta_global_importacion,demanda_global_exportacion,demanda_global_ibif,demanda_global_consumo_priv 1993-01-01,236520.033577,22027.5999938,16340.9597519,45069.4134803,31952.717001 1994-01-01,250307.886,26682.25975,18840.403,51231.4255,32094.804 1995-01-01,243186.10175,24065.62925,23084.79625,44528.27725,32338.89925
Incorrecto
indice_tiempo;oferta_global_pib;oferta_global_importacion;demanda_global_exportacion;demanda_global_ibif;demanda_global_consumo_priv 1993-01-01;236520.033577;22027.5999938;16340.9597519;45069.4134803;31952.717001 1994-01-01;250307.886;26682.25975;18840.403;51231.4255;32094.804 1995-01-01;243186.10175;24065.62925;23084.79625;44528.27725;32338.89925
Usar "." como separador decimal
Los números decimales deben usar "." como separador decimal. No usar ",".
Correcto
indice_tiempo,oferta_global_pib,oferta_global_importacion,demanda_global_exportacion,demanda_global_ibif,demanda_global_consumo_priv 1993-01-01,236520.033577,22027.5999938,16340.9597519,45069.4134803,31952.717001 1994-01-01,250307.886,26682.25975,18840.403,51231.4255,32094.804 1995-01-01,243186.10175,24065.62925,23084.79625,44528.27725,32338.89925
Incorrecto
indice_tiempo,oferta_global_pib,oferta_global_importacion,demanda_global_exportacion,demanda_global_ibif,demanda_global_consumo_priv 1993-01-01,"236520,033577","22027,5999938","16340,9597519","45069,4134803","31952,717001" 1994-01-01,"250307,886","26682,25975","18840,403","51231,4255","32094,804" 1995-01-01,"243186,10175","24065,62925","23084,79625","44528,27725","32338,89925"
No usar separador de miles
Los números decimales no deben usar separador de miles.
Correcto
indice_tiempo,oferta_global_pib,oferta_global_importacion,demanda_global_exportacion,demanda_global_ibif,demanda_global_consumo_priv 1993-01-01,236520.033577,22027.5999938,16340.9597519,45069.4134803,31952.717001 1994-01-01,250307.886,26682.25975,18840.403,51231.4255,32094.804 1995-01-01,243186.10175,24065.62925,23084.79625,44528.27725,32338.89925
Incorrecto
indice_tiempo,oferta_global_pib,oferta_global_importacion,demanda_global_exportacion,demanda_global_ibif,demanda_global_consumo_priv 1993-01-01,"236,520.033577","22,027.5999938","16,340.9597519","45,069.4134803","31,952.717001" 1994-01-01,"250,307.886","26,682.25975","18,840.403","51,231.4255","32,094.804" 1995-01-01,"243,186.10175","24,065.62925","23,084.79625","44,528.27725","32,338.89925"
Separador de miles al exportar planilla de cálculo a CSV
Algunas planillas de cálculo (como Excel en algunas versiones) exportan a CSV agregando el separador de miles si el usuario eligió un formato de visualización de número que lo incluye. Para evitarlo, seleccionar las columnas que contienen las series y elegir un formato de visualización de número sin separador de miles.
2. Documentar la distribución en Andino
Una vez que creaste el CSV, es hora de cargarlo y documentarlo en Andino.
A. Crear o editar el dataset que contendrá al recurso
Si no creaste el Dataset que contendrá el nuevo recurso/distribución de series de tiempo, tenés que crear un nuevo Dataset. Si el Dataset ya existe, sólo tenés que agregar un nuevo recurso.
B. Agregar un nuevo recurso y documentar sus metadatos usuales
Documentar un recurso de series de tiempo es igual que documentar cualquier otro recurso, hasta que llegues a la sección "Documentación de los campos del recurso".
Subir archivo, o copiar URL de descarga
Recordá que podés cargar el archivo directamente en Andino o podés cargarlo en cualquier otro sistema, y cargar la URL de descarga en Andino.
Esto puede ser útil si el CSV se genera automáticamente en otro sistema y se publica en línea. También podés cargar el archivo a Andino por API.
C. Documentar el índice de tiempo
Una vez que llegás a la sección "Documentación de los campos del recurso", tenés que documentar la primer columna del CSV: el índice de tiempo.
- Título de la columna: debe ser exactamente el mismo título que tiene en el CSV. Ej.: indice_tiempo.
- Tipo de dato: debe ser "Fecha ISO-8601 (date)". Indica a la aplicación que los valores del campo son fechas estandarizadas.
- Tipo de dato especial: debe elegirse "Índice de tiempo" en el selector. Indica a la aplicación que el campo cumple con todas las propiedades de un índice de tiempo, tal como se explicó en la sección anterior.
- Detalle del tipo de datos especial: debe seleccionarse la frecuencia del índice de tiempo.
D. Documentar las series de tiempo
El resto de las columnas a documentar son las series de tiempo.
- Título de la columna: debe ser exactamente el mismo título que tiene en el CSV. Ej.: pib_precios_corrientes. No puede superar los 60 caracteres en ningún caso.
- Tipo de dato: puede ser "Número decimal (number)" o "Número entero (integer)". Las series sólo pueden tener números enteros o decimales como valores.
- Descripción de la columna: es el metadato más importante por el cual los usuarios van a buscar esa serie. La descripción no debe dejar lugar a dudas de qué serie se trata y conviene que siga una estructura común. Ej.: "Indice de Precios al Consumidor. Nivel General Nacional. Base diciembre 2016."
- Unidad: es la unidad de medida en que están expresados los valores numéricos de la serie. Ej.: "Millones de pesos de 2004", "Kilogramos" o "Millones de USD corrientes"
- Identificador: es el código que identifica unívocamente a la serie dentro de toda la base de series de tiempo de la Administración Pública Nacional. Debe pensarse de forma que no sea muy largo pero no pueda pisarse con otras series: "ipc" es un mal código, mientras que "ipc_0001" es mejor. Conviene decidir una estructura o convención para generar los códigos de las series del organismo y ceñirse a ella.
3. Dar aviso a Datos Argentina
Una vez que documentaste un nuevo recurso de series de tiempo, escribinos a datosargentina@jefatura.gob.ar para que lo federemos en la API y te ayudemos a resolver cualquier problema!
A partir de que se federa por primera vez, la API revisará automáticamente 4 veces por día el archivo CSV y los metadatos para reflejar cualquier cambio que hagas.
4. Activar el explorador de series en tu Andino
Las series federadas en la API también se pueden ver en tu Andino, activando el explorador de series.
- Tildar el casillero ¿Querés que esta sección se vea en tu portal?
- Elegir series destacadas en ¿Querés destacar algunas series? escribiendo los identificadores de las series separados por comas ",".
Si sos un organismo de la Administración Pública Nacional de Argentina, el campo URI de la API de Series no debe modificarse! Si desplegaste una instancia propia de la aplicación de la API podés cambiar la URL a donde apunta Andino.