Input de datos

Este es el esquema de datos que deben seguir los archivos suministrados como insumos a UrbanTrips.

Transacciones

Tabla con las transacciones.

Campo

Tipo de dato

Descripción

id_trx

int

Obligatorio. Id único que identifique cada registro y permita luego vincular la transacción en Urbantrips con el dataset original.

fecha_trx

strftime

Obligatorio. Timestamp de la transaccion. Puede ser solo el día o el dia, hora y minuto.

id_tarjeta_trx

int/str

Obligatorio. Un id que identifique a cada tarjeta.

modo_trx

str

Opcional. Se estandarizará con lo especificado en modos en el archivo de configuración. Si no hay información en la tabla, se imputará todo como autobus.

hora_trx

int

Opcional a menos que fecha_trx no tenga información de la hora y minutos. Entero de 0 a 23 indicando la hora de la transacción.

id_linea_trx

int

Obligatorio. Entero que identifique a la linea.

id_ramal_trx

int

Opcional. Entero que identifique al ramal.

interno_trx

int

Obligatorio. Entero que identifique al interno

orden_trx

int

Opcional a menos que fecha_trx no tenga información de la hora y minutos. Entero comenzando en 0 que esatblezca el orden de transacciones para una misma tarjeta en un mismo día.

latitud_trx

float

Obligatorio. Latitud de la transacción.

longitud_trx

float

Obligatorio. Longitud de la transacción.

factor_expansion

float

Opcional. Factor de expansión en caso de tratarse de una muestra.

Información de lineas y ramales

Tabla con metadata descriptiva de las lineas y ramales. La forma de tratar a las líneas y ramales en UrbanTrips es muy específica, por lo tanto se aconseja leer el apartado Sobre el concepto de lineas y ramales en UrbanTrips.

Campo

Tipo de dato

Descripción

id_linea

int

Obligatorio. Entero que identifique a la linea.

nombre_linea

str

Obligatorio. Nombre de la línea.

modo

str

Obligatorio. Modo de la linea.

id_ramal

int

Obligatorio si hay ramales.Entero que identifique al ramal.

nombre_ramal

str

Obligatorio si hay ramales. Nombre del ramal.

empresa

str

Opcional. Nombre de la empresa.

descripcion

str

Opcional. Descripción adicional de la linea o ramal.

id_linea_agg

int

Opcional. id único de una línea que contenga más de un ramal y deba tratarse de modo unificado para imputar destinos.

nombre_linea_agg

str

Opcional. descripción de la línea que contenga más de un ramal y deba tratarse de modo unificado para imputar destinos

Recorridos lineas

Archivo geojson con la cartografía de los recorridos de la linea. Debe ser un LineString 2D, sin multilineas. Se necesita una única línea por cada linea o ramal (si existen ramales). Por ello no se considera el sentido del recorrido (ida o vuelta). Se debe tomar uno solo para construir las paradas. En caso de que existan diferencias en el recorrido, se puede desviar el mismo para que pase por un punto medio y seguir siendo un recorrido representativo del ramal.

Campo

Tipo de dato

Descripción

id_linea

int

Obligatorio. Entero que identifique a la linea.

id_ramal

int

Obligatorio si hay ramales. Entero que identifique al ramal.

stops_distance

int

Opcional. Distancia en metros a aplicarse al interpolar paradas sobre el recorrido.

line_stops_buffer

int

Opcional. Distancia en metros entre paradas para que se puedan agregar en una sola.

geometry

2DLineString

Polilinea del recorrido. No puede ser multilinea.

GPS

Tabla con el posicionamiento de cada interno con información de linea y ramal. La existencia de la tabla GPS permitira calcular KPI adicionales como el Índice Pasajero- Kilómetro (IPK) o el factor de ocupación, entre otros.

Campo

Tipo de dato

Descripción

id_gps

int

Obligatorio. Id único que identifique cada registro.

id_linea_gps

int

Obligatorio. Id único que identifique la linea.

id_ramal_gps

int

Obligatorio si hay ramales. Id único que identifique cada ramal.

interno_gps

int

Obligatorio. Id único que identifique cada interno.

fecha_gps

strftime

Obligatorio. Dia, hora y minuto de la posición GPS del interno.

latitud_gps

float

Obligatorio. Latitud.

longitud_gps

float

Obligatorio. Longitud.

Paradas

Tabla que contenga las paradas de cada linea y ramal (si hay ramales). El campo node_id se utiliza para identificar en qué paradas puede haber transbordo entre dos ramales de la misma linea. Para esas paradas el node_id debe ser el mismo, para las demas paradas debe ser único dentro de la misma línea. De contar con recorridos puede utilizarse el notebook stops_creation_with_node_id_helper.ipynb para crearlas.

Campo

Tipo de dato

Descripción

id_linea

int

Obligatorio. Entero que identifique a la linea.

id_ramal

int

Obligatorio si hay ramales. Entero que identifique a al ramal.

order

int

Obligatorio. Entero único que siga un recorrido de la linea o ramal de manera incremental. No importa el sentido

y

float

Obligatorio. Latitud.

x

float

Obligatorio. Longitud.

node_id

int

Obligatorio. Identifica con el mismo id estaciones donde puede haber transbordo entre ramales de una misma linea. Único para los otros casos dentro de la misma línea.