Input de datos

Este es el esquema de datos que deben seguir los archivos suministrados como insumos a UrbanTrips.

Transacciones

Tabla con las transacciones.

Campo

Tipo de dato

Descripción

id_trx

int

Obligatorio. Id único que identifique cada registro y permita luego vincular la transacción en Urbantrips con el dataset original.

fecha_trx

strftime

Obligatorio. Timestamp de la transaccion. Puede ser solo el día o el dia, hora y minuto.

id_tarjeta_trx

int/str

Obligatorio. Un id que identifique a cada tarjeta.

modo_trx

str

Opcional. Se estandarizará con lo especificado en modos en el archivo de configuración. Si no hay información en la tabla, se imputará todo como autobus.

hora_trx

int

Opcional a menos que fecha_trx no tenga información de la hora y minutos. Entero de 0 a 23 indicando la hora de la transacción.

id_linea_trx

int

Obligatorio. Entero que identifique a la linea.

id_ramal_trx

int

Opcional. Entero que identifique al ramal.

interno_trx

int

Obligatorio. Entero que identifique al interno

orden_trx

int

Opcional a menos que fecha_trx no tenga información de la hora y minutos. Entero comenzando en 0 que esatblezca el orden de transacciones para una misma tarjeta en un mismo día.

latitud_trx

float

Obligatorio. Latitud de la transacción.

longitud_trx

float

Obligatorio. Longitud de la transacción.

factor_expansion

float

Opcional. Factor de expansión en caso de tratarse de una muestra.

Información de lineas y ramales

Tabla con metadata descriptiva de las lineas y ramales. La forma de tratar a las líneas y ramales en UrbanTrips es muy específica, por lo tanto se aconseja leer el apartado Sobre el concepto de lineas y ramales en UrbanTrips.

Campo

Tipo de dato

Descripción

id_linea

int

Obligatorio. Entero que identifique a la linea.

nombre_linea

str

Obligatorio. Nombre de la línea.

modo

str

Obligatorio. Modo de la linea.

id_ramal

int

Obligatorio si hay ramales.Entero que identifique al ramal.

nombre_ramal

str

Obligatorio si hay ramales. Nombre del ramal.

empresa

str

Opcional. Nombre de la empresa.

descripcion

str

Opcional. Descripción adicional de la linea o ramal.

id_linea_agg

int

Opcional. id único de una línea que contenga más de un ramal y deba tratarse de modo unificado para imputar destinos.

nombre_linea_agg

str

Opcional. descripción de la línea que contenga más de un ramal y deba tratarse de modo unificado para imputar destinos

Recorridos lineas

Archivo geojson con la cartografía de los recorridos de la linea. Debe ser un LineString 2D, sin multilineas. Se necesita una única línea por cada linea o ramal (si existen ramales). Por ello no se considera el sentido del recorrido (ida o vuelta). Se debe tomar uno solo para construir las paradas. En caso de que existan diferencias en el recorrido, se puede desviar el mismo para que pase por un punto medio y seguir siendo un recorrido representativo del ramal.

Campo

Tipo de dato

Descripción

id_linea

int

Obligatorio. Entero que identifique a la linea.

id_ramal

int

Obligatorio si hay ramales. Entero que identifique al ramal.

stops_distance

int

Opcional. Distancia en metros a aplicarse al interpolar paradas sobre el recorrido.

line_stops_buffer

int

Opcional. Distancia en metros entre paradas para que se puedan agregar en una sola.

geometry

2DLineString

Polilinea del recorrido. No puede ser multilinea.

GPS

Tabla con el posicionamiento de cada interno con información de linea y ramal. La existencia de la tabla GPS permitira calcular KPI adicionales como el Índice Pasajero- Kilómetro (IPK) o el factor de ocupación, entre otros.

Campo

Tipo de dato

Descripción

id_gps

int

Obligatorio. Id único que identifique cada registro.

id_linea_gps

int

Obligatorio. Id único que identifique la linea.

id_ramal_gps

int

Obligatorio si hay ramales. Id único que identifique cada ramal.

interno_gps

int

Obligatorio. Id único que identifique cada interno.

fecha_gps

strftime

Obligatorio. Dia, hora y minuto de la posición GPS del interno.

latitud_gps

float

Obligatorio. Latitud.

longitud_gps

float

Obligatorio. Longitud.

servicios_gps

int | str

Obligatorio si se quiere procesar serviciobs. Columna que contiene la apertura y cierre de un servicio.

velocity_gps

float

Opcional. Velocidad del vehíuclo en km/h.

Paradas

Tabla que contenga las paradas de cada linea y ramal (si hay ramales). El campo node_id se utiliza para identificar en qué paradas puede haber transbordo entre dos ramales de la misma linea. Para esas paradas el node_id debe ser el mismo, para las demas paradas debe ser único dentro de la misma línea. De contar con recorridos puede utilizarse el notebook stops_creation_with_node_id_helper.ipynb para crearlas.

Campo

Tipo de dato

Descripción

id_linea

int

Obligatorio. Entero que identifique a la linea.

id_ramal

int

Obligatorio si hay ramales. Entero que identifique a al ramal.

order

int

Obligatorio. Entero único que siga un recorrido de la linea o ramal de manera incremental. No importa el sentido

y

float

Obligatorio. Latitud.

x

float

Obligatorio. Longitud.

node_id

int

Obligatorio. Identifica con el mismo id estaciones donde puede haber transbordo entre ramales de una misma linea. Único para los otros casos dentro de la misma línea.

Zonificaciones

Tabla que contenga las zonificaciones o zonas de análisis de tránsito para las que se quieran agregar datos. No existe una esquema de datos definido, puede tener cualquier columna o atributo y la cantidad que se desee, siempre que se especifique correctamente en el archivo de configuración.

Polígonos de interés

id

tipo

geometry

id

str

Obligatorio. Texto que identifique con un nombre al polígono de interés.

tipo

str

Debe identificar si se trata de un polígono de interés o de una cuenca. Debe tomar valores poligono o cuenca.

geometry

Polygon o MultiPolygon

Polígono de la zona de interés.

Tiempos de viaje entre estaciones

Campo

Tipo de dato

Descripción

id_o

int

Obligatorio. id de la estación de origen.

id_linea_o

int

Obligatorio. id de la línea de origen.

id_ramal_o

int

id del ramal de origen en caso de que existan ramales.

lat_o

float

Obligatorio. Latitud de la estación de origen.

lon_o

float

Obligatorio. Longitud de la estación de origen.

id_d

int

Obligatorio. id de la estación de destino.

id_linea_d

int

Obligatorio. id de la línea de destino.

id_ramal_d

int

id del ramal de destino en caso de que existan ramales.

lat_d

float

Obligatorio. Latitud de la estación de destino.

lon_d

float

Obligatorio. Longitud de la estación de destino.

travel_time_min

float

Obligatorio. Tiempo de viaje en minutos entre las dos estaciones.