Seriál o jízdních řádech – zdroje dat
Datové sady pro úlohy
Pražská integrovaná doprava – platnost od 19.1.2020 do 1.2.2020 (snažili jsme se zvolit dobu, kdy bylo nejméně výluk). Úlohy testujte na pondělí 20.1.2020. Staženo z archivu OpenMobilityData, původním zdrojem dat je ROPID. Data jsou pod licencí CC-BY 4.0.
Vlaky – jízdní řád pro rok 2020, neobsahuje změny a výluky. Úlohy testujte rovněž na pondělí 20.1.2020. Vznikl převodem z původního formátu naším převodním skriptem. Licence ani podmínky použití nejsou známé.
Poznámky k datovým sadám
Pražská integrovaná doprava
- V
stop_times.txt
jsou u některých spojů uvedeny i zastávky, kterými spoj projíždí. Poznáte je podle hodnot ve sloupečkupickup_type
(možnost nástupu) adrop_off_type
(možnost výstupu). 0 znamená normální nástup/výstup, 1 znamená, že nástup/výstup není možný, 3 znamená zastavení na znamení. Projížděné zastávky mají 1 v obou sloupečcích, kombinace 1 a 0 znamená zastávku jen pro nástup či výstup. - Některá stanoviště používají více různých
stop_id
, které se liší jen zařazením do tarifní zóny, ale fyzicky je to totéž stanoviště (např.U651Z6
aU651Z6P
). Ve všem programu je považujte za totožné (tedy na přestup ze spoje zastavujícího naU651Z6
do spoje zastavujícího naU651Z6P
stačí základní čas pro přestup v rámci stanoviště, tedy 2 minuty). V zásadě můžete zestop_id
odstranit vše, co následuje za částíZ
číslo-stanoviště. - Soubor
pathways.txt
má na začátku několik divných netisknutelných znaků – takzvaný Byte Order Mark (BOM). Jde o technický relikt, který můžete ignorovat. Python je třeba bude považovat za součást názvu prvního sloupečku (který se tak místoOBJECTID
bude jmenovat (divné znaky)OBJECTID
), ale ten stejně nejspíš nebudete používat.
Vlaky
- Chybí soubor
agency.txt
(rozlišení dopravců). Podle specifikace je sice povinný, ale předpokládám, že ho potřebovat nebudete.
Formát GTFS
Podrobnosti o formátu GTFS naleznete v oficiální referenční příručce (v angličtině).
Dotazy
V případě jakýchkoli dotazů ohledně zadání, datových sad nebo čehokoli, co se seriálem souvisí (včetně rozšiřujících materiálů níže), se nebojte ptát na našem fóru.
Další zdroje
Zde uvádíme další užitečné zdroje, datové sady, odkazy a materiály. Některé z nich jsme zmiňovali v seriálu, ale k řešení úloh je nepotřebujete. Průběžně asi ještě něco bude přibývat.
Celostátní informační systém o jízdních řádech (CIS JŘ) a formát JDF
Odkazy na jednotlivé datové sady CIS JŘ naleznete na stránkách ministerstva dopravy.
Popis různých verzí formátu JDF: JDF 1.8, JDF 1.9, JDF 1.10, JDF 1.11