Lekce 3: Otevřená data
Otevřená data musí být především:
- přístupná jako datové soubory ve strojově čitelném a otevřeném formátu s úplným a aktuálním obsahem databáze nebo agregovanou statistikou
- opatřená neomezujícími podmínkami užití
- opatřená dokumentací
- dostupná ke stažení bez technických překážek (registrace, omezení počtu přístupů, CAPTCHA apod.)
- připravena s cílem co nejsnazšího strojového zpracování programátory apod.
- opatřená kontaktem na kurátora pro zpětnou vazbu (chyby, žádost o rozšíření apod.)
Pokud datová sada nesplňuje jednu z podmínek, nejedná se o otevřená data.
Otevřenými daty nejsou:
- vyhledávací formulář určený pro koncové uživatele
- webová stránka s dalšími informacemi
- veřejné mapové rozhraní GIS (jedná se pouze o prohlížecí službu)
- webová služba zpřístupňující jednotlivé záznamy tvořící datovou sadu s omezením počtu přístupů
- datová sada ve formátu PDF
- datová sada ve formátu XLS (XLSX) naformátovaná pro tisk
- datová sada v pseudo-CSV formátu (např. jiný oddělovač než čárka)
Míru otevřenosti dat je možné vyjádřit pomocí 5 stupňů otevřenosti, které jsou znázorněny na následujícím obrázku (stupeň je vyjádřen počtem hvězdiček).
Oficiálně lze tedy za otevřená data v ČR považovat pouze ta data, která jsou registrovaná v Národním katalogu otevřených dat (NKOD). Pokud nevíme, kde data hledat, je ideální pro začátek zkusit právě NKOD, který obsahuje přes 50 poskytovatelů z řad ministerstev či dalších orgánů veřejné správy. Přes uživatelské rozhraní katalogu lze vyhledávat datové sady jednak pomocí textového hledání v jejich názvech a popisech, ale také podle názvu poskytovatele, klíčových slov, témat datových sad a formátu datových souborů. Po nalezení hledané datové sady je zobrazen její detailní záznam, tzv. metadata. Ten obsahuje název, popis, klíčová slova a témata, kterými je datová sada popsaná, dále pak periodicitu aktualizace datové sady, informace o tom, jakého časového úseku, případně území se datová sada týká, a pak také odkaz na dokumentaci datové sady. V dokumentaci se nachází veškeré informace k vybrané datové sadě, včetně informací o tom, jak data nejlépe zpracovávat, nebo na co si naopak dát při jejich zpracování pozor. Ve spodní části záznamu o datové sadě jsou pak uvedeny její distribuce. Distribuce datové sady představují její fyzickou podobu ve formě souborů ke stažení nebo datové služby (API). Jedna datová sada může být k dispozici ve formě více distribucí, které se od sebe liší v případě souboru ke stažení datovým formátem, nebo se jedná o datovou službu. Každá distribuce pak má specifikovány své podmínky užití, datový formát a, pokud je k dispozici, strojově čitelné schéma souboru ke stažení či specifikaci datové služby.
Jedním z lídru publikování otevřených dat v ČR je i Královéhradecký kraj, který k 1. 5. 2022 publikoval v NKOD celkem 54 datových sad. Všechny datové sady jsou kromě NKOD dostupné i přímo na datovém portálu Královéhradeckého kraje Data KHK. Přehled všech publikovaných otevřených datových sad naleznete zde.
Pokud disponujete kvalitními vlastními daty v ucelených datových sadách, možná by stálo za to je do NKOD registrovat. Registrovat datovou sadu do NKOD může poskytovatel dvěma základními způsoby. Pro drobnější či začínající poskytovatele, jejichž záznamy o datových sadách se příliš nemění a není jich mnoho, slouží registrační formulář přímo v NKOD. Ten provede poskytovatele vyplněním registračního záznamu pomocí nápověd a našeptávání hodnot. Takto vyplněná registrace se pak zasílá do datové schránky NKOD. Stejným způsobem je pak řešena aktualizace a mazání záznamů, kdy každá změna je zasílána jako samostatná datová zpráva do datové schránky NKOD, což při větším počtu záznamů či jejich časté aktualizaci bývá nepraktické. Přehledný návod pro přímou publikaci dat do NKOD je k dispozice zde. Druhou možností registrace datové sady do NKOD pro větší či pokročilejší poskytovatele je použití Lokálního katalogu otevřených dat (LKOD). Tento postup je však příliš složitý a nedoporučujeme jej. V případě, že byste vaše obec či město, MAS nebo DSO měla zájem publikovat data v NKOD prostřednictvím LKOD, vám doporučujeme se obrátit na správce portálu Data KHK a sdílet vaše data prostřednictvím tohoto portálu.
Otevřenými daty, které můžete publikovat, mohou být např.:
- jízdní řády
- ordinační doba lékařů
- aktuální opravy
- uzavírky
- rekonstrukce
- harmonogram čištění ulic
- evidence psů
- katalog knihovny atd.
Detailní informace k problematice otevřených dat poskytuje Portál otevřených dat spravovaný Digitální a informační agenturou.
Tahák do kapsy:
