BDOO – nowe, lepsze dane (?) cz. 1

firm_10226_0d00f1_bigW ostatnich dniach CODGiK opublikował na swojej stronie zbiór danych wektorowych o nazwie BDOO (Baza Danych Obiektów Ogólnogeograficznych). Jest to następca niesławnego BDO (Baza Danych Ogólnogeograficznych, która przedstawiała dane przestrzenne o dokładności odpowiadającej skali 1:250 000). To co je różni to sposób tworzenia. BDO było osobnym produktem (prawie nieaktualizowanym), natomiast BDOO jest to zgeneralizowana Baza Danych Obiektów Topograficznych (skala 1:10 000). Dość trudno określić skalę dokładności tych danych. Na pewno nie jest to 1:250 000 tylko zdecydowanie lepiej. Zasady prowadzenia generalizacji opisane są na stronie 392 załącznika nr 5 do rozporządzenia Ministra Spraw Wewnętrznych i Administracji z dnia 17 listopada 2011 r. w sprawie bazy danych obiektów topograficznych oraz bazy danych obiektów ogólnogeograficznych, a także standardowych opracowań kartograficznych (Dz.U. 2011 nr 279 poz. 1642). Można tam przeczytać, że część danych (punkty) mają dokładnie taką samą dokładność co BDOT10k, dla innych obiektów generalizacją jest zmniejszenie liczby werteksów (minimum co 50 metrów), a obiekty powierzchniowe muszą mieć ponad 150 000 m2. Jest to dość dokładnie opisane.

Zgodnie z nowelizacją ustawy Prawo geodezyjne i kartograficzne z 5 czerwca 2014 r. dane te można pobrać „bez opłat”. Nie ma żadnej licencji określającej sposób ich wykorzystania, można więc domniemywać, że z tymi danymi można robić wszystko…

Obecnie BDOO można pobrać w podziale na województwa, co nie jest najszczęśliwszym rozwiązaniem. Wiem, że kilka osób (w tym my) napisało do CODGiK prośbę o udostępnienie danych dla całej Polski i mam nadzieję, że za niedługo do pobrania będzie też cała Polska. (EDIT: przed chwilą dostaliśmy oficjalną odpowiedź z CODGiK: nie będzie połączonych danych, bo nie przewiduje tego rozporządzenie. Cytat: „jednostką podstawową dla której  prowadzony jest pojedynczy zbiór danych BDOO jest województwo.” I tyle.)

Po pobraniu paczki z województwem dostajemy trzy katalogi:

  • BDOO (z właściwymi danymi)
  • Metadane (z metadanymi)
  • XSD to schemat danych którego zadaniem jest sprawdzenie poprawności struktury danych i zgodności wartości słowników z danymi zawartymi w pliku XML. Proces takiej kontroli zgodności pliku XML z założoną w schemacie strukturą nazywa się walidacją. Plik XSD może być również używany jako źródło danych dla wydania opisu słowników jeśli zawiera w sobie komentarze opisujące użyte w danych skróty. I tak możemy się dowiedzieć (plik OT_BDOT10k_Slowniki.xsd), że Gmw to gmina miejsko – wiejska, a CmG to miasto w gminie miejsko wiejskiej).

Katalog BDOO

W katalogu znajduje się sporo plików GML (ale rozszerzenie to XML). Nazwy plików są dość enigmatyczne: w tabelce poniżej znajduje się ich wyjaśnienie. Krótki przewodnik po konwencji nazewnictwa warstw: OT – obiekt topograficzny, AD – administracja, BU – budowle, PT – pokrycie terenu, TC – tereny chronione, SW – sieć wodna, SK – sieć komunikacyjna. Dodatkowo postfiksy nazw warstw wskazują na typ geometrii: A (area) – poligon, L (line) – linia, P (point) – punkt.

Pełne wyjaśnienie wszystkich warstw i atrybutów znajduje się w załączniku nr 5 do rozporządzenia Ministra Spraw Wewnętrznych i Administracji z dnia 17 listopada 2011 r. w sprawie bazy danych obiektów topograficznych oraz bazy danych obiektów ogólnogeograficznych, a także standardowych opracowań kartograficznych. Numer strony w kolumnie „Dodatkowy opis” odnosi się właśnie do tego dokumentu.

L.p.NazwaWyjaśnienie nazwyDodatkowy opis
1OT_ADJA_AJednostka podziału administracyjnegostr. 10.
2OT_ADMS_PPunkt główny miejscowościstr. 14.
3OT_BUHD_LBudowla hydrotechniczna (linia)str. 21.
4OT_BUHD_PBudowla hydrotechniczna (punkt)str. 21.
5OT_BUIN_LBudowla inżynierska str. 25.
6OT_BUIT_PInne urządzenia technicznestr. 24.
7OT_BUUO_LUmocnienie drogowe, kolejowe i wodnestr. 33.
8OT_BUWT_PWysoka budowla technicznastr. 36.
9OT_BUZM_LBudowla ziemnastr. 37.
10OT_KUIK_AInny kompleks użytkowania terenustr. 46.
11OT_KUKO_AKompleks komunikacyjny str. 47.
12OT_KUPG_AKompleks przemysłowo - gospodarczystr. 51.
13OT_KUSC_AKompleks sakralny i cmentarzstr. 53.
14OT_KUSK_AKompleks sportowo rekreacyjnystr. 54.
15OT_OIKM_PObiekt związany z komunikacjąstr. 60.
16OT_OIMK_AMokradłastr. 60.
17OT_PTGN_ATeren gruntów nieużytkowanychstr. 68.
18OT_PTLZ_ATeren leśny lub zadrzewionystr. 70.
19OT_PTNZ_AInny teren niezabudowanystr. 72.
20OT_PTPL_ATeren placówstr. 72.
21OT_PTRK_ATeren roślinności krzewiastejstr. 73.
22OT_PTSO_ATeren składowania odpadówstr. 74.
23OT_PTTR_ATeren roślinności trawiastej lub upraw rolnychstr. 75.
24OT_PTUT_ATeren upraw trwałychstr. 76.
25OT_PTWP_AWoda powierzchniowastr. 77.
26OT_PTWZ_ATereny zwałowisk i wyrobiskstr. 78.
27OT_PTZB_AZabudowastr. 79.
28OT_SKDR_LDrogastr. 80.
29OT_SKPP_LPrzeprawastr. 83.
30OT_SKRW_PRondo lub węzeł drogowystr. 87.
31OT_SKTR_LTor lub zespół torówstr. 86.
32OT_SULN_LLinia napowietrznastr. 89.
33OT_SWKN_LKanałstr. 92.
34OT_SWRM_LRów melioracyjnystr. 93.
35OT_SWRS_LRzeka strumieństr. 94.
36OT_TCON_AObszar Natura 2000str. 96.
37OT_TCPK_AParki Krajobrazowestr. 97.
38OT_TCPN_AParki Narodowestr. 98.
39OT_TCRZ_ARezerwatystr. 98.

Dodatkowo w katalogu BDOO znajdują się pliki „uzytkownikXX.xml”. Jest ich kilkanaście i zawierają dane adresowe do województw. Co to tam robi – nie wiem…

Oprócz tego, w katalogu BDOO znajdują się następujące pliki:

  • OT_Ciek
  • OT_LiniaKolejowa
  • OT_SzlakDrogowy
  • OT_WezelKolejowy
  • OT_ZbiornikWodny

Są to plik GML bez geometrii zawierające dodatkowe atrybuty do niektórych obiektów (nazwy dla rzek, numerację dróg itp.) Jest z tym pewien problem. Złączenia zostały zapisane w notacji XLink, która jest standardem W3C i zapewne OGC w stosunku do XML i dalej GML, ale… nie jest zaimplementowana w większości oprogramowania GIS, w tym QGIS. Po otwarciu GML w edytorze tekstu widać, że np. w warstwie OT_SWRS_L (rzeki i strumienie) jest „tajne pole” ciek1, którego nie zobaczymy w tabeli atrybutów QGIS. A użycie tego pola to jedyny sposób na ustanowienie relacji (złączenia tabel np. w celu przypisania numeru dróg do dróg). Czyli dane trzymają się standardów tak bardzo, że aż trudno z nich korzystać w oprogramowaniu GIS. Pozostaje otwierać pliki do złączenia w jakimś edytorze i ręcznie zmieniać lub skorzystać z danych przerobionych przez autora bloga geoinformatyka.com.pl, który nie dość, że połączył wszystkie dane dla Polski, to usunął xlink z GML, dzięki czemu QGIS poprawnie widzi kolumny niezbędne do złączenia.

Na koniec ciekawostka. W czasie pisania tego artykułu, data ostatniej modyfikacji dla wszystkich województw to 27 luty 2014. Rozporządzenie przewiduje, że (rozdział 4, paragraf 15) „BDOO aktualizuje się na podstawie danych zawartych w BDOT10k niezwłocznie po aktualizacji danych w BDOT10k.”, czyli za każdym razem jak do zasobu dotrze jakiś zaktualizowany arkusz BDOT10k, to BDOO ma być aktualizowane. Poczekamy, zobaczymy.

Garść porad praktycznych:

Wielu lubi pliki SHP. W tym wypadku będzie problem, ponieważ nagłówki kolumn są dłuższe niż przewiduje SHP (czyli 10 znaków). Podczas eksportu QGIS obetnie nadmiarowe znaki, a w przypadku, gdyby po obcięciu, któreś kolumny miały tożsame nazwy – QGIS doda cyfry na końcu.

Większość narzędzi QGIS wykona analizy bezpośrednio na plikach GML (np. policzenie ilości punktów w poligonie – ftools), ale wynik i tak będzie trzeba w SHP, co spowoduje obcięcie znaków.

Wszystkie granice administracyjne zapisane są w jednym pliku GML/XML. Dziwnie się to ogląda, ponieważ gminy przykrywają powiaty, więc zaznaczenie powiatu tabeli atrybutów w QGIS nie spowoduje podświetlenia żadnego elementu. W celu wyciągnięcia powiatów z tej warstwy niezbędne jest zaznaczenie wszystkich obiektów rodzaj=’Pow’ i zapisanie do nowego pliku.

W części kolejnej przedstawimy nasze wrażenia z testowania danych BDOO.