W ostatnich dniach CODGiK opublikował na swojej stronie zbiór danych wektorowych o nazwie BDOO (Baza Danych Obiektów Ogólnogeograficznych). Jest to następca niesławnego BDO (Baza Danych Ogólnogeograficznych, która przedstawiała dane przestrzenne o dokładności odpowiadającej skali 1:250 000). To co je różni to sposób tworzenia. BDO było osobnym produktem (prawie nieaktualizowanym), natomiast BDOO jest to zgeneralizowana Baza Danych Obiektów Topograficznych (skala 1:10 000). Dość trudno określić skalę dokładności tych danych. Na pewno nie jest to 1:250 000 tylko zdecydowanie lepiej. Zasady prowadzenia generalizacji opisane są na stronie 392 załącznika nr 5 do rozporządzenia Ministra Spraw Wewnętrznych i Administracji z dnia 17 listopada 2011 r. w sprawie bazy danych obiektów topograficznych oraz bazy danych obiektów ogólnogeograficznych, a także standardowych opracowań kartograficznych (Dz.U. 2011 nr 279 poz. 1642). Można tam przeczytać, że część danych (punkty) mają dokładnie taką samą dokładność co BDOT10k, dla innych obiektów generalizacją jest zmniejszenie liczby werteksów (minimum co 50 metrów), a obiekty powierzchniowe muszą mieć ponad 150 000 m2. Jest to dość dokładnie opisane.
Zgodnie z nowelizacją ustawy Prawo geodezyjne i kartograficzne z 5 czerwca 2014 r. dane te można pobrać “bez opłat”. Nie ma żadnej licencji określającej sposób ich wykorzystania, można więc domniemywać, że z tymi danymi można robić wszystko…
Obecnie BDOO można pobrać w podziale na województwa, co nie jest najszczęśliwszym rozwiązaniem. Wiem, że kilka osób (w tym my) napisało do CODGiK prośbę o udostępnienie danych dla całej Polski i mam nadzieję, że za niedługo do pobrania będzie też cała Polska. (EDIT: przed chwilą dostaliśmy oficjalną odpowiedź z CODGiK: nie będzie połączonych danych, bo nie przewiduje tego rozporządzenie. Cytat: “jednostką podstawową dla której prowadzony jest pojedynczy zbiór danych BDOO jest województwo.” I tyle.)
Po pobraniu paczki z województwem dostajemy trzy katalogi:
W katalogu znajduje się sporo plików GML (ale rozszerzenie to XML). Nazwy plików są dość enigmatyczne: w tabelce poniżej znajduje się ich wyjaśnienie. Krótki przewodnik po konwencji nazewnictwa warstw: OT – obiekt topograficzny, AD – administracja, BU – budowle, PT – pokrycie terenu, TC – tereny chronione, SW – sieć wodna, SK – sieć komunikacyjna. Dodatkowo postfiksy nazw warstw wskazują na typ geometrii: A (area) – poligon, L (line) – linia, P (point) – punkt.
Pełne wyjaśnienie wszystkich warstw i atrybutów znajduje się w załączniku nr 5 do rozporządzenia Ministra Spraw Wewnętrznych i Administracji z dnia 17 listopada 2011 r. w sprawie bazy danych obiektów topograficznych oraz bazy danych obiektów ogólnogeograficznych, a także standardowych opracowań kartograficznych. Numer strony w kolumnie “Dodatkowy opis” odnosi się właśnie do tego dokumentu.
L.p. | Nazwa | Wyjaśnienie nazwy | Dodatkowy opis |
1 | OT_ADJA_A | Jednostka podziału administracyjnego | str. 10. |
2 | OT_ADMS_P | Punkt główny miejscowości | str. 14. |
3 | OT_BUHD_L | Budowla hydrotechniczna (linia) | str. 21. |
4 | OT_BUHD_P | Budowla hydrotechniczna (punkt) | str. 21. |
5 | OT_BUIN_L | Budowla inżynierska | str. 25. |
6 | OT_BUIT_P | Inne urządzenia techniczne | str. 24. |
7 | OT_BUUO_L | Umocnienie drogowe, kolejowe i wodne | str. 33. |
8 | OT_BUWT_P | Wysoka budowla techniczna | str. 36. |
9 | OT_BUZM_L | Budowla ziemna | str. 37. |
10 | OT_KUIK_A | Inny kompleks użytkowania terenu | str. 46. |
11 | OT_KUKO_A | Kompleks komunikacyjny | str. 47. |
12 | OT_KUPG_A | Kompleks przemysłowo - gospodarczy | str. 51. |
13 | OT_KUSC_A | Kompleks sakralny i cmentarz | str. 53. |
14 | OT_KUSK_A | Kompleks sportowo rekreacyjny | str. 54. |
15 | OT_OIKM_P | Obiekt związany z komunikacją | str. 60. |
16 | OT_OIMK_A | Mokradła | str. 60. |
17 | OT_PTGN_A | Teren gruntów nieużytkowanych | str. 68. |
18 | OT_PTLZ_A | Teren leśny lub zadrzewiony | str. 70. |
19 | OT_PTNZ_A | Inny teren niezabudowany | str. 72. |
20 | OT_PTPL_A | Teren placów | str. 72. |
21 | OT_PTRK_A | Teren roślinności krzewiastej | str. 73. |
22 | OT_PTSO_A | Teren składowania odpadów | str. 74. |
23 | OT_PTTR_A | Teren roślinności trawiastej lub upraw rolnych | str. 75. |
24 | OT_PTUT_A | Teren upraw trwałych | str. 76. |
25 | OT_PTWP_A | Woda powierzchniowa | str. 77. |
26 | OT_PTWZ_A | Tereny zwałowisk i wyrobisk | str. 78. |
27 | OT_PTZB_A | Zabudowa | str. 79. |
28 | OT_SKDR_L | Droga | str. 80. |
29 | OT_SKPP_L | Przeprawa | str. 83. |
30 | OT_SKRW_P | Rondo lub węzeł drogowy | str. 87. |
31 | OT_SKTR_L | Tor lub zespół torów | str. 86. |
32 | OT_SULN_L | Linia napowietrzna | str. 89. |
33 | OT_SWKN_L | Kanał | str. 92. |
34 | OT_SWRM_L | Rów melioracyjny | str. 93. |
35 | OT_SWRS_L | Rzeka strumień | str. 94. |
36 | OT_TCON_A | Obszar Natura 2000 | str. 96. |
37 | OT_TCPK_A | Parki Krajobrazowe | str. 97. |
38 | OT_TCPN_A | Parki Narodowe | str. 98. |
39 | OT_TCRZ_A | Rezerwaty | str. 98. |
Dodatkowo w katalogu BDOO znajdują się pliki “uzytkownikXX.xml”. Jest ich kilkanaście i zawierają dane adresowe do województw. Co to tam robi – nie wiem…
Oprócz tego, w katalogu BDOO znajdują się następujące pliki:
Są to plik GML bez geometrii zawierające dodatkowe atrybuty do niektórych obiektów (nazwy dla rzek, numerację dróg itp.) Jest z tym pewien problem. Złączenia zostały zapisane w notacji XLink, która jest standardem W3C i zapewne OGC w stosunku do XML i dalej GML, ale… nie jest zaimplementowana w większości oprogramowania GIS, w tym QGIS. Po otwarciu GML w edytorze tekstu widać, że np. w warstwie OT_SWRS_L (rzeki i strumienie) jest “tajne pole” ciek1, którego nie zobaczymy w tabeli atrybutów QGIS. A użycie tego pola to jedyny sposób na ustanowienie relacji (złączenia tabel np. w celu przypisania numeru dróg do dróg). Czyli dane trzymają się standardów tak bardzo, że aż trudno z nich korzystać w oprogramowaniu GIS. Pozostaje otwierać pliki do złączenia w jakimś edytorze i ręcznie zmieniać lub skorzystać z danych przerobionych przez autora bloga geoinformatyka.com.pl, który nie dość, że połączył wszystkie dane dla Polski, to usunął xlink z GML, dzięki czemu QGIS poprawnie widzi kolumny niezbędne do złączenia.
Na koniec ciekawostka. W czasie pisania tego artykułu, data ostatniej modyfikacji dla wszystkich województw to 27 luty 2014. Rozporządzenie przewiduje, że (rozdział 4, paragraf 15) “BDOO aktualizuje się na podstawie danych zawartych w BDOT10k niezwłocznie po aktualizacji danych w BDOT10k.”, czyli za każdym razem jak do zasobu dotrze jakiś zaktualizowany arkusz BDOT10k, to BDOO ma być aktualizowane. Poczekamy, zobaczymy.
Wielu lubi pliki SHP. W tym wypadku będzie problem, ponieważ nagłówki kolumn są dłuższe niż przewiduje SHP (czyli 10 znaków). Podczas eksportu QGIS obetnie nadmiarowe znaki, a w przypadku, gdyby po obcięciu, któreś kolumny miały tożsame nazwy – QGIS doda cyfry na końcu.
Większość narzędzi QGIS wykona analizy bezpośrednio na plikach GML (np. policzenie ilości punktów w poligonie – ftools), ale wynik i tak będzie trzeba w SHP, co spowoduje obcięcie znaków.
Wszystkie granice administracyjne zapisane są w jednym pliku GML/XML. Dziwnie się to ogląda, ponieważ gminy przykrywają powiaty, więc zaznaczenie powiatu tabeli atrybutów w QGIS nie spowoduje podświetlenia żadnego elementu. W celu wyciągnięcia powiatów z tej warstwy niezbędne jest zaznaczenie wszystkich obiektów rodzaj=’Pow’ i zapisanie do nowego pliku.
W części kolejnej przedstawimy nasze wrażenia z testowania danych BDOO.