O co chodzi w OpenStreetMap?

Konieczność posiadania podkładu mapowego jest często sporym problemem w działaniach GIS-owych, szczególnie jeśli niezbędne są prawa do publikacji. Ceny takich podkładów, szczególnie wektorowych, mogą być barierą nie do przeskoczenia dla niskobudżetowych projektów. Skoro mamy już wolne oprogramowanie, dlaczego miałoby nie być wolnych map? Przy obecnym stanie techniki zbieranie danych przestało wszak wymagać specjalnych umiejętności i drogiego sprzętu. Dlatego możliwe stało się powstanie takich projektów, jak OpenStreetMap. Poniżej postaram sie opisać najważniejsze zasady funkcjonowania i korzystania z zasobów OSM.

1. Geneza projektu

Idea OSM powstała w 2004 roku w Wielkiej Brytanii. Fundator, Steve Coast, zapragnął najpierw stworzenia cyfrowej mapy swojej okolicy z użyciem odbiornika GPS. Wkrótce okazało się, że pomysłem można „zarazić“ więcej osób. Katalizatorem rozwoju projektu był również utrudniony i drogi dostęp do państwowych danych przestrzennych (skąd my to znamy?). Projekt szybko objął zasięgiem cały świat i dorobił się własnego zestawu narzędzi do zbierania, edycji, kontroli wersji, dystrybucji i wizualizacji danych przestrzennych. Założeniem była możliwość ich pobierania i wykorzystywania na zasadach podobnych do oprogramowania Open Source, w przeciwieństwie do drakońskich „Terms of service” dostawców komercyjnych i stosu oświadczeń wymaganych przez administrację publiczną. Tak powstała „Wikipedia wśród map“.

2. UMP a OSM

UMP-pcPL jest podobnym projektem, zakładającym tworzenie mapy przez wolontariuszy. Istnieją jednak istotne różnice pomiędzy nimi. Podczas gdy podstawowym założeniem OSM jest możliwość edycji przez każdego, UMP jest edytowana przez wybranych redaktorów. Pozostali uczestnicy mają możliwość wpływu na treść mapy poprzez przesyłanie uwag i opisanych śladów GPS. Ponadto UMP była tworzona od początku z myślą o wykorzystaniu w odbiornikach GPS firmy Garmin, a nie jako baza danych do różnych zastosowań. Dane UMP przechowywane są w plikach tekstowych w tak zwanym polish map format, zoptymalizowanych do kompilacji do formatu Garmina a nie wykorzystania w środowisku GIS. Wreszcie – jak sama nazwa wskazuje, UMP koncentruje się głównie na obszarze Polski.

3. Format i model danych

Podstawowy format wymiany danych OSM ma postać tekstową, opartą na XML. Pliki w tym formacie mają rozszerzenie .osm. Ze względu na niestandardowy model danych, na ogół nie może on być odczytany przez standardowe narzędzia – niezbędne jest użycie konwertera. Przez twórców projektu model ten uważany jest za intuicyjny i innowacyjny, przez przeciwników – jako podręcznikowy przykład wynajdywania koła na nowo. A jak to wygląda w praktyce?

W bazie danych istnieją trzy podstawowe typy, które nazywają się nodes, ways i relationsNodes są podstawowym elementem budulcowym i jako jedyne mają zdefiniowane współrzędne – B i L w układzie WGS84. Mogą występować jako samodzielne punkty lub wierzchołki obiektów liniowych i powierzchniowych, ale sposób zapisu jest zawsze taki sam.

Ways powstają z grupowania nodes i mogą tworzyć geometrie liniowe lub powierzchniowe, przy czym typ geometrii jest bez znaczenia dla OSM i jest sprawdzany dopiero przy konwersji do formatów GISowych. Kilka różnych ways może mieć wspólne nodes (tak jak węzły w modelu topologicznym), np. granica lasu może dzielić nodes z drogą, rzeka z granicą państwową, teren zabudowany z parkiem i tak dalej. Niestety nie ma żadnych zabezpieczeń przed przecinaniem się sąsiadujących geometrii, poza standardowo włączonym w edytorach dociąganiem do węzła (snappingiem). 

Relations służą do grupowania nodes i ways w obiekty wyższego rzędu. Mogą być to na przykład linie komunikacji miejskiej, szlaki turystyczne albo wieloczęściowe poligony.

Atrybuty w OSM noszą nazwę tagów i mogą być przypisywane do każdego z wyżej wymienionych elementów niezależnie. Nie ma tu typowej tabeli atrybutów z kolumnami i wierszami – zamiast tego jest układ klucz:wartość. Nie ma również żadnych ograniczeń co do zawartości tagów,zarówno w zakresie kluczy jak i wartości – są jedynie pewne konwencje, opisane w dokumentacji znajdującej się pod adresem http://wiki.openstreetmap.org/wiki/Map_Features

A oto przykłady tagowania:

highway: tertiary
maxspeed: 90

oznacza: droga trzeciorzędna (w Polsce przyjęło się tak oznaczać drogi powiatowe), o prędkości dopuszczalnej 90 km/h.

Natomiast zapis:

landuse: forest
wood: coniferous
name: Uroczysko Mrokowiec

– oznacza: pokrycie terenu – las, typ lasu – iglasty, nazwa własna – Uroczysko Mrokowiec.

Niestety – nie wszyscy użytkownicy trzymają się konwencji, ponadto istnieją różne możliwości otagowania dokładnie tych samych charakterystyk – np. nieczynna linia kolejowa może występować jako railway: disused, railway: abandoned, albo railway:rail + disused=yes.

4. Licencja

Obecnie (listopad 2011) dane OSM są dostępne na licencji Creative Commons Attribution-ShareAlike 2.0 Unported. Jest to wcześniejsza wersja licencji, na której są publikowane treści z Wikipedii. Zasady są dość liberalne – zezwalają na sporządzenie dowolnej ilości kopii, przerabianie, publiczne udostępnianie oryginału i przeróbek w dowolnych celach (a więc także zarobkowych), pod dwoma warunkami:

1. Obowiązkowe jest podanie informacji o źródle i licencji oryginalnych danych (Attribution). W praktyce wymóg ten jest spełniony po umieszczeniu formułki „Dane (c)społeczność OpenStreetMap.org, CC-BY-SA“ lub podobnej. Jeśli rozpowszechniamy dokument w formie elektronicznej, to OpenStreetMap.org oraz CC-BY-SA powinny być linkami do stron OSM i Creative Commons.

2. Wtórne rozpowszechnianie oryginalnych lub przerobionych danych musi się odbywać na tych samych warunkach, czyli w praktyce – na licencji CC-BY-SA (Share Alike). Oznacza to, że „zabrania się zabraniać” – nie można wykonać mapy wykorzystującej materiały OSM i umieścić na niej formułki „wszelkie prawa zastrzeżone”, ani też zamkniętej wersji „Premium“ bazy danych.

Należy zwrócić uwagę, że reguła ta nie dotyczy sytuacji, kiedy OSM jest tylko jedną z dostępnych warstw informacyjnych. Wówczas całość – np. geoportalu – nie musi podlegać zasadom CC-BY-SA, licencja ta musi obowiązkowo obejmować tylko warstwę z danymi OSM. Taki produkt, składający się z kilku niezależnych i możliwych do rozdzielenia źródeł danych, nazywa się collective work.

W bliżej nieokreślonej przyszłości licencja ma zostać zmieniona na nową, zwaną Open Database License. Ma ona rozdzielić zasady korzystania z samej bazy danych i produktów z niej wytworzonych (np. wydruków, wizualizacji). Na razie jednak zmiana nie została formalnie dokonana i do aktualnie publikowanych danych stosuje się wyłącznie postanowienia CC-BY-SA.

5. Osobowość prawna

Nad całością projektu czuwa brytyjska fundacja OpenStreetMap Foundation. Jej główne cele statutowe to utrzymanie infrastruktury serwerowej, pozyskiwanie funduszy na rozwój i rozwiązywanie ewentualnych sporów sądowych. Fundacja organizuje również wydarzenia promujące projekt, np. coroczną konferencję „State of the Map“.

W Polsce od marca 2011 roku działa Stowarzyszenie OpenStreetMap Polska. Jest ono bytem niezależnym od fundacji i zajmuje się szeroko pojętymi działaniami PR: promocją w mediach, organizacją warsztatów i grupowego kartowania wybranych obszarów (tak zwane mapping party), a także rozwojem oprogramowania wykorzystującego dane OSM.

6. Źródła danych

Zgodnie z licencją możliwe jest umieszczanie tylko takich danych, które są zgodne z jej postanowieniami, czyli możliwych do wtórnego wykorzystania bez ograniczenia ilości i przeznaczenia kopii. W praktyce są to dane zebrane przez samych użytkowników za pomocą odbiorników GPS, pochodzące z rejestrów publicznych krajów o liberalnym prawie informacji publicznej (np. hydrografia Republiki Czeskiej – DIBAVOD, czeski kataster nieruchomości, czy sieć drogowa USA – TIGER), bądź „podarowane“ projektowi przez różne organizacje. Do tych ostatnich należą ortofotomapy dostępne w serwisie Bing Maps, ale też geoportalach niektórych polskich miast jak Wrocław i Szczecin.

7. Jakość danych

Jakość danych w bazie OSM jest skrajnie zróżnicowana i to pod względem wszystkich aspektów. Na mapie Polski znajduje się mnóstwo białych plam, w niektórych krajach może być jeszcze gorzej (np. Ukraina). Z drugiej strony znajdują się obszary skartowane z dokładnością do pojedynczego kosza na śmieci. Dokładność geometryczna silnie zależy od dostępnych materiałów źródłowych. Należy przyjąć, że drogi będą naniesione z dokładnością nie gorszą niż przeciętny GPS, czyli ok. 10 metrów. Pokrycie terenu może pochodzić w najgorszym wypadku z mocno zdezaktualizowanych zdjęć z świętej pamięci Landsata ETM7+, albo bazy CORINE Land Cover 2006. Dane w dużych miastach są generalnie lepszej jakości, zwłaszcza jeśli dostępne są dobre ortofotomapy. Aktualność zależy od ilości aktywnych użytkowników na danym obszarze, choć ważniejsze inwestycje drogowe są zwykle nanoszone natychmiast po otwarciu. Częstotliwość aktualizacji wybranego terenu można sprawdzić klikając zakładkę „Zmiany“ na www.openstreetmap.org.

A co jeśli interesujący teren jest pokryty kiepskimi danymi? No cóż, jest to jedna z niewielu ogólnodostępnych baz danych przestrzennych, na której jakość możemy mieć bezpośredni wpływ…