Radosław Uliszak

Geograficzne bazy danych w Internecie na przykładzie FAOSTATu


        Od kilku lat informacje zawarte w Internecie używane są przez geografów w Polsce jako źródło różnorodnych danych. Początkowo dostępne najczęściej poprzez gophera i FTP, obecnie najczęściej udostępniane są poprzez WWW przy wykorzystaniu dostępnych za darmo przeglądarek (Netscape Navigator, Microsoft Internet Explorer). Jakiego typu są to informacje i jak je można wykorzystywać w geografii jako nauce czy przedmiocie szkolnym? (R. Uliszak 1996) Trudno jest odpowiedzieć wyczerpująco na to pytanie. Zważywszy na dynamicznie rozwijające się zasoby dostępnych informacji jak i szerokie pole zainteresowań poszczególnych nauk geograficznych w pełni zadowalająca odpowiedź wydaje się niemożliwa. Wiele zależy od możliwości dostępu do Internetu i pomysłowości przygotowujących lekcje czy inne zajęcia.

Dostępność danych geograficznych w Internecie
Wiele usług dostępnych jest w Internecie za darmo. Są to między innymi wyszukiwarki, takie jak Alta Vista czy Infoseek. Są też polskie odpowiedniki: np. pod adresem http://www.altavista.pl/, lub - http://search.onet.pl. Umożliwiają przeszukiwanie wyrazów i fraz na stronach WWW na całym świecie lub w wybranych krajach, czy językach. Ponadto Alta Vista umożliwia również poszukiwanie plików graficznych (zdjęć, rysunków) o zadanej tematyce (opcja Images). Usługi te mają szerokie znaczenie dla wszystkich użytkowników Internetu.
Na drugim biegunie znajdują się specjalizowane usługi płatne lub zastrzeżone dla wąskiego grona użytkowników, jak na przykład niektóre statystyczne bazy danych. Przykładem takiej bazy danych może być Bank Danych Lokalnych Głównego Urzędu Statystycznego (obecnie Bank Danych Regionalnych). W bazie tej znajdują się informacje dla wszystkich gmin w Polsce pogrupowane tematycznie i według aktualnego lub poprzedniego układu administracyjnego. Jednak tylko niewielka ich część (64 cechy) dostępna jest bezpłatnie.
Dostępność danych przez Internet ma swoją specyfikę. Usługi te są podatne na zakłócenia w obiegu informacji, można je traktować wciąż jeszcze jako pionierskie, znajdujące się w początkowej fazie rozwoju. Na przykład zdarza się, że strony WWW niektórych narodowych i regionalnych urzędów statystycznych pojawiają się pod różnymi adresami i znikają bez ostrzeżenia. Wtedy drukowany rocznik statystyczny danego kraju jest wciąż niezastąpiony. Najczęściej jednak bardzo trudno jest dotrzeć do takiego rocznika i zdobycie informacji, których nie można znaleźć w dostępnych źródłach publikowanych (Rocznik Statystyczny GUS i inne), okazuje się możliwe tylko przez Internet.

Wiarygodność danych geograficznych w Internecie
        Internet jest dla geografa szansą na szybkie dotarcie do aktualnych informacji o całym świecie. Istotnym problemem dla poszukującego danych w tej sieci jest ich wiarygodność. Na obecnym poziomie dostępności Internetu, w zasadzie każdy jej użytkownik może niewielkim nakładem sił i środków opublikować dowolne informacje. Mogą one być prawdziwe lub zupełnie zmyślone i może zdarzyć się tak, że nie ma sposobu na szybką i pełną ich weryfikację. Naczelną zasadą, którą można się kierować przy weryfikacji danych jest zaufanie do organizacji czy osoby publikującej informacje. Pomocne może być w tym głównie doświadczenie Internauty - geografa. Oczywista jest różnica w wiarygodności informacji zawartej np. w bazie danych Organizacji Narodów Zjednoczonych do Spraw Wyżywienia i Rolnictwa (
FAO) a wypowiedzią nieznanej nam osoby, występującej pod pseudonimem w internetowej grupie dyskusyjnej.
Ze względu na poziom wiarygodności danych pochodzących z Internetu można zaproponować podział na trzy grupy źródeł informacji geograficznych (R. Uliszak 1998).
  1.  Źródła z reguły nie budzące zastrzeżeń co do wiarygodności zamieszczanych danych.
    Grupę tę reprezentują serwisy prowadzone przez uznane organizacje międzynarodowe, rządowe czy pozarządowe. Informacje tam zawarte mogą być traktowane tak samo jak ich drukowane odpowiedniki. Przykładem mogą być strony WWW Organizacji Narodów Zjednoczonych do spraw Wyżywienia i Rolnictwa (FAO) z siedzibą w Rzymie, Banku Światowego czy Głównego Urzędu Statystycznego w Polsce. Nad danymi publikowanymi czuwają zwykle ludzie mający bezpośredni kontakt z organizacjami udostępniającymi informacje lub wręcz będący ich pracownikami.
    Podobnie należy traktować artykuły i opracowania publikowane na serwerach akademickich przez pracowników naukowych czy studentów. Są one z reguły na bieżąco recenzowane i weryfikowane wewnętrznie przez społeczność danej uczelni. Do takich należą na przykład strony WWW Nottingham University (Wielka Brytania), czy serwer FTP Uniwersytetu w Bańskiej Bystrzycy (Słowacja) na których udostępniane są aktualne i archiwalne zdjęcia z satelity pogodowego METEOSAT. Światowe uznanie zdobyły na przykład strony "Geomorfologia Wirtualna" (http://hum.amu.edu.pl/~sgp/gw/gw1.htm) prowadzone przez Zbigniewa Zwolińskiego z Uniwersytetu im. Adama Mickiewicza w Poznaniu.
    Listy z adresami osób pracujących w instytutach naukowych, agendach rządowych i uczelniach mogą być przydatne w uzyskaniu bezpośrednio przez pocztę elektroniczną specyficznych informacji niedostępnych publicznie w sieci. Oczywiście możemy nigdy nie dostać odpowiedzi na nasz list elektroniczny, ale może się to zdarzyć również w przypadku wysłania zwykłego listu tradycyjną pocztą.

  2.  Druga grupa to serwery czy strony WWW, z których można korzystać ze świadomością, że dane na nich zawarte powinny być wiarygodne, ale mogą być nieaktualne czy wybiórcze. Należy zwracać uwagę na daty utworzenia i ostatnich modyfikacji tych stron.
    Są to na przykład strony WWW tworzone prywatnie przez osoby zawodowo związane z organizacjami rządowymi i pozarządowymi. Często to dzięki takim osobom powstają strony WWW instytucji i organizacji, które powinny "z urzędu" udostępniać informacje również w Internecie, ale z wielu powodów nie są tym zainteresowane. Jednak na takich stronach często można znaleźć informację, że są one właśnie w trakcie tworzenia lub uaktualnione zostaną w najbliższym czasie. Bliższe przyjrzenie się datom ostatnich modyfikacji wskazuje niekiedy, że od roku czy dwóch pliki nie były zmieniane czy aktualizowane.

  3.  Trzecia grupa to informacje, które przed wykorzystaniem należy szczególnie dokładnie zweryfikować, lub traktować je wręcz jako wątpliwe. Wciąż jednak mogą się okazać wartościowe dla badacza i nauczyciela.
    Z dużą dozą ostrożności należy podchodzić do informacji pochodzących od nieznanych nam osób a zamieszczonych w grupach dyskusyjnych czy na stronach WWW. Wiele jest w sieci stron WWW powstałych w słomianym zapale i wkrótce zapomnianych przez autora. Tworzone bez złej woli, po pewnym czasie mogą jednak być źródłem dezinformacji. Łatwość publikowania w Internecie powoduje, że obniża się średnia wieku Internautów, którzy po raz pierwszy tworzą i upubliczniają swoje strony. Niestety, bardzo często zdarza się, że strony przygotowane przez młodych Internautów zawierają bardzo dużo błędów i nieścisłości, choć stoją na wysokim poziomie edytorskim czy graficznym. Czasem drobiazgi, takie jak błędy ortograficzne czy gramatyczne mogą być świadectwem niesolidnego twórcy i sygnałem ostrzegawczym dla użytkowników. Podobnie osoby znane nam z wcześniejszych wypowiedzi w danej grupie dyskusyjnej mogą zaskarbić sobie nasze zaufanie lub wręcz przeciwnie - od razu można dyskwalifikować ich wypowiedzi i uznać za mylące.
        Geografowie nie są zapewne najliczniejszą grupą Internautów ani w Polsce ani na świecie. Jednak jest już w sieci sporo materiałów, które mogą oni wykorzystać w pracy naukowej geografa jak i w nauczaniu-uczeniu się geografii. Większość informacji dostępnych w Internecie jest w języku angielskim, najpowszechniejszym w sieci. Jednak wiele informacji geograficznych udostępnianych jest wyłącznie w języku danego kraju i nie są one tłumaczone na język angielski z myślą o odbiorcach anglojęzycznych.

FAOSTAT - baza danych regionalnych o rolnictwie
        Wiele organizacji i instytucji na świecie posiada swoje oficjalne strony WWW. W tej grupie można wymienić niemal 100 krajowych urzędów statystycznych (pełna lista znajduje się pod adresem
http://www.ap.krakow.pl/geo/statystk.html). Najwięcej takich stron powstało w ostatnich dwóch latach. Niestety, większość z nich udostępnia jedynie podstawowe informacje. Najczęściej są to ogólniki o zadaniach służby statystycznej, siedzibie i organizacji pracy urzędu. Do rzadkości należy systematyczna publikacja danych statystycznych z zakresu demografii czy gospodarki.
        Najlepszym chyba przykładem możliwości, jakie otwiera przed geografem Internet jest serwis FAO - Organizacji do spraw Wyżywienia i Rolnictwa. Większość materiałów dostępnych w tym serwisie opracowanych jest w języku angielskim, ale można ponadto korzystać z hiszpańskiego, francuskiego i arabskiego. Ponadto zawartych jest tam wiele opracowań tematycznych i zdjęć dotyczących rolnictwa na świecie. Z roczników statystycznych publikowanych przez tę organizację korzystają geografowie na całym świecie, szereg wydawnictw, na przykład Główny Urząd Statystyczny przy publikacji roczników statystycznych. Cykl produkcyjny roczników FAO i roczników GUS powoduje, że dane statystyczne docierają do wszystkich zainteresowanych w Polsce po pół roku lub nawet po roku od ich ogłoszenia. Dzięki Internetowi geografowie uzyskali dostęp do najbardziej aktualnych danych FAO z zakresu geografii regionalnej i geografii rolnictwa.
        FAOSTAT to statystyczna baza danych Organizacji do spraw Wyżywienia i Rolnictwa dostępna w Internecie (http://apps.fao.org/page/collections?subset=agriculture), która zawiera aktualizowane i uzupełniane na bieżąco statystyki. Udostępnione są szczegółowe dane statystyczne dotyczące gospodarki żywnościowej i leśnictwa wszystkich krajów członkowskich ONZ. Tematycznie są one podzielone na następujące grupy: rolnictwo, wyżywienie, rybołówstwo, leśnictwo, kontrola jakości żywności. W grupach tych zawarto szczegółowe dane dotyczące między innymi: powierzchni zasiewów, zbiorów i plonów roślin uprawnych: pogłowia zwierząt gospodarskich, użytkowania ziemi, nawadniania, nawożenia: ludności, pozyskiwania drewna. W tej bazie danych zawartych jest ponad milion rekordów dla lat 1961-1999. Dane te mogą być również grupowane według kontynentów, organizacji gospodarczych czy regionów.
Dane statystyczne opracowywane przez FAO udostępniane są w Internecie bezpłatnie "on-line". Oznacza to, że posiadając dostęp do Internetu i dowolną przeglądarkę WWW można z tych danych korzystać bez opłat. Uzyskiwanie informacji odbywa się "on-line" czyli w czasie połączenia internetowego z FAOSTATem. Zapytania kierowane przez użytkownika jak i wyniki uzyskiwane z bazy danych ujęte są w intuicyjnie zrozumiałej i czytelnej formie tabel z polami do wyboru. Baza dostępna jest w języku angielskim, francuskim i hiszpańskim przez całą dobę z wyjątkiem niedziel.

Uzyskiwanie danych z FAOSTATu
Po wczytaniu początkowej strony WWW FAOSTAT-u (
http://apps.fao.org/) można dokonać wyboru tematycznej bazy danych, z której chcemy korzystać (rolnictwo, wyżywienie, rybołówstwo, leśnictwo, kontrola jakości żywności). Przykładowo wybieramy "rolnictwo" (ang. agriculture) a następnie "Użytkowanie ziemi" (ang. Land Use). Do przeglądarki wczytane zostanie następne okno, w którym definiujemy, które dane nas interesują. Zasadniczą część tej strony WWW stanowią cztery pola: lista krajów, temat, lista cech i lista lat, dla których dostępne są dane.
W pierwszym oknie wskazujemy kraje, dla których chcemy uzyskać dane. Każde tupnięcie myszką spowoduje wybranie jednego kraju. Aby wybrać kilka krajów sąsiadujących ze sobą na liście należy tupnąć myszką na pierwszy z nich, a następnie tupnąć na ostatni trzymając jednocześnie wciśnięty klawisz Shift. Zostaną wybrane kraje zawarte pomiędzy pierwszym a ostatnim wskazanym myszką. Możliwy jest też wybór kilku lub więcej państw z listy. W tym celu należy tupać myszką na nazwę każdego z tych krajów trzymając jednocześnie wciśnięty klawisz Ctrl (Control). Lista krajów FAOSTAT-u oferuje też możliwość wyboru krajów pogrupowanych tematycznie np. krajów europejskich, rozwijających się. Można również wybrać od razu wszystkie kraje świata, w tym celu należy wskazać pozycję "WORLD>". Wskazanie sąsiedniej pozycji "WORLD+" spowoduje sumowanie danych dla wszystkich krajów świata.
W drugim oknie przykładowo wybranej bazy znajduje się tylko jedna pozycja "Land Use" (użytkowanie ziemi).
W trzecim oknie zamieszczono listę cech możliwych do wyboru, czyli sposobów użytkowania ziemi. W tej grupie wyróżniono:
  1. Area (1000 ha) - ogólna powierzchnia kraju (włącznie z wodami wewnętrznymi);
  2. Area (1000 ha) - powierzchnia ogólna bez wód (głównych rzek i jezior);
  3. Agricultural Area (1000 ha) - użytki rolne, do 1994 ten punkt zawiera dane zawarte w punkcie: grunty orne i trwałe plantacje;
  4. Arable and Permanent Crops (1000 ha) - grunty orne i trwałe plantacje (dane od 1995);
  5. Arable Land (1000 ha) - grunty orne. Grunty pod czasowymi zasiewami (dwukrotnie obsiewane pola są liczone tylko raz), tymczasowe łąki, ogródki przydomowe i grunty czasowo wyłączone - ugory (do pięciu lat). Nie wliczono gruntów trwale porzuconych i potencjalnie możliwych do użytkowania rolniczego;
  6. Permanent Crops (1000 ha) - trwałe plantacje. Grunty zajęte przez wieloletnie uprawy, które nie wymagają przesadzania po każdych zbiorach (kakao, kawa). Wliczane są tu grunty pod krzewami, drzewami owocowymi, drzewami rodzącymi orzechy, winną latoroślą, ale bez drzew przeznaczonych na produkcję drewna.
  7. Permanent Pasture (1000 ha) - użytki zielone. Grunty zajęte trwale (pięć lub więcej lat) przez rośliny zielne na paszę, zarówno uprawiane lub rosnące dziko. Brak danych po 1995 r.
  8. Forest and Woodland (1000 ha) - lasy i tereny lesiste. Grunty zajęte przez naturalne lub zasadzone skupiska drzew, zalesiane bez parków i lasów rekreacyjnych. Brak danych po 1995 r.
  9. Other Land (1000 ha) - pozostałe grunty, nieużytki. Zawarte dane dotyczące terenów zabudowanych, dróg itp.
  10. Arable and permanent crops (1000 ha) - od 1995 roku ten punkt zawiera informacje o gruntach nie wymienionych w punkcie "Arable and Permanent Crops", a więc np. trwałych pastwiskach, lasach, terenach zabudowanych, drogach itd.

Sposób wybierania cech jest analogiczny jak w przypadku krajów. Można wybrać niektóre lub wszystkie cechy. Znaczenie wszystkich cech jest wytłumaczone na stronach WWW ukrytych pod odsyłaczem "Element".
W czwartym, ostatnim oknie, znajduje się lista lat, dla których dostępne są dane.
Po zaznaczeniu wszystkich żądanych cech należy tupnąć myszką na przycisk "Submit To Database". Spowoduje to wysłanie odpowiednio skonstruowanego zapytania do bazy danych. Po przetworzeniu zapytania na ekranie zostanie wczytana strona WWW prezentująca dane uzyskane z FAOSTAT-u. Stronę tę można zapisać na dysku z rozszerzeniem *.html lub *.htm do dalszej obróbki bądź wydruku.

Bezpieczne korzystanie z danych FAOSTATu
Bezpłatny dostęp do danych ograniczony jest kilkoma warunkami. Do najważniejszych niedogodności można zaliczyć przede wszystkim ograniczenie liczby rekordów, które jednorazowo możemy uzyskać. Drugim ważnym ograniczeniem jest różnica w sposobie zapisu liczb dziesiętnych przez polskie i amerykańskie arkusze kalkulacyjne. Jednak obydwa te ograniczenia można stosunkowo łatwo przezwyciężyć i nie wymaga to żadnych specjalistycznych umiejętności.
        Najprościej jest ominąć pierwsze utrudnienie. Liczba rekordów (danych) ograniczona jest do 500 w czasie jednego zapytania. W zupełności wystarcza to na przykład do określenia jednej cechy dla wszystkich krajów świata (przykładowo: zbiory). Dla każdej następnej cechy (przykładowo: powierzchnia zasiewów, plony) należy jeszcze raz zadać pytanie.
        Drugie utrudnienie związane jest ze sposobem zapisu informacji uzyskanej z FAOSTAT-u. Dane uzyskane z bazy danych można zapisać w pliku typu *.html, a więc pliku rozpoznawanym przez internetowe przeglądarki WWW. Pliki te mogą być również czytane przez nowe wersje popularnych edytorów tekstów czy arkuszy kalkulacyjnych. Okazuje się jednak, że sposób zapisu danych uniemożliwia dokonywanie poprawnych obliczeń. W pliku uzyskanym z FAOSTAT-u wstawiany jest przecinek jako separator tysięczny. Przykładowo powierzchnia trwałych pastwisk w Chile w roku 1970 wynosiła 11 000 000 ha. W przypadku amerykańskiego sposobu zapisywania liczb zostanie to zapisane jako
11,000 ha (dane w tys. ha), co zgodnie z polskim sposobem zapisywania liczb może zostać zrozumiane jako jedenaście hektarów i zero tysięcznych. Po wczytaniu do polskiej wersji arkusza kalkulacyjnego liczba ta zostanie tak właśnie zinterpretowana. Pozbawiona zostanie automatycznie "niepotrzebnych" zer po przecinku dziesiętnym. W wyniku tej operacji powierzchnia pastwisk w Chile zmieni się z 11 000 000 ha na 11 ha.
Łatwo można uniknąć takiej pomyłki jeśli plik *.html z danymi z FAOSTAT-u zapisany w przeglądarce WWW poddany zostanie prostemu przetworzeniu w najprostszym edytorze tekstów. Do tego celu powinien w zupełności wystarczyć WordPad znajdujący się w Windows '9x (menu akcesoria) lub inny edytor mogący zapisać plik jako czysty tekst (ASCII).
Modyfikacja polega na wykonaniu następujących czynności:
W przypadku posłużenia się innym edytorem należy wykonać podobne czynności zmierzające do całkowitego usunięcia przecinków z pliku źródłowego.
        Tak zmodyfikowany plik można wczytać do polskich wersji arkuszy kalkulacyjnych bez obawy zafałszowania danych i można poddawać dalszej obróbce.

Podsumowanie
        Poza wymienionymi instytucjami, których serwery mogą być źródłem informacji dla geografa, jest wiele innych miejsc w Internecie, które spełniają rolę uzupełniającą dla podstawowych badań. Na przykład zebrane z list dyskusyjnych doświadczenia i bezpośrednie wypowiedzi mieszkańców danego kraju, miasta mogą być równie istotne jak dane statystyczne.
        Trudno obecnie ocenić rolę Internetu jako źródła informacji geograficznych. Pojawia się jednak coraz więcej naukowych i popularnonaukowych opracowań, w których autorzy cytują nie tylko publikacje drukowane, ale i elektroniczne, dostępne w sieci. Internet rozwija się i zmienia z każdą chwilą. Strony WWW pojawiają się i znikają, czasami zmieniane są ich adresy. Najważniejsze jednak jest to, że wiele informacji jest wiarygodnych, aktualnych, dostępnych błyskawicznie i bezpłatnie, a liczba ich ciągle rośnie wraz z powstawaniem nowych serwisów WWW i przyłączaniem nowych serwerów do Internetu. Oczywiście informacja geograficzna jest jednym z elementów procesu nauczania-uczenia się. Zwykle jest to dopiero materiał wyjściowy do dalszej pracy.
        Wyzwaniem, które obecnie stoi przed geografami, szczególnie w Polsce, jest tworzenie nowych i uzupełnianie istniejących zasobów informacji możliwych do wykorzystania przez wszystkich użytkowników sieci.


Literatura:
Uliszak R., 1996,
Internet - szansa dla nauczycieli geografii, "Geografia w Szkole" R.49, nr 1;
Uliszak R., 1998, Internet jako źródło informacji geograficznej, 8 Ogólnopolskie Sympozjum Naukowe na temat: Techniki komputerowe w przekazie edukacyjnym, Kraków 25-26 IX 1998r.

Radosław Uliszak
asystent w Instytucie Geografii Akademii Pedagogicznej w Krakowie
ul. Podchorążych 2
30-084 Kraków
E-mail: ulira@ap.krakow.pl
© Żadna część niniejszego artykułu nie może być kopiowana lub wykorzystywana w celach komercyjnych bez pisemnego zezwolenia autora.
Tekst ukazał się drukiem w publikacji "Działalność człowieka i jego środowisko, Księga ku czci Profesor Marianny Kozaneckiej w 70 rocznicę urodzin" (red. Z. Zioło), nakładem Wydawnictwa Naukowego Akademii Pedagogicznej w Krakowie;

Instytut Geografii - Akademia Pedagogiczna w Krakowie Powrot Powrót do poprzedniej strony Back Back to previous page statystyka odwiedzin