Współczesne biblioteki 

Następny artykuł
Poprzedni artykuł
Strona główna

 

Marek Nahotko — adiunkt w Instytucie Informacji Naukowej i Bibliotekoznawstwa UJ. W kręgu jego zainteresowań badawczych znajdują się biblioteki cyfrowe, opracowanie dokumentów elektronicznych, metadane, wyszukiwanie informacji w internecie. Najważniejsze publikacje: Metadane. Sposób na uporządkowanie internetu (2004), Zastosowania komputera w bibliotece (współautorzy: J. Maj, W. Szczęch, 1996).


Marek Nahotko

Cyfrowa najmłodsza siostra bibliotek

 

Termin „biblioteka cyfrowa” jest stosowany od dawna; używano go na długo przed skonstruowaniem pierwszego komputera. Idea „biblioteki skomputeryzowanej”, która będzie uzupełniać, zwiększać funkcjonalność, a nawet zastępować tradycyjną bibliotekę, została stworzona przez H.G. Wellsa i innych autorów. W 1965 r. J.C.R. Licklider stworzył pojęcie „biblioteki przyszłości”, odpowiadające jego wizji skomputeryzowanego księgozbioru, natomiast dziesięć lat później F. W. Lancaster pisał o „bibliotece bez papieru”. Używano wielu określeń, będących synonimami biblioteki cyfrowej, takich jak: „biblioteka elektroniczna”, „biblioteka wirtualna”, „biblioteka bez ścian”, „biblioteka bioniczna” itp.

M. Nahotko

Tak jak w przypadku większości nowych, szybko rozwijających się zagadnień, zdefiniowanie składników biblioteki cyfrowej jest przedmiotem ożywionych dyskusji, prowadzonych wśród specjalistów informacji naukowej i bibliotekarzy. W początkowym okresie istnienia Web bibliotekarze traktowali go jak wielką bibliotekę cyfrową, a Michael Hart (Projekt Gutenberg) stwierdził: „Biblioteka elektroniczna zawiera zasoby przeszukiwane przy pomocy techniki komputerowej. Zasoby te mogą być transmitowane poprzez dyski, linie telefoniczne lub inne media, co powoduje, że dostęp do książki elektronicznej posiadać będzie wielu użytkowników jednocześnie. Innymi słowy wszystkie materiały dostępne będą dla wszystkich czytelników ze wszystkich miejsc, w każdej chwili”. Biblioteki cyfrowe są postrzegane jako systemy dostarczające spójnego dostępu do wielkich, zorganizowanych zasobów informacji i wiedzy. Możliwości dostępu, reorganizacji i wykorzystania zasobów są wzbogacane przez technologię cyfrową (widoczne efekty jej stosowania znajdziemy w zakresie zasobów multimedialnych). Należy zwiększyć aktualność i wartość zbiorów udostępnianych za pośrednictwem bibliotek cyfrowych przez zintegrowane udostępnianie materiałów w formie cyfrowej, takich jak multimedia, dane o przestrzeni geograficznej czy bazy danych numerycznych, które nie były wystarczająco reprezentowane, udostępniane i wykorzystywane w bibliotekach tradycyjnych.

Cyfrowe zapisy informacji uzupełnią zbiory tradycyjne (książek, czasopism i materiałów audiowizualnych), od dawna gromadzone w bibliotekach. Zdarzać się będzie, że biblioteki zastąpią wcześniejsze nośniki danych mediami cyfrowymi. Jednak w większości przypadków zbiory cyfrowe i usługi z nimi związane stanowić będą uzupełnienie istniejących zasobów i usług

Zauważyć trzeba wyraźną ciągłość roli i zadań biblioteki tradycyjnej i cyfrowej. Sharon i Frank wskazują na historyczny rozwój bibliotek, dzieląc je na biblioteki papierowe/analogowe (klasyczne biblioteki gromadzące dokumenty drukowane i prowadzące katalogi kartkowe), biblioteki zautomatyzowane/hybrydowe (gromadzą dokumenty drukowane, ale posiadają katalog komputerowy) i biblioteki cyfrowe (skomputeryzowane, gdzie większość informacji udostępnia się w formie cyfrowej). Biblioteki cyfrowe są klasyfikowane w trzech kategoriach: pojedyncze biblioteki cyfrowe (w pełni skomputeryzowane, a ich zasoby zdigitalizowane, np. zeskanowane), skomputeryzowana wersja tradycyjnych bibliotek; współpracujące biblioteki cyfrowe (łączone ze sobą poprzez sieci telekomunikacyjne) i scalone biblioteki cyfrowe (biblioteki wirtualne, udostępniające materiały rozproszone w całej sieci, gromadzące tylko metadane zawierające odsyłacze do danych dostępnych w cyberprzestrzeni).

Podstawowe różnice występują pomiędzy dwoma pierwszymi typami bibliotek a trzecim. Wymienione na początku kupują dokumenty w formie cyfrowej lub je digitalizują. Pozycje te są przechowywane lokalnie (w bibliotece pierwszego typu), przy czym w bibliotekach drugiego typu dostęp do nich możliwy jest poprzez sieć. Inaczej, niż poprzednie, pozyskuje dokumenty z sieci scalona biblioteka cyfrowa. Są rozproszone na wielu serwerach, które udostępniają je poprzez bezpośrednie wyszukiwanie przy użyciu standardowych protokołów, takich jak HTTP, FTP itp. Biblioteki te przechowują jedynie metadane dotyczące samych pozycji, zaś udostępniane przez bibliotekę cyfrową mogą być modyfikowane w każdej chwili przez autorów, więc ich metadane muszą być dynamicznie aktualizowane.

Hurley przedstawił pożądane cechy bibliotek cyfrowych. Są to:
— rozmiary — system rozproszony tworzy wiele zasobów sieciowych, zawierających różne rodzaje obiektów biblioteki cyfrowej (np. serie cyfrowych książek, fotografii itp.), próby tworzenia jednego, scentralizowanego zasobu wydają się ze względu na ilość dokumentów funkcjonujących w sieci nierealne;
— funkcje związane z klasami obiektów: zasoby będą zawierały „dobrze zdefiniowane” (spójne) klasy obiektów biblioteki cyfrowej — książki cyfrowe, czasopisma, fotografie. Każda klasa obiektów cyfrowych obsługiwana będzie przez zestawy oprogramowania, które spowodują odpowiednie zachowania w stosunku do tej klasy (np. dla książki cyfrowej przejście do następnej strony, poprzedniej strony, do spisu treści). Standaryzacja narzędzi funkcjonujących w zasobach: można będzie utworzyć narzędzia do przeglądania lub wyszukiwania książek cyfrowych z różnych zasobów;
— samowystarczalność narzędzi: ta koncepcja zakłada, że każdy zasób udostępnia pewną ilość podstawowych narzędzi dla każdego typu przechowywanych obiektów, jest więc samowystarczalny w zakresie dostarczania dostępu do przechowywanych zasobów;
— elastyczny rozwój systemu: utworzenie dowolnej ilości klas obiektów biblioteki cyfrowej;
— stopniowy dostęp: użycie priorytetów i metod przechowywania danych, oczekujących na pobranie. Muszą powstać alternatywy dla szybkiego udostępniania online olbrzymich ilości informacji;
— mechanizmy archiwizacji: podczas długoterminowego przechowywania niezbędne staje się odświeżanie zasobów ze względu na postęp w technologii komputerowej, mediach i oprogramowaniu. Powoduje to komplikacje nie tylko techniczne, ale też organizacyjne. Podczas kopiowania informacji np. z dysku magnetycznego na optyczny, należy brać pod uwagę problemy związane z prawem autorskim. Czynności te powinny być wykonywane automatycznie dla oszczędzenia kosztów pracy;
— integracja i autentyczność: zachowanie wartości intelektualnych realizuje się poprzez zachowanie nośnika i technologii zapewniającej ochronę struktury informacji w postaci zapisanej przez autora. Dla zaspokojenia potrzeb użytkowników muszą być realizowane mechanizmy zapewniające autentyczność, wykorzystujące łatwe w użyciu metody matematyczne, łączące publiczną kontrolę autentyczności z ochroną prywatności.

Prawdopodobne jest, że wartość bibliotek leżeć będzie nie w ich zbiorach, ale umiejętnościach bibliotekarzy. Możemy więc być świadkami procesu przejścia od „cyfrowych bibliotek” do „cyfrowych bibliotekarzy”

Pisząc o bibliotece cyfrowej, wielu autorów stosuje pojęcia z okresu bibliotek tradycyjnych. Mówi się np. o wielu bibliotekach cyfrowych, gdy tymczasem należy traktować wszystkie zasoby jako jedną, światową „bibliotekę”. Tworzenie efektywnej biblioteki cyfrowej jest poważnym wyzwaniem dla obecnych i przyszłych technologii. Integracja mediów cyfrowych z tradycyjnymi zbiorami nie będzie prosta z powodu wyjątkowej natury informacji cyfrowej — jest elastyczna, łatwa do skopiowania i zdalnie dostępna dla wielu użytkowników jednocześnie. Informacja cyfrowa istniejąca w internecie charakteryzuje się tym, że dokumenty cyfrowe mogą być zapisane w kilku formatach, mieć kilka wersji i wiele różnych lokalizacji. Jednego dnia dokument może znajdować się w jednym miejscu sieci, a drugiego w innym lub zniknąć całkiem. Podstawowym narzędziem do wyszukiwania informacji są wyszukiwarki typu AltaVista czy Yahoo. Serwisy te są jednak przeciążone, a jakość ich pracy dyskusyjna. Podstawowym sposobem poprawienia tej sytuacji wydają się być inicjatywy bibliotekarzy, zmierzające w kierunku tworzenia analiz rzeczowych i katalogowania dokumentów sieciowych, co oznacza tworzenie metadanych. Istnieje też inna dziedzina, będąca domeną bibliotekarzy i w nikłym stopniu zależna od technologii cyfrowych. Jest to prowadzenie usług „uwiarygodnienia” informacji.

Biblioteki udostępniają swoim użytkownikom dokumenty w różnych postaciach fizycznych. Cyfrowe zapisy informacji uzupełnią zbiory tradycyjne (książek, czasopism i materiałów audiowizualnych), od dawna gromadzone w bibliotekach. Zdarzać się będzie, że biblioteki zastąpią wcześniejsze nośniki danych mediami cyfrowymi. Jednak w większości przypadków zbiory cyfrowe i usługi z nimi związane stanowić będą uzupełnienie istniejących zasobów i usług. W efekcie, w bibliotekach współistnieć będą zarówno dokumenty tradycyjne, jak i cyfrowe. Trzeba więc wypracować spójne stanowisko dotyczące wykorzystania zasobów informacji we wszelkich postaciach fizycznych.

Z tezy o potrzebie tworzenia i gromadzenia różnego rodzaju dokumentów cyfrowych w bibliotekach wynika potrzeba organizacji przechowania tych zasobów. Biblioteki przed digitalizacją musiały troszczyć się o właściwą klimatyzację i odkwaszanie papieru, natomiast przechowywanie informacji cyfrowej nie zna tych problemów, więc będzie tańsze i prostsze. Powstają jednak inne kłopoty — media cyfrowe są wrażliwe na uszkodzenia oraz mają ograniczony czas przechowywania.

Z punktu widzenia wielu bibliotekarzy biblioteka cyfrowa powinna wykonywać funkcje, które realizowane były przez tradycyjne biblioteki od stuleci i odgrywać taką samą rolę w społeczeństwie. Istniałaby jako wspólnota informacyjna, umożliwiająca otwarty dostęp do szerokiego zakresu dokumentów. Jedyną różnicą jest fakt posiadania przez biblioteki cyfrowe mediów elektronicznych. Biblioteka cyfrowa powinna także realizować wszystkie procesy i usługi — gromadzenie zbiorów, opracowanie rzeczowe, prace informacyjne, przechowywanie — które są podstawą i celem istnienia tradycyjnych bibliotek.

Inną perspektywę na przyszłość przedstawia pogląd, że biblioteka cyfrowa jest czymś na kształt „centrum wiedzy”, gdzie funkcjonuje skomplikowany system zarządzany przez profesjonalistów, którzy są pośrednikami, zapewniającymi dostęp do zróżnicowanych źródeł informacji (nie tylko cyfrowych). Wolny dostęp do informacji to zasada leżąca u podstaw nowoczesnej biblioteki, tak cyfrowej, jak i tradycyjnej. Jednak pełny dostęp do informacji w przyszłości nie będzie oznaczał otwartych zbiorów i dokumentów cyfrowych. Prawdopodobne jest, że wartość bibliotek leżeć będzie nie w ich zbiorach, ale umiejętnościach bibliotekarzy. Możemy więc być świadkami procesu przejścia od „cyfrowych bibliotek” do „cyfrowych bibliotekarzy”.

Integralnośc i autentyczność zasobów cyfrowych

Problematyka autentyczności źródeł ma długą historię. Wraz z rozpowszechnieniem się formy informacji cyfrowej i zwielokrotnieniem jej ilości w internecie zagadnienia te stały się bardziej skomplikowane. Wciąż nie istnieje szeroko akceptowana i używana metoda oceny i zapewnienia autentyczności zasobów cyfrowych. Ważna jest też możliwość zapewnienia integralności określonego egzemplarza cyfrowego. Mówiąc o „integralności” obiektu cyfrowego, mamy na myśli to, że nie był on uszkodzony (np. w trakcie przesyłania), dysponujemy więc tą samą sekwencją bitów, która powstała podczas tworzenia obiektu. Stwierdzenie integralności obiektu nie jest jednak łatwe. Jednym ze sposobów jest porównanie posiadanego obiektu z egzemplarzem, o którym wiadomo, że jest „prawdziwy”. Jeżeli brakuje bezpiecznego dostępu do znanego, prawdziwego egzemplarza obiektu, wówczas kontrola integralności jest ograniczona do badania wewnętrznej jego zawartości. Jeśli obiektowi towarzyszy autoryzowany skrót (ang. digest), można sprawdzić, czy obiekt jest zgodny z tym skrótem (a więc czy jego integralność została zachowana).

W środowisku cyfrowym spotyka się także problem, który można określić mianem integralności „sytuacyjnej”, tzn. integralności dokumentów pochodnych. Tu mamy do czynienia z takimi pytaniami: „czy jest to dokładna transkrypcja lub tłumaczenie?” Zapewnienie poprawności obliczeń sprowadza się do zapewnienia pewności co do źródła lub wykonawcy transformacji, a więc do problemów dotyczących autentyczności, wiarygodności, integracji i poprawności kodu.

Przechowywanie i archiwizacja zasobów cyfrowych

Przechowywanie informacji cyfrowej może być uważane za jedno z największych wyzwań końca XX i początku XXI wieku. Łatwo jest być entuzjastą bibliotek cyfrowych, jednak konieczne jest także zwracanie uwagi na możliwości udostępnienia tych informacji przyszłym użytkownikom.

Biblioteki zawsze uważały za jedno z podstawowych zadań przechowywanie zasobów; dotyczy to szczególnie bibliotek narodowych i wybranych bibliotek naukowych, posiadających uprawnienia do egzemplarza obowiązkowego. Głównym problemem związanym z przechowywaniem dokumentów cyfrowych w stosunku do drukowanych jest nietrwały nośnik fizyczny, na którym zapisano informację. Często przytaczanym przykładem jest przypadek USA z 1960 r., gdzie dane zapisane na taśmie magnetycznej zestarzały się i stały niedostępne już w końcu lat siedemdziesiątych.

Informacja cyfrowa ma trzy podstawowe słabości: nośnik, na którym jest zapisywana (danych cyfrowych, magnetyczny lub optyczny) ulega szybkiemu niszczeniu w porównaniu z materiałami drukowanymi; sprzęt i oprogramowanie — informacja cyfrowa jest zależna od sprzętu, do odtworzenia wymaga określonego komputera i oprogramowania, oba szybko się starzeją i wychodzą z użycia, przez co informacja staje się nieużyteczna; zagadnienia prawne dotyczące kopiowania i udostępniania — biblioteki, archiwa i inne instytucje posiadają ograniczone i nie do końca sprecyzowane prawa do kopiowania informacji cyfrowych w celach archiwizowania lub zabezpieczenia, do przeformatowywania informacji w celu dostosowania do zmian technologicznych i do jej powszechnego udostępniania.

Dokument elektroniczny będzie czytelny w przyszłości, jeżeli spełnione zostaną dwa warunki: bity, z których składa się dokument, muszą być odczytane z nośnika, na którym jest zapisany i możliwe do przeniesienia w pamięć komputera. Musimy także dysponować oprogramowaniem potrafiącym zinterpretować dane. Pierwszy problem jest rozwiązywany w prosty sposób — poprzez okresowe kopiowanie danych z jednego nośnika na inny. Pozostaje problem interpretacji archiwizowanych ciągów bitów.

Dla archiwizacji danych stosuje się dwie techniki: konwersję i emulację. Konwersja jest metodą stosowaną powszechnie w wielu rozwiązaniach komercyjnych. Nowy system współpracuje przez jakiś czas ze starym oprogramowaniem, a wszystkie pliki mogą być kopiowane ze starszego systemu do nowszego (zapewnienie kompatybilności). Jeżeli niektóre formaty plików nie są obsługiwane przez nowy system, pliki te są konwertowane do nowych. Jednak w przypadku długotrwałego archiwizowania rzadko udostępnianych dokumentów konwersja bywa zbędnym obciążeniem. Inną negatywną jej cechą jest to, że pliki stale się zmieniają, a kumulowany efekt tych konwersji może mieć trudny do przewidzenia wpływ na dokument. Emulacja polega zaś na archiwizowaniu danych i oprogramowania, które zostało użyte do utworzenia/modyfikacji informacji w miejscu jej pierwotnego powstania. Archiwizacja danych przy użyciu emulacji posiada także cechy ujemne. Aschenbrener przedstawia dodatkowo inne techniki archiwizacji dokumentów elektronicznych:
— przeniesienie dokumentu do formy nieelektronicznej (wydrukowanie dokumentu elektronicznego i przechowywanie papierowej kopii). Możliwe jest także użycie innych technik kopiowania, np. mikrofilmowania. Niestety, takiej konwersji towarzyszy znaczna utrata informacji. Usuwana jest interaktywność i dynamika, cechująca dokumenty elektroniczne. Funkcjonalność dokumentów multimedialnych jest tracona;
— zachowanie środowiska sprzętu i oprogramowania. Oznacza to tworzenie ośrodków przechowujących muzealną technologię komputerową, jednak trzeba pamiętać, że sprzęt czy oprogramowanie nie będą wiecznie sprawne.

Cyfrowe przechowywanie wywołuje wiele zagadnień natury nietechnicznej. Najistotniejsze są kulturalne i społeczne, które można określić jako „pamięć narodową”. Nie jest możliwe zarchiwizowanie wszystkiego, co opublikowane. Pojawiają się również zagadnienia prawne i ekonomiczne, dotyczące zarządzania infrastrukturą archiwów. Nad takimi problemami pracują specjaliści z archiwów USA. Spowodowane to zostało potrzebą legalizacji zapisów elektronicznych w dokumentach prawnych, a fakt, że ilość zapisów elektronicznych zwiększa się w wielu dziedzinach (działalności rządu, ochrony zdrowia, transakcji biznesowych) doprowadził do wzrostu zainteresowania zagadnieniami integralności i autentyczności informacji cyfrowej. W związku z tym wymienia się wymogi dotyczące zapisów cyfrowych: zrozumiałość, identyfikowalność, kompletność, autoryzacja, możliwość przechowywania, współdziałanie, dostępność i modyfikowalność.

Marek Nahotko

Do góry strony
Copyright © "Konspekt". Kraków, lipiec-sierpień 2004 . Statystyka