|
Czytanie |
|
Ryszard TadeusiewiczJak wykorzystać cyfrowe obrazy?Poproszono mnie, żebym napisał do „Konspektu” krótki tekst o aktualnym przedmiocie moich badań naukowych. Propozycja ta sprawiła mi przyjemność, gdyż od kilku lat z uwagą i uznaniem czytuję to ambitne czasopismo Akademii Pedagogicznej (w której ja także przecież wiele lat przepracowałem…) i jestem jak najlepszego zdania o tym, co i jak jest w nim publikowane. W takim miejscu i w takim gronie zdecydowanie warto się pokazać! Z drugiej jednak strony pojawiła się obawa: czy uda mi się przedstawić przedmiot moich badań, prowadzonych przecież na gruncie nauk technicznych, w taki sposób, by „dostroić” moją prezentację do innych prac, wypełniających kolejne numery „Konspektu”? Z wcześniejszej lektury wiedziałem, że w piśmie tym prezentowane są różne prace, zwykle bardzo ciekawe i inspirujące (także dla mnie!), jednak zawsze takie, o których można z całą pewnością powiedzieć, że z naukami technicznymi raczej związku nie miewają. Muszę zatem tak przedstawić obiekt mojej fascynacji badawczej, żeby był zrozumiały dla czytelników, których nie interesuje matematyczny opis algorytmów, ani schematy pełne wyrafinowanych układów scalonych. Dołożę starań, żeby nie zawieść, proszę jednak o wyrozumiałość, gdyby mi się to nie całkiem udało.
Zajmuję się wieloma rzeczami, ale do tego artykułu wybrałem tę część moich badań naukowych, która związana jest z komputerową analizą obrazów. To ważna i ciekawa dziedzina, ponieważ każdy człowiek, z racji biologicznej budowy swego mózgu i systemu percepcji, jest wzrokowcem. Oznacza to, że ludzie chętnie korzystają z obrazów w różnych sytuacjach, a komputery i nowoczesne systemy telekomunikacyjne, które towarzyszą im niemal na każdym kroku, muszą także nauczyć się wykorzystywać obrazy. Automatyzacja ogromnej liczby czynności, które ludzie wykonują na co dzień, a które chcemy powierzyć maszynom, bo tego wymaga rozwój cywilizacji — uzależniona jest od tego, czy uda się nam zbudować systemy techniczne (współcześnie mające najczęściej formę odpowiednich programów komputerowych) zdolne do tego, żeby przyjmować, analizować, przetwarzać, rozpoznawać oraz — co stanowi największą nowość — samodzielnie rozumieć obrazy.
Kiedy w latach 70. budowałem pierwsze w Polsce laboratoryjne systemy analizy i rozpoznawania obrazów (między innymi całą rodzinę systemów o nazwie CESARO — Cyfrowy Eksperymentalny System Analizy i Rozpoznawania Obrazów, budowanych najpierw dla potrzeb górnictwa a potem dla budowy inteligentnych robotów), to samo tylko pozyskanie obrazu w takiej formie, żeby mógł się nim posłużyć komputer albo robot, było trudne i skomplikowane. Dzisiaj, gdy na każdym kroku towarzyszą nam aparaty cyfrowe, robiące zdjęcia nadające się do natychmiastowej obróbki za pomocą komputera, a usłużne skanery pozwalają wczytać do systemów informatycznych dowolne, drukowane lub ręcznie pisane dokumenty czy ryciny, sprawa ta wydaje się trywialna. Jednak trzeba pamiętać, że moja przygoda z obrazami cyfrowymi zaczynała się w czasach, kiedy wszystkich tych udogodnień nie było, a i komunikacja z komputerami odbywała się nieco inaczej niż obecnie (fot. 1).
Dzięki moim desperackim zmaganiom z niepokorną elektroniką, która w swoich dziecięcych latach nie bardzo chciała zaakceptować obrazy jako obiekty komputerowego przetwarzania, wiem teraz bardzo dokładnie to, co dzisiejszym „wirtuozom myszki” czasem umyka: że wszystko, co można osiągnąć w dziedzinie komputerowego przetwarzania obrazów, wynika z faktu, iż każdy obraz można traktować jako matematyczną funkcję dwóch zmiennych (rys. 2). Nie trzeba o tym wiedzieć, gdy naciskamy spust cyfrowego aparatu, albo gdy „ściągamy” obraz z internetu, jednak gdy chcemy zrobić coś oryginalnego i ciekawego — to znajomość matematycznej natury obrazka w komputerze jest tak samo przydatna, jak znajomość psychologii psa przy próbach jego tresury.
Mając obraz wprowadzony do komputera, można z nim zrobić właściwie wszystko. Najczęściej się go drukuje albo dołącza do strony WWW. Warto jednak spróbować potraktować cyfrowy obraz bardziej ambitnie, bo komputer potrafi obrabiać takie obrazy na wiele sposobów i robi to w sposób wybitnie sprawny. Najbardziej efektowne są zabiegi polegające na przetwarzaniu obrazu. Jeśli popatrzymy na rysunek 3, to zobaczymy, jak prostą operacją matematyczną (różniczkowaniem) można zamienić obraz, który „złapaliśmy” aparatem fotograficznym, na obraz przetworzony do postaci konturowej, przypominającej rysunek wykonany piórkiem. W przypadku zdjęcia twarzy taki efekt przetworzenia obrazu uznać można wyłącznie za ciekawostkę, jednak bywają okoliczności, w których odpowiednia obróbka obrazu jest czynnikiem ratującym życie. Na przykład, na rysunku 4 pokazano pewne bardzo użyteczne zobrazowanie medyczne, którym ostatnio dużo się zajmuję naukowo (jest to tzw. obraz ERCP, co oznacza endoskopową wsteczną cholangio-pankreatorgrafię).
Zobrazowanie to jest niezwykle ważne, ponieważ może posłużyć do wykrycia groźnej choroby, jaką jest rak trzustki. Jednak obraz badanego narządu, jaki daje typowa aparatura medyczna, na ogół nie jest wystarczająco czytelny, co widać na oryginalnym zdjęciu rentgenowskim, przytoczonym z lewej strony. Komputerowe przetworzenie tego obrazu do postaci takiej, jak pokazano po stronie prawej, pozwala skupić uwagę na tych cechach morfologii rozważanego narządu, które są ważne z punktu widzenia postawienia poprawnej diagnozy. Tak więc, w tym przypadku komputer analizujący obraz pomaga w wyborze właściwej terapii, może więc przyczynić się do uratowania czyjegoś życia. Skoro już mamy obraz wprowadzony do komputera i odpowiednio przetworzony, to aż człowieka korci, żeby uruchomić wszystkie demony sztucznej inteligencji, drzemiące w komputerze i spróbować wydobyć z obrazu więcej informacji. Dobrze przeprowadzona analiza obrazu może przynieść wiele pożytecznych efektów. Na przykład wynik analizy obrazu pomaga w automatycznym sterowaniu różnych obiektów. Wiele ciekawych wyników uzyskuje się, sprzęgając system analizy obrazu z robotem, który dzięki temu może się znacznie inteligentniej zachowywać i lepiej nam służyć (rys. 5).
Mam jednak inny przykład automatycznego sterowania niebanalnego obiektu za pomocą komputera sprzężonego z systemem wizyjnym, co więcej, jest to przykład związany z Akademią Pedagogiczną. 26 kwietnia 1995 roku pracownik AP, mgr inż. Krzysztof Wójcik obronił rozprawę doktorską przygotowaną pod moim kierunkiem na temat: Algorytmy przetwarzania obrazów przeznaczone do sterowania teleskopem astronomicznym. Wykazał w niej, że za pomocą odpowiedniej analizy obrazów da się precyzyjnie sterować ruchami teleskopu umieszczonego w obserwatorium AP na Suhorze. Komputer analizował widok nieba, wybierał obiekt obserwacji i „patrząc” stale na ten obiekt kierował teleskopem w taki sposób, żeby stale był możliwy do zbadania i dobrze widoczny. Miało to zastosowanie do śledzenia obiektów ruchomych, takich jak komety, mam więc nadzieję, że to pożyteczne urządzenie służy naukowcom AP do dzisiaj. Innym obszarem zastosowań pogłębionej analizy obrazu jest możliwość automatycznego rozpoznawania różnych obiektów. Za pomocą komputera wyposażonego w system wizyjny najłatwiej można rozpoznawać obiekty, których kształt da się dosyć dobrze przewidzieć — na przykład litery. Pismo drukowane komputer rozpoznaje bez kłopotu (może więc być bardzo przydatny jako lektor czytający na głos książki i gazety osobom niewidomym), natomiast teksty ręcznie pisane muszą być odpowiednio staranne, żeby komputer się nie pogubił. Równie szybko i sprawnie komputer wyposażony w system wizyjny może wyszukać w kartotece rozpoznawany odcisk palca albo kształt dłoni, co jest dzisiaj szeroko wykorzystywane w kryminalistyce, a także w kontroli dostępu do określonych budynków lub określonych zasobów (tzw. biometryczne metody weryfikacji osoby ubiegającej się o pewne uprawnienia są skuteczniejsze od wszelkich haseł). Kolejnym przykładem jest wykorzystanie komputera do automatycznego rozpoznawania twarzy ludzkich, co da się wykorzystać przy kontroli pobierania pieniędzy z bankomatów, przy otwieraniu elektronicznie sterowanych drzwi, przy wyłapywaniu niepożądanych osób, np. na lotniskach itp. Co ciekawe, w tym zadaniu najtrudniej jest wykryć, gdzie na złożonym obrazie znajduje się twarz człowieka (rys. 6) Mógłbym podać tu znacznie więcej przykładów zastosowań automatycznego przetwarzania, analizy i rozpoznawania obrazów, ale nie chcę znużyć Czytelników nadmiarem szczegółów. Na koniec pragnę dodać, że najnowszy kierunek w tej dziedzinie wiedzy wyznacza koncepcja tzw. automatycznego rozumienia obrazów. Zgodnie z nią, obok łatwo zauważalnej formy graficznej, każdy obraz niesie jakąś treść, którą odpowiednio przygotowany człowiek potrafi dobrze odczytać i wykorzystać, ponieważ rozumie, co ten obraz przedstawia. Gdyby udało się tak rozwinąć metody sztucznej inteligencji, żeby ta specyficznie ludzka zdolność rozumienia obrazu stała się dostępna także dla komputerów, to ich użyteczność mogłaby znacznie wzrosnąć. Ma to szczególnie duże znaczenie w kontekście różnych sytuacji, w których trzeba podejmować ważne decyzje na podstawie oglądanych obrazów (w diagnostyce medycznej, w wojskowej analizie zdjęć satelitarnych), a także wtedy, gdy chcemy wyszukać w dużym multimedialnym zasobie danych (np. w internecie) te obrazy, które zawierają interesującą nas treść nieujawnioną bezpośrednio w ich opisie. Automatycznym rozumieniem obrazów zajmuje się naukowo pracownik Akademii Pedagogicznej, prof. Marek Ogiela, który jest w tym zakresie uznawanym na świecie autorytetem. Sugeruję więc, żeby w kolejnym numerze „Konspektu” ukazał się Jego artykuł — właśnie na ten temat.
Ryszard Tadeusiewicz |
|
|
Copyright © "Konspekt". Kraków, lipiec-sierpień 2004 . Statystyka |