Czy nie zaskoczyła pani informacja podana w ubiegłym roku przez tygodnik „Newsweek” o ukazaniu się na rynku amerykańskim przenośnego tłumacza „Voice", który włada angielskim, włoskim, hiszpańskim i niemieckim?
Nie. Z tego co wiem „Voice” jest w stanie rozpoznać i odpowiedzieć na ponad 2000 fraz. Są to proste słowa i jeszcze prostsze zdania.
Z każdym komputerem można już dziś prowadzić rozmowę. Wystarczy napisać program np. odpowiadający na przewidziane pytania w sposób schematyczny. Nie ma to nic wspólnego z przetwarzaniem języka naturalnego, które zakłada swobodną konwersację w obszarze całej wiedzy człowieka, lub w jej fragmencie.
Zasada na której działa program jest inna. Przypomina pan sobie popularną grę pt. „King's Quest”. Na pytania, które zadaje gracz, komputer odpowiada gotowymi formułkami. Jeśli nie zna podanego słowa żąda wyjaśnień i... odpowiada gotową programową formułką. Jest to ograniczenie wykluczające swobodną konwersację.
Przetwarzanie języka naturalnego związane jest ze stworzeniem programu, który tłumaczyłby dowolne zdanie na „język” komputera. Ten po rozpoznaniu treści zdania i sięgnięciu do własnej pamięci umiałby w sposób logiczny na nie odpowiedzieć. Jest to oczywiście ogromne uproszczenie.
Obecnie nie ma ani takich maszyn, ani takich programów. Są jedynie zakończone sukcesem próby w różnych dziedzinach wiedzy.
— Proszę o przykłady.
Na uniwersytecie w Saarbrucken w RFN opracowano program „Susy” tłumaczący teksty z jednego języka naturalnego na inny. Teksty tłumaczone są z szybkością 15 000— 30 000 słów na godzinę. System analizuje języki: niemiecki, angielski, francuski, rosyjski i esperanto. Wypowiedzi mogą być generowane po angielsku, niemiecku i francusku. W Stanach Zjednoczonych na Uniwersytecie Stanu Pensylvania został zrealizowany system TEXT udzielający odpowiedzi na pytania dotyczące struktury bazy danych. Obecna jego wersja powstała na potrzeby amerykańskiej marynarki wojennej.
Użytkownik otrzymuje odpowiedzi na pytania typu: — co wiesz o pancerniku Iowa?, co to jest działo 406 mm?, albo jaka jest różnica pomiędzy kutrem torpedowym a krążownikiem atomowym.
Informacje są stale aktualizowane.
Dowiedziałem się też o zastosowaniach wywiadowczych systemów przetwarzających języki naturalne. Krajowa Agencja Bezpieczeństwa (NSA) dysponuje na Uniwersytecie Prinoeton własnym ośrodkiem badawczym nauk komputerowych. Opracowano tam program automatycznie wychwytujący takie słowa jak: „bomba", „Biały Dom”, „za dwa dni". Po ich pojawieniu się rozmowy telefoniczne już zarejestrowane przesyłane są do dokładnej analizy. Jest to komputerowe wielkie ucho Ameryki. Analiza podsłuchiwanych rozmów jest jednak marginesem zastosowań tego o czym rozmawiamy.
— Tłumaczenie tekstów, inteligentne bazy danych, podsłuch — co jeszcze?
— Kierowanie procesami technologicznymi, pracą maszyn — od obrabiarki do kombajnów do zbioru ziemniaków. Programy ekspertowe udzielające odpowiedzi na podstawie informacji zgromadzonych w ogromnych bankach danych. Przypuszczam, że nie ma takiej dziedziny aktywności człowieka w której nie dałoby się zastosować urządzeń posługujących się językiem naturalnym. Wszystko to stanie się faktem prędzej czy później.
Od czego to zależy?
— Od środków jakie się przeznaczy na badania. Komputery nie potrafią generalizować, wnioskować, kategoryzować czy tworzyć wynalazki. Z dobrym programem można pozornie wykonywać niektóre te czynności, ale to złudzenie. Z przetwarzaniem języków naturalnych jest podobnie. Postęp osiągany jest w bardzo wąskich dziedzinach, często odległych od siebie. Kiedy próbujemy połączyć systemy okazuje się, że to nie działa. Paradoks? Ależ skąd. Jeszcze jeden dowód na to jak skomplikowana jest ludzka mowa. Posługiwanie się językiem wymaga logicznego myślenia — komputery tego jeszcze nie potrafią. One wykonują program — a to nie to samo. Denerwują mnie porównania komputera do ludzkiego mózgu. To tak jakby konfrontować kierunek z odległością albo kolor z masą. To nie te same jednostki.
— Pani praca wymaga nie tylko znajomości sprzętu i umiejętności programowania, ale i rozległej wiedzy nu temat gramatyki języka polskiego.
— Nie jestem z wykształcenia polonistką. Skończyłam informatykę na Uniwersytecie Warszawskim a do zespołu doc. Leonarda Bolca zajmującego się tym problemem trafiłam trochę przez przypadek. Oczywiście zmuszona zostałam do nadrobienia braków. W naszym kraju tego rodzaju badania prowadzone są od ponad dziesięciu lat mimo to zbyt wcześnie mówić o wynikach tym bardziej, że nie dysponujemy sprzętem odpowiedniej jakości. Prowadzone są prace teoretyczne, które nie wymagają ani ogromnych pieniędzy ani superkomputerów.
W takim razie dlaczego się je prowadzi?
— Bo nigdy nic z góry, nie wiadomo. Przykład odkrycia przez Stanleya Ponsa i Martina Fleischmanna zjawiska reakcji syntezy jądrowej zachodzącej w temperaturze pokojowej świadczy o tym, że czasami przy niewielkich nakładach udaje się osiągnąć to czego nie udało się osiągnąć dzięki wielkim programom badawczym.
Nasze badania będą procentowały w przyszłości. Kiedy na świecie opracowane zostaną systemy przetwarzające języki naturalne nasz dystans nie będzie tak wielki. Może dzięki temu łatwiej przystosujemy ich odkrycia dla naszych potrzeb.
W Polsce rzadko spotyka się programy napisane w taki sposób aby komunikowały się z użytkownikiem w języku polskim. Ma to swoje dobre strony — uczymy się angielskiego. Jednak jest to sytuacja nienormalna we Francji, RFN czy krajach skandynawskich program napisany jest „pod użytkownika". To się z pewnością zmieni, ale dziś mówiąc o komputerach nie można niestety powołać się na Mikołaja Reja, „iż Polacy nie gęsi też swój język mają".
— Na zakończenie naszej rozmowy chciałbym zapytać jak czuje się kobieta wśród komputerów. Zawsze sądziłem, że informatyka to domena mężczyzn.
Jest pan w błędzie. Zaczynając od Ady Augusty Lovelace córki Byrona, która była współpracowniczką Charlesa Babbage'a — autora prototypu komputera zwanego „maszyną matematyczną” na Grace Murray Hopper — autorce języka Cobel kończąc. Kobiety towarzyszyły rozwojowi informatyki. Z własnego podwórka dodam, że system TEXT o którym mówiliśmy został zrealizowany przez Katheleen R. McKeown, podobnie jak system ILIAD- pomocy w nauce języka angielskiego opracował zespół pod kierunkiem Madeline Bates. Z pewnością nie jesteśmy tak widoczne jak mężczyźni co nie znaczy, że nas nie ma. Ale, ale... czy pan nie jest antyfeministą?
Rozmawiał:
Marek Czarkowski
