Karol Jałochowski: – Proszę powiedzieć coś, co nie odstraszy czytelnika od słów „statystyka obliczeniowa”.
Przemysław Biecek: – Hal Varian, główny ekonomista Google’a, powiedział niedawno, że za 10 lat najbardziej seksownym zawodem świata będzie profesja statystyka. I myślał oczywiście o statystyce obliczeniowej.
Tylko dlaczego?
Dostęp do danych jest coraz łatwiejszy. Poszukiwanie wśród nich użytecznych i nowych prawidłowości to fantastyczna gra ze światem, rozrywka intelektualna. Przykładowo, w prowadzonym od 11 lat badaniu Diagnoza Społeczna zbierane i udostępniane są dane o ponad 50 tys. Polaków – o tym, jak żyją, co myślą, jak się czują, o czym marzą, na czym im zależy. W sumie pod uwagę bierze się ponad 2 tys. cech każdego badanego. Z takiego zbioru danych można wywnioskować, jak i dlaczego zmienia się system wartości społeczeństwa, jak kształtują się dochody, poglądy polityczne, wykształcenie. Jaka praca może być ciekawsza? Czy to zatrzyma czytelnika?
Zobaczymy...
Dam więc przykłady innych zastosowań statystyki obliczeniowej. Weźmy choćby skonstruowany niedawno przez IBM superkomputer Watson, który wygrał w grę Jeopardy (w Polsce znaną pod nazwą Va Banque) z najlepszymi z ludzkich graczy. Wykorzystywał jednocześnie wiele różnych opartych na statystyce algorytmów przetwarzania tekstu i informacji. Inny przykład dotyczy naszego genomu. W uproszczeniu, przypomina on wyraz składający się z trzech miliardów liter. Aby go odczytać, trzeba ułożyć kilkadziesiąt lub kilkaset miliardów krótkich fragmentów. Fragmenty te zachodzą częściowo na siebie, dzięki czemu możemy połączyć je w dłuższe odcinki, a następnie w całość. Bez komputerów jest to absolutnie niemożliwe.