Adam Grzeszak
27 grudnia 2016
Przyszłość gospodarki to górnictwo danych
Fedrowanie w chmurach
Górnictwo danych to przyszłość gospodarki. Nowi górnicy przekopują się przez góry informacji, jakie na nasz temat gromadzą banki, urzędy, firmy telekomunikacyjne, sklepy. Podobno chcą nas lepiej poznać...
Kto z nas nie czytał listy dowodów, że żyje w XXI w.? Z tego internetowego żartu śmieli się chyba wszyscy, którzy odkryli, że i oni, wstając w nocy, sprawdzają przy okazji, czy nie dostali jakiegoś maila, a nowy dzień zaczynają od wizyty w internecie. Wpadają w panikę, orientując się, że wyszli z domu bez telefonu, w którym mają zapisanych 15 numerów do czterech członków rodziny. Do zakupu gotówkowego muszą się przygotować, bo tak się przyzwyczaili do płacenia kartami, że nawet domową mikrofalówkę usiłowali kiedyś uruchomić za pomocą kodu PIN.
Kto z nas nie czytał listy dowodów, że żyje w XXI w.? Z tego internetowego żartu śmieli się chyba wszyscy, którzy odkryli, że i oni, wstając w nocy, sprawdzają przy okazji, czy nie dostali jakiegoś maila, a nowy dzień zaczynają od wizyty w internecie. Wpadają w panikę, orientując się, że wyszli z domu bez telefonu, w którym mają zapisanych 15 numerów do czterech członków rodziny. Do zakupu gotówkowego muszą się przygotować, bo tak się przyzwyczaili do płacenia kartami, że nawet domową mikrofalówkę usiłowali kiedyś uruchomić za pomocą kodu PIN. Przesada? Chyba niewielka. Stajemy się coraz bardziej obywatelami cyfrowego świata. I nie ma co zaprzeczać, bo dowody zostawiamy na każdym kroku. Można je znaleźć w naszym komputerze, smartfonie, w systemie dostawcy internetu, na serwerach Google, Microsoftu, Apple, Facebooka. Każda strona internetowa nas rozpoznaje i rejestruje naszą aktywność. Wszyscy są nas strasznie ciekawi – bankowcy, handlowcy, usługodawcy. Ile mamy lat, gdzie pracujemy, jak mieszkamy, ile zarabiamy, ile wydajemy, jakie robimy zakupy? Nasz telefon wie niemało i po kryjomu dzieli się informacjami, nawet nas o tym nie uprzedzając. Google obserwuje, czego chcemy się dowiedzieć za pomocą jego wyszukiwarki i o czym piszemy w mailach. Jeśli mamy włączony GPS i korzystamy z map, wie, gdzie jesteśmy teraz i gdzie byliśmy wczoraj. Może przewidzieć, gdzie i kiedy będziemy jutro. Pokaż mi swoje lajki… Przez to, że nasze życie społeczne przenosi się ze świata realnego do cyfrowego i większość kontaktów utrzymujemy za pośrednictwem Facebooka, amerykański koncern ma szansę poznać nas lepiej niż własna rodzina. To już nie internetowy żart, ale naukowo stwierdzony fakt. Zespół naukowców z Uniwersytetu Cambridge (w tym Polak dr Michał Kosiński) przeprowadził niedawno eksperyment, udowadniając, że wyłącznie na podstawie facebookowych lajków można poznać czyjąś osobowość. W eksperymencie wzięło udział 88,2 tys. ochotników, którzy wypełniali psychologiczne kwestionariusze osobowości. Swoją wiedzą o badanych dzielili się też ich koledzy z pracy, rodziny i współmałżonkowie. Potem komputerowy program automatycznie przeanalizował lajki na facebookowych profilach każdego z uczestników eksperymentu. Okazało się, że wystarczyła analiza dziesięciu, by poznać go lepiej niż koledzy z pracy. Przy 150 lajkach maszyna brała górę nad rodzicami i rodzeństwem, a przy 300 – nad współmałżonkiem. Oczywiście komputerowy psycholog sam z siebie nie był taki mądry. Został zaprogramowany w taki sposób, by lajki, czyli deklaracje lubienia konkretnych ludzi, firm, marek, stron internetowych itd., kwalifikować jako formę ekspresji określonych cech osobowości i odpowiednio je interpretować. Badacze uznali to za początek maszynowej inteligencji emocjonalnej i zapowiedź nowych komputerowych systemów odznaczających się kompetencjami społecznymi. Nie wiadomo tylko – cieszyć się czy bać? Bo Facebook ma już 1,3 mld użytkowników, gromadzi dane z ich profili i nie bardzo wiadomo, jak je wykorzystuje. Fakt, że za korzystanie z portalu nie trzeba płacić, nie wynika z jego filantropii. Po prostu użytkownicy i ich dane są towarem, który umiejętnie zagospodarowany może dać olbrzymie zyski. Komu? Jakie? Czy ktoś prześwietlił lajki Marka Zuckerberga? Zresztą wszystkie podsuwane nam nieustannie oferty wirtualnych dysków, bezpłatnego przechowywania cyfrowego dobytku w chmurach, to nie dowód, że w internecie opłaca się dawać za darmo. Liczy się każdy pomysł na gromadzenie wielkich zasobów danych, czyli big data. Im bardziej „big”, tym większą mają wartość. Stają się surowcem, przez który przekopują się górnicy danych. Data mining, czyli dosłownie górnictwo danych (po polsku poprawnie eksploracja danych; nasi specjaliści protestują przeciw porównywaniu ich z górnikami), to dziś rozrastająca się gałąź cyfrowej gospodarki. Analitycy danych to coraz bardziej poszukiwani specjaliści. Złoża do przekopania przyrastają w astronomicznym tempie. W 2020 r. dojdziemy do 44 ZB – przewidują eksperci. To oznacza, że na jednego mieszkańca Ziemi przypadnie 5,2 tys. GB danych. ZB to zettabajt, jednostka oznaczająca tryliard (1021) bajtów. To już są pokłady trudne do ogarnięcia. Kredytu udziela algorytm Najcenniejsze skarby mają oczywiście banki. Bankowe big data to gigantyczna wiedza o życiu klientów, ich dochodach, wydatkach, długach, łącznie z najdrobniejszymi szczegółami, co gdzie i kiedy kupują. Dlatego bankowcy jako pierwsi sięgnęli po komputerowe systemy analizy danych. To tzw. systemy scoringowe do szybkiej oceny zdolności kredytowej. Na podstawie wiedzy o kliencie, jego sytuacji życiowej i historii aktywności w systemie bankowym algorytm szacuje, jak duże jest ryzyko, że udzielony kredyt nie zostanie spłacony. Jeśli uzna, że mieści się ono w akceptowalnych przez bank granicach, kredyt jest udzielany bez długotrwałych procedur. Zaawansowane systemy analityczne potrafią automatycznie oceniać wiarygodność zabiegającego o kredyt, wspierając się wiedzą psychologiczną. Śledzą, jak wypełnia internetowy wniosek, czy robi to w tym samym tempie, w którym miejscu się zawahał, czy zmieniał już raz wpisane dane itd. Algorytm komputerowy wie, jak interpretować takie zachowania, i to może przesądzić o ostatecznej decyzji. Skąd czerpał taką naukę, tego klient się nie dowie. Z systemem się nie dyskutuje. – Możliwości wykorzystania danych o klientach bank ma bardzo wiele. Ich analiza pozwala przewidzieć wiele sytuacji, jakie mogą się zdarzyć w nadchodzącej przyszłości. Przykładowo, jeśli system wykryje rosnące rachunki za naprawę samochodu, zakupy części, ubezpieczenia itd., może zaproponować klientowi korzystny kredyt na zakup nowego auta. Prawdopodobieństwo, że niebawem będzie go potrzebował, jest duże – wyjaśnia Krzysztof Krzos, ekspert w dziedzinie analizy danych bankowych z Softax. Firma ta przygotowuje dla banków zaawansowane systemy do analizy klientów. Na razie jednak polskie banki podchodzą do tego z umiarkowanym entuzjazmem. – W praktyce pojawia się wiele problemów. Banki mają wprawdzie duże zasoby danych o klientach, ale bywa, że są one rozproszone, zapisane w różnych formatach, różnych systemach. Stworzenie z tego ujednoliconej bazy wymaga sporo pracy – wyjaśnia Krzos. Koszyk zdradza konsumenta Przewidywanie tego, co zrobi konsument, jest największym wyzwaniem analityki predykcyjnej, podstawowej gałęzi górnictwa danych. Chodzi o to, by poznać nasze plany, zanim my sami je dobrze poznamy. A nawet zasugerować nam to i owo. Firmy handlowe intensywnie nad tym pracują. Temu służy reklama behawioralna, wszechobecna w internecie. Komputerowe algorytmy analizują historie przeglądania stron, zakupów dokonywanych w sieci itd. Na podstawie reguł statystycznych próbują wydedukować, czego nam będzie trzeba, i serwują odpowiednie reklamy. Na razie robią to w sposób irytujący, ale dopiero się uczą: jeśli zaglądaliśmy na strony samochodowe, zasypią nas ofertami opon zimowych, jeśli zainteresował nas jakiś kraj, musimy przygotować się na masę reklam firm turystycznych itd. Także w realu handlowcy pracowicie gromadzą zasoby big data i starają się je analizować. Służą do tego m.in. karty stałego klienta. Jedną z ich funkcji jest tworzenie baz klientów, analiza decyzji zakupowych, spersonalizowana reklama. Coraz powszechniejsze są komputerowe systemy zarządzania relacjami z klientem (CRM). Gromadzą wiedzę na jego temat, śledzą zachowania, analizują zawartość koszyka. Mogą być zintegrowane z sieciami społecznościowymi, gdzie dziś kryją się nieprzebrane pokłady wiedzy o nas, które sami tam gromadzimy. Jak to działa, dobrze ilustruje historia amerykańskiej sieci handlowej Target, która szczególnie intensywnie buduje relacje z klientami, stosując marketing spersonalizowany. Pewnego dnia w dyrekcji pojawił się oburzony mieszkaniec Dakoty Północnej, grożąc sądem. Jego córka dostała ofertę produktów dla młodych matek, a to przecież jeszcze nastolatka. Co Targ
Pełną treść tego i wszystkich innych artykułów z POLITYKI oraz wydań specjalnych otrzymasz wykupując dostęp do Polityki Cyfrowej.