Artykuł w wersji audio
Gdy w pierwszy weekend marca miliony widzów zasiadły do czwartej odsłony serialu „House of Cards”, swój własny seans rozpoczął producent programu. Zaczął od zanotowania nazwiska widza, jego pochodzenia oraz daty seansu. Ale takimi informacjami firma dysponowała już dekadę temu, gdy jej działalność ograniczała się do wysyłkowej wypożyczalni płyt DVD. Obecnie gdy któryś z 75 milionów użytkowników loguje się do serwisu internetowego Netflixa – od stycznia dostępnego także w Polsce – ten dowiaduje się także, z jakiego rodzaju urządzenia korzysta dany użytkownik. Telewizor, laptop, tablet, a może smartfon? Jakiej marki? Jaki model?
To dopiero początek seansu. Po wciśnięciu „play” system zacznie notować, w jaki sposób widz skonsumuje kolejną odsłonę polityczno-małżeńskich perypetii Franka i Claire Underwoodów. Czy obejrzy pierwszy odcinek w całości, od początku do końca, a może od razu kilka naraz? Czy w którymś momencie przewinie film do przodu lub cofnie go o kilka minut, aby ponownie obejrzeć wybraną scenę? A jeśli tak, to czy chodziło o wyjątkowo dynamiczny dialog (być może widz czegoś nie zrozumiał, w końcu podchodzi z kraju nieanglojęzycznego), czy o scenę łóżkową (w końcu ma 15 lat).
Czasem wydarzy się najgorsze: widz przerwie seans. Ale pauza pauzie nierówna. Być może wyszedł do toalety i za chwilę wznowi serial. Albo minęła północ i postanowił dokończyć oglądanie następnego wieczoru. Jeśli jednak do „House of Cards” już nie powróci, takiemu przypadkowi Netflix poświęci więcej uwagi. Szczególnie jeśli więcej osób porzuci serię po obejrzeniu danego odcinka czy wręcz konkretnej sceny, dajmy na to brutalnego morderstwa albo przydługiego przemówienia prezydenta. Wiedza ta przyda się nie tylko podczas kręcenia kolejnego sezonu „House of Cards”, lecz już przy kolejnym logowaniu niecierpliwego widza.
Telewizja ogląda widza
Szefowie Netflixa mawiają, że ich serwis istnieje w tylu wersjach, ilu ma użytkowników. Indywidualizuje się już podczas zakładania konta. Nowemu widzowi wyświetla listę mniej lub bardziej znanych filmów, a po wskazaniu trzech ulubionych wygeneruje mu stronę powitalną z listą wybranych specjalnie dla niego rekomendacji: filmów i seriali, które zdaniem algorytmu także powinny się mu spodobać. I niemal na pewno będzie miał rację.
– Jeżeli wysoko oceniłeś film A i film B, to bazując na zagregowanych ocenach klientów o podobnych upodobaniach, z dużą pewnością spodoba ci się też tytuł C. Ta prosta zasada sprawdza się od lat – mówi Jakub Dubowik, starszy analityk danych w polskim oddziale amerykańskiej firmy Teradata, z której serwerów i wsparcia analitycznego korzysta Netflix. Podobnie jak Apple, eBay czy Wal-Mart, a także polscy operatorzy komórkowi. Wszystkie te marki łączy to, że codziennie gromadzą nieprawdopodobne ilości informacji o klientach. Specjaliści szacują, że „ślad informacyjny”, jaki każdy z nas pozostawia po sobie w sieci w ciągu jednego roku, to około jednego terabajta. Czyli odpowiednik blisko półtora tysiąca zapisanych po brzegi płyt CD. Mimo że dotyczą one naszych dotychczasowych zachowań, po odpowiedniej analizie pozwalają przewidzieć także te przyszłe.
– Jeśli wydaje ci się, że jesteś człowiekiem oryginalnym, chodzącym własnymi ścieżkami, z niekonwencjonalnym gustem muzycznym, filmowym czy kulinarnym – analitycy big data szybko wyprowadzą cię z błędu. Możemy się uważać za indywidualistów. Ale ślady, które pozostawiamy w różnych miejscach w sieci, pozwalają wymodelować sporą część naszego życia – przekonuje Dubowik. I zachęca do prostej zabawy z Google Trends. To darmowe internetowe narzędzie pozwala sprawdzić, jak często dane słowo lub frazę wyszukiwano w Google w ciągu ostatnich lat. Na przykład gdy przyjrzymy się popularności słowa „fitness”, zobaczymy skoki w dwóch momentach każdego roku. Na początku stycznia i tuż przed wakacjami. Czyli, odpowiednio, w okresie postanowień noworocznych i przedplażowym. Z kolei przed sylwestrem podwaja się liczba zapytań o darmową muzykę mp3.
Nawet tak proste i powszechnie dostępne narzędzie big data pomaga chociażby sieciowym sprzedawcom – podpowiadając, jakie produkty powinni w danym czasie eksponować w swoich cyfrowych witrynach. Do własnych celów Google czy Facebook wykorzystują nieporównywalnie bardziej złożone narzędzia. Podobnie jak Netflix, który już 10 lat temu rozpisał konkurs na algorytm najskuteczniej przewidujący to, jakie filmy mogą spodobać się danemu widzowi. Nagrodę główną – okrągły milion dolarów – przyznano dopiero trzy lata później. Co ciekawe, Netflix ostatecznie nie wdrożył tego kosztownego rozwiązania. Bo informacje udostępnione uczestnikom konkursu ograniczały się do czterech danych: numeru użytkownika, tytułu filmu, oceny wystawionej danemu filmowi oraz daty seansu. Tymczasem od czasu rozpisania konkursu firma systematycznie poszerzała zakres danych, które gromadzi o swoich widzach. Począwszy od analizy milionów codziennych wyszukiwań w katalogu Netflixa. A kończąc na śledzeniu tego, jak użytkownik zareaguje na trailer kolejnego filmu, który podsuwa mu się jeszcze podczas trwania napisów końcowych. Ale widzowie to tylko jedna strona równania.
Musi się podobać
Systemy rekomendacji dzielą się na dwa rodzaje. Te bardziej popularne znajdują użytkowników o zbliżonych zainteresowaniach. – Zaproponuj użytkownikowi to, co wybierali najczęściej klienci o podobnej historii ocen lub zakupów. Dlatego nazywamy je systemami user-based – tłumaczy Dubowik. Jeśli więc fani „Avatara” i „Matrixa” zazwyczaj docenili też „Władcę Pierścieni”, to po obejrzeniu tych dwóch pierwszych filmów zobaczysz zachętę do poznania dziejów Frodo Bagginsa. Netflix oczywiście korzysta z tego rozwiązania. Ale sięga również po drugi rodzaj systemów rekomendacji: usiłujących zrozumieć sam produkt i dlatego określanej mianem item-based.
Najlepszym przykładem takiej strategii jest internetowe radio Pandora. Zatrudniony przez nie zespół muzykologów przeanalizował dotąd setki tysięcy piosenek i opisał je blisko 450 cechami. Takimi jak tempo, tonacja, użyte instrumenty czy proporcje zwrotek do refrenu. Gdy słuchacz Pandory „polubi” którąś z piosenek, algorytm automatycznie podsunie mu podobną. Przy czym podobieństw tych można się w ogóle nie domyślić. Po przesłuchaniu nowoczesnego elektronicznego przeboju radio może zagrać nam klasyka música popular brasileira. I z pozoru będą się różnić wszystkim: stylem, nastrojem, tempem. Pandora wie jednak, że oba utwory mają identyczny układ akordów, podobne rozłożenie akcentów rytmicznych, a wokaliści w obu przypadkach są tenorami lubiącymi podobne przebiegi melodyczne. Zachwycony słuchacz będzie więc zaskoczony nowym odkryciem, ale dla algorytmu będzie to oczywiste, że piosenka musiała się spodobać.
– W przypadku Pandory nie chodzi o analogie pomiędzy gustami użytkowników, ale o obiektywne podobieństwo utworów. Choć nie zawsze łatwo je wychwycić – tłumaczy Dubowik.
Jeszcze trudniej wychwycić sposób, w jaki streamingowy potentat Spotify wybiera swoje cotygodniowe rekomendacje muzyczne w ramach nowej funkcji Discover Weekly – „Odkryj w tym tygodniu”. Co poniedziałek użytkownicy serwisu otrzymują playlistę z dwiema godzinami muzyki dobranej specjalnie dla każdego z nich. I to niezwykle trafnie – przynajmniej połowa użytkowników w każdej playliście znajduje coś, co postanawia na stałe zachować w swojej cyfrowej płytotece. Na czym polega sekret? Otóż Spotify odkryło, że sam algorytm rekomendacji jest… zbyt doskonały. Podsuwa nam propozycje, które aż nazbyt odpowiadają naszemu gustowi. Dlatego wydają się nudne. Spotify skrzyżowało więc perfekcję algorytmu z nieprzewidywalnością samych słuchaczy. Przyjrzało się miliardom playlist, które tworzą użytkownicy serwisu. Jeśli zauważy, że moje playlisty mają wiele punktów wspólnych z playlistami kilku innych osób, zaproponuje mi kilka innych utworów, za którymi owe osoby przepadają. Niezależnie od gatunków czy pochodzenia – czy to słuchaczy, czy to utworów. W ten sposób w zestawie moich rekomendacji niespodziewanie znajdzie się piosenka z Islandii. A islandzki użytkownik Spotify usłyszy nowy utwór Brodki. Jako całość każda playlista – obiecuje serwis – będzie „wyjątkowa jak Twój muzyczny gust”.
Netflix również starannie analizuje zawartość swojego katalogu filmowego. Zamiast akordów i instrumentów interesują go jednak nazwiska aktorów, reżysera czy operatora. Gatunek dzieła, data i miejsce produkcji czy liczba sprzedanych biletów kinowych. Sprawdza, o jakiej porze dnia i tygodnia widzowie zazwyczaj sięgają po dany tytuł. Jakie słowa-klucze powtarzają się w recenzjach danego filmu i czy ma on ograniczenie wiekowe. Bierze pod uwagę nawet „głośność” filmu, dominującą w nim kolorystykę czy rodzaj scenerii. Czy wolimy otwarte przestrzenie „Władcy Pierścieni” czy klaustrofobię „Cube”?
Podobnie jak Pandora firma zatrudnia zawodowych oglądaczy, którzy setkami przymiotników opisują każdy film w katalogu Netflixa. Zestawienie tego rodzaju informacji pozwala firmie wyciągać wnioski, których żaden filmoznawca czy krytyk nie zdołałby odgadnąć. Dzięki nim Amerykanie opracowali najdoskonalszy z dotychczasowych system rekomendacji filmowych. I nakręcili swój doskonały serial.
Domek z polubień
„Utrzymujemy niezwykle bliską relację z widzami i wiemy, co lubią oglądać. To pomaga nam przewidzieć, jak dużym zainteresowaniem będzie się cieszył dany program. Mieliśmy więc pewność, że znajdziemy publiczność również dla takiego serialu” – deklarował jeden z dyrektorów Netflixa tuż po premierze pierwszego sezonu „House of Cards”. Swoje przekonanie opierał na chłodnych wyliczeniach. Analitycy Netflixa kilka lat temu zauważyli, że znaczna część użytkowników obejrzała – od początku do końca – filmy wyreżyserowane przez Davida Finchera. Między innymi „The Social Network” o początkach Facebooka. Ci sami widzowie bardzo cenili filmy z Kevinem Spacey. Niespodziewanym przebojem okazał się też pewien krótki, bo składający się tylko z czterech odcinków serial polityczny „House of Cards”, który brytyjska telewizja nadawała w 1990 r. Pomiędzy tymi trzema elementami Netflix postawił znak dodawania. Algorytm wykazał, że wynik równania będzie satysfakcjonujący.
Tak zoptymalizowany produkt należało wesprzeć równie zoptymalizowaną promocją. Dlatego zamiast przygotować jeden trailer serialu, Netflix nakręcił ich cały szereg. Dopasowując je do poszczególnych grup widzów. Gdy fani Kevina Spacey zobaczyli zajawkę z udziałem swojego ulubionego aktora, miłośniczkom serialu „Thelma i Louise” pokazano żeńskie bohaterki „House of Cards”. A amatorzy kina niezależnego dostali zapowiedź z artystycznym sznytem. Nawet kolorystykę plakatów serialu z dominującą szarością i czernią oraz mocnymi czerwonymi akcentami zaczerpnięto z plakatów innych tytułów z tego gatunku, w które użytkownicy serwisu Netflix najchętniej klikali.
Algorytm podyktował Amerykanom także sposób dystrybucji „House of Cards”. Analiza obyczajów telewizyjnych milionów użytkowników Netflixa pokazała bowiem, że lubimy połykać sezony seriali w całości podczas wielogodzinnych maratonów. Zazwyczaj w weekendy. I że uzależniamy się od danego serialu dopiero po kilku odcinkach. Netflix przyjrzał się niedawno 25 popularnym serialom oraz temu, jak funkcjonują na kilkunastu różnych rynkach. „Okazało się, że nikt nigdy nie przywiązał się do danego tytułu dzięki pilotowi” – mówił jeden z dyrektorów Netflixa. Potrzeba było średnio trzech odcinków. Jeśli widz dotrwa do tego momentu, najpewniej obejrzy dany sezon do końca. Dlatego Netflix zrezygnował z tradycyjnego, cotygodniowego rytmu emisji seriali. I postanowił udostępniać kolejne sezony „House of Cards” w całości. Oczywiście zawsze w piątkowe wieczory.
Kamery na miny
– Szefowie Netflixa non stop testują różne nowe hipotezy, które podpowiadają im analitycy. Przy niemal każdej wizycie użytkownik widzi coś nowego: inny układ serwisu, nowe okładki, nowe rekomendowane kategorie – mówi Dubowik. Można więc powiedzieć, że obecnie istnieje tyle wersji Netflixa, ile zalogowań. Zdaniem ekspertów serwis będzie szukał jeszcze bliższej „relacji” z widzem. Na razie bowiem przeprowadza swoje kalkulacje na podstawie naszych kliknięć i innych działań na platformie internetowej. Kolejnym krokiem może być bezpośrednie obserwowanie nas podczas seansów. I wyciąganie wniosków na podstawie mimiki czy tego, jak często odrywamy wzrok od ekranu. Jeśli sięgamy po komórkę, to czy zrobimy to z nudów, czy może po to, by na gorąco skomentować oglądany serial w serwisie społecznościowym? W wielu branżach już się o tym myśli, tym bardziej że w kamery wyposażone są dziś rozmaite urządzenia: smartfony, komputery, telewizory. Na razie się nam przysłuchują, skoro każdym można sterować za pomocą głosu. Wkrótce zaczną nam się przyglądać.
Monitorowanie emocji pomoże algorytmowi zrozumieć, dlaczego wiele osób rezygnuje z oglądania filmu w tym samym momencie. Czy coś widzów znudziło, obrzydziło, a może tempo dialogu przerastało ich możliwości poznawcze? To pozwoli precyzyjnie wyliczyć, jak wysoko należy ustawić poprzeczkę percepcyjną, na jak brutalne sceny można sobie pozwolić albo ile odsłonić w scenach miłosnych. Obecnie dylemat ten rozstrzygają eksperci z krwi i kości, biorąc pod uwagę wszystkich potencjalnych widzów. Kiedyś wszystko wyliczy komputer. Być może co innego dla każdego z odbiorców. Dostaniemy więc produkt filmowy, muzyczny czy prasowy dopasowany do własnych możliwości intelektualnych i preferencji. Pytanie, czy zatęsknimy wtedy za czasami, gdy wszyscy oglądaliśmy film – lub czytaliśmy artykuł – z tym samym zakończeniem?