Ponad 2 mld internautów, ponad 6 mld abonentów sieci telefonii komórkowej, miliardy urządzeń elektronicznych podłączonych do sieci teleinformatycznych – nieustannie wysyłają sygnały i produkują treści skrzętnie gromadzone na milionach serwerów. Jeden tylko serwis internetowego wideo YouTube gromadzi w ciągu minuty 72 godz. filmów nagrywanych przez internautów. Miliard użytkowników serwisu społecznościowego Facebook każdego dnia publikuje ponad ćwierć miliarda zdjęć i wystawia 3 mld „lajków” – to najprostszy sposób wyrażenia opinii o notce, fotografii lub filmiku innych fejsbukowiczów.
Astronomiczne liczby oszałamiają, to jednak dopiero początek epoki Big Data – epoki wielkich ilości danych. Większość zwykłych internautów jest przerażona nadmiarem informacji, przed zaczadzeniem smogiem informacyjnym ostrzegał już pod koniec XX w. znakomity polski informatyk prof. Ryszard Tadeusiewicz. To, co jednych niepokoi, innych podnieca. Dane dla XXI stulecia będą tym, czym ropa dla XX – kluczowym surowcem, przekonują szefowie firm teleinformatycznych. Wtórują im naukowcy: – Nadeszły złote czasy dla statystyków – cieszy się dr Andrzej Dąbrowski z Uniwersytetu Wrocławskiego.
By nie być gołosłownym, podaje przykład. W jaki sposób ujawnić epidemię grypy? Tradycyjnie potrzebne są do tego informacje o zachorowaniach, jakie lekarze i szpitale przekazują służbom epidemiologicznym. Na ich podstawie można stwierdzić, jak zmienia się liczba chorych, i ocenić, czy sytuacja mieści się w normie, czy też zbliża do wybuchu. Google postanowił jednak sprawdzić inną metodę – poddał analizie statystycznej pytania, jakie użytkownicy wpisują w okienko wyszukiwarki.