Nauka

Bomba zettabajtowa

Ludzkość przygnieciona górą danych. Jak sobie radzi?

Serwerownie Wikileaks ukryte w bunkrach. Serwerownie Wikileaks ukryte w bunkrach. Jann Lipka / Rex Features / EAST NEWS
W ciągu godziny bombarduje nas tyle informacji, ile naszych dziadków przez całe życie. Gromadzimy ogromne ilości danych, ale czy następne pokolenia będą mogły z nich skorzystać?
Całą infrastrukturę, w tym zwłaszcza serwery i dyski, lokuje się w sieci. Nie ma znaczenia, gdzie one są fizycznie.The Oregonian /Landov/BEW Całą infrastrukturę, w tym zwłaszcza serwery i dyski, lokuje się w sieci. Nie ma znaczenia, gdzie one są fizycznie.
Polityka

Artykuł w wersji audio

W cyfrowym świecie najmniejsza porcja informacji to bajt. Sam tekst tego artykułu zajmuje (potocznie – waży) około 10 kilobajtów, czyli ma 10 tys. znaków ze spacjami. W rzeczywistości zajmuje zwykle więcej pamięci – zależnie od formatu, w którym jest zapisany. 20 lat temu na dyskietce 3,5-calowej o pojemności 1,44 megabajta (wówczas powszechny nośnik danych) zmieściłoby się ok. 140 takich artykułów. Wydawało się wtedy, że to zupełnie wystarczy. Dziś nosimy przy sobie na kartach pamięci telefonów komórkowych i aparatów fotograficznych, w odtwarzaczach muzycznych, pendrive'ach, nie mówiąc już o twardych dyskach naszych laptopów czy też iPadów gigabajty danych. Podręczną pamięcią staje się Internet, gdzie przechowujemy zdjęcia, listy, dokumenty, filmy i ulubione piosenki. Google oferuje za darmo przestrzeń dyskową o pojemności 10 gigabajtów, zaś za niewielką dopłatą uzyskamy cyfrowy schowek mogący pomieścić 80 gigabajtów.

Tu zaczynają się już ilości danych równie niewyobrażalne jak odległości astronomiczne wyrażane w latach świetlnych. Obecnie pamięć kont wszystkich użytkowników Gmail – jednej z usług firmy Google – to równoważność pojemności 1,74 mld płyt CD audio. Ułożone na sobie osiągnęłyby wysokość 2088 km – 236 razy więcej niż Mount Everest. W ciągu roku pojemność Google może osiągnąć 1 eksabajt – tyle samo co nagranie 50 tys. lat wideo w najlepszej jakości. Na dodatek Google planuje zindeksować wkrótce około 100 petabajtów danych, co jest równoważne połowie wszystkich materiałów wydrukowanych w historii ludzkości.

Nic dziwnego, że zebraliśmy łącznie 1,2 zettabajta danych. Jeśli przyjąć, że jeden bajt to ziarnko piasku, to ta wielkość wielokrotnie przewyższa liczbę ziaren piasku na całej kuli ziemskiej. W ocenie firmy EMC, światowego potentata w zarządzaniu danymi, do końca 2011 r. na świecie będzie istniało ponad 300 bld plików cyfrowych. – Od dziś do 2020 r. ilość danych, którymi zarządza ludzkość, zwiększy się z 1,2 do 35 zettabajtów. Ponad 90 proc. z nich będą stanowiły dane nieuporządkowane – twierdzi Joe Tucci, szef EMC.

Jak zbudować arkę?

Stanisław Lem w wydanym w 2007 r. zbiorze „Bomba megabitowa” porównał zjawisko Internetu do biblijnego potopu, „w którym można ze wszystkim utonąć, jeżeli nie zdołamy dla ratunku, jak Noe, zbudować sobie Arki. Ale jak by miała wyglądać »Arka Noego Internetu«, łatwo rzec, ale nie sposób myśl taką zrealizować”. Przypomniał również opowiastkę ze swojej „Cyberiady” o tym, jak zbuntowane Mądro musiało ulec Siemianom, którzy zalali je masą bezużytecznych danych. Mistrz miał rację – dzisiejsze wojny wygrywa ten, kto potrafi przetworzyć dane w użyteczne informacje i panuje nad cyberprzestrzenią.

Dotychczasowy model zarządzania danymi sprowadza się zazwyczaj do upychania ich na wszelkiej maści nośnikach pamięci masowych w domu lub firmie. Dość szybko zapominamy, jaką one mają dla nas wartość. Nadzieję na zmianę daje przetwarzanie w tzw. chmurze (cloud computing), czyli w Internecie. To sposób prostszy, tańszy i skuteczniejszy. Całą infrastrukturę, w tym zwłaszcza serwery i dyski, lokuje się w sieci. Nie ma znaczenia, gdzie one są fizycznie – mając dostęp do Internetu, możemy zajrzeć do swoich danych z każdego podłączonego do sieci komputera. W takim modelu nie trzeba kupować dużych dysków do naszych komputerów osobistych ani programów do ich przetwarzania – wystarczy niedrogi zresztą abonament na takie sieciowe usługi.

Pierwszym komputerem osobistym, polegającym w pełni na możliwościach „chmury”, jest zapowiadany chromebook firmy Google. Po zalogowaniu się przez konto Google do dyspozycji użytkownika będzie przeglądarka internetowa Chrome – i aplikacje dostępne wyłącznie przez Internet. Nowością jest, że taki komputer – i dostęp do potrzebnych programów – można będzie (na razie tylko w USA) wydzierżawić: firmy za 28 dol., placówki edukacyjne zaś za 20 dol. miesięcznie. W ramach opłaty jest też możliwość zdalnego zarządzania, kto i do czego ma dostęp, oraz wsparcie, serwis i części zamienne, a także regularne „odświeżanie sprzętu”.

Nie na darmo Scott McNealy, założyciel i wieloletni prezes firmy Sun Microsystems, dzisiaj wchłoniętej przez Oracle, głosił hasło: „Dopiero sieć to komputer”. W rezultacie musimy sobie poradzić z przesyłaniem ogromu danych. Według szacunków Cisco, czołowej firmy zajmującej się infrastrukturą sieciową, w ciągu najbliższych trzech lat ruch w Internecie wzrośnie do 767 eksabajtów.

Miesięcznie będziemy przesyłać ok. 63,9 eksabajtów i nie jest to jeszcze ostatnie słowo. Ta masa danych odpowiada 16 mld płyt DVD lub 21 bln plików MP3. Dominuje przekaz wideo, zwłaszcza gdy upowszechnia się telewizja wysokiej rozdzielczości i obraz trójwymiarowy. Następnie wymiana plików, przeglądanie stron www, wreszcie rozmowy w sieci. Byśmy mogli obejrzeć Euro 2012 w jakości HD, Telekomunikacja Polska (jako partner technologiczny mistrzostw) musi zapewnić prędkość transmisji rzędu 2x70 Gbps ze stadionów do Międzynarodowego Centrum Nadawczego oraz 2x140 Gbps pomiędzy Polską i Ukrainą (uwaga! Gbps to gigabit na sekundę, czyli osiem razy mniej niż gigabajt na sekundę).

Cyfrowe dziedzictwo

Kolejną eksplozję danych przeżyjemy, gdy w Internecie pojawią się zeskanowane zasoby narodowych i prywatnych archiwów oraz filmotek. „Gromadzenie polskiego dziedzictwa narodowego (…) jest powinnością instytucji kultury. Tworzenie kopii cyfrowych polskiego dziedzictwa narodowego jest jednym z najważniejszych warunków zachowania go dla przyszłych pokoleń” – czytamy w „Programie digitalizacji dóbr kultury oraz gromadzenia, przechowywania i udostępniania obiektów cyfrowych w Polsce 2009–2020”, powstałym pod auspicjami Ministerstwa Kultury i Dziedzictwa Narodowego.

Łącznie zdigitalizowany zasób archiwów państwowych zajmuje ponad 36 terabajtów pamięci. Natomiast zasoby Filmoteki Narodowej liczą ok. 15 tys. filmów. – Digitalizacja polega na przetworzeniu analogowego obrazu, klatka po klatce, na informację cyfrową w procesie skanowania. Każda klatka zapisana jest w postaci odrębnego pliku, tworząc sekwencję plików obrazowych – wyjaśnia Paweł Śmietanka, główny specjalista ds. digitalizacji zbiorów filmowych.

Bierze on udział w projekcie NITROFILM – digitalizacji i rekonstrukcji filmów przedwojennych. Do projektu wybrano 43 filmy najbardziej narażone na zniszczenie z powodu nietrwałości łatwopalnej taśmy nitro. W efekcie powstaną ich kopie cyfrowe oraz nowe niepalne kopie na taśmie filmowej 35 mm. – Na każdy film potrzeba ok. 8 terabajtów. Wersje do powszechnej dystrybucji zostaną oczywiście skompresowane, ale wciąż to będą pliki niebagatelnej wielkości – dodaje.

Z kolei Polskie Radio ma ok. 200 terabajtów danych cyfrowych, głównie w formacie WAV. Rocznie przybywa ok. 10 terabajtów. Prowadzone są prace nad digitalizacją nagrań archiwalnych. Telewizja Polsat gromadzi rocznie ok. 1 petabajta danych, w tym materiałów newsowych ok. 70–80 terabajtów, sportowych – ok. 200 terabajtów i ok. 150 terabajtów produkcji wysokobudżetowych.

Jak to przeczytać?

Ale im więcej danych gromadzimy, tym częściej zmagamy się z problemem kosztów energii do tego potrzebnej. Greenpeace szacuje, że w 2020 r. wszystkie centra danych, odpowiedzialne m.in. za utrzymanie stron internetowych, pocztę elektroniczną czy usługi w „chmurze”, będą zużywać ponad dwie trzecie energii więcej niż w 2007 r. Jeden z największych takich ośrodków w Polsce – 3Services Factory Data Center – rozpoczął swoją działalność na Śląsku. Wymaga on teraz mocy 1,3 MW. Gdy zostanie oddana cała inwestycja o powierzchni 4 tys. m², zapotrzebowanie na energię wyniesie od 5 do 8 MW. Jeszcze parę lat temu byłoby to znacznie więcej, ale odkąd przemysł teleinformatyczny postawił na ekologię, udaje się obniżać zużycie prądu i emisję CO2.

Gwoli wyjaśnienia, znaczną część energii wykorzystywanej przez centrum danych pochłania zaplecze, niezbędne do prawidłowego działania serwerów. Chodzi o systemy chłodzenia, zasilania, wszelkiego rodzaju urządzenia bezpieczeństwa (np. systemy przeciwpożarowe, alarmowe). Przykładowo – koncern HP chlubi się specjalnie zaprojektowanym centrum danych w szkockiej miejscowości Wynyard. Korzysta z właściwości tamtejszego klimatu, przez co nie ma potrzeby schładzania powietrza pobieranego z zewnątrz.

Ile lat przeżyją nasze dane? Nie wiadomo. Kiepskiej jakości płyty CD lub DVD mogą być już nieczytelne po 5 latach. Trwałość taśm magnetycznych ocenia się na kilkadziesiąt lat. Zresztą samo przechowywanie danych zda się na nic bez stosownego programu komputerowego do odczytu zawartości. Czy możemy dzisiaj odczytać nasze dokumenty sprzed 20 lat napisane w edytorach TAG lub QRTekst? Czy za następne 20 lat obejrzymy film lub zdjęcia z wakacji? Wisi nad nami jak miecz Damoklesa pytanie: będziemy mieli dane, ale czy będzie można je wykorzystać?

Kilo, mega, jotta...

Uwaga: posługujemy się powszechnie wielokrotnościami kilobajtów używając jednostek dziesiętnych. Tymczasem w informatyce przedrostek kilo oznacza krotność nie 103 (1000), lecz 210 (1024). Dlatego Międzynarodowa Komisja Elektrotechniczna (IEC) proponuje zmianę w nazewnictwie, która uściśli tę różnicę – np. zamiast kilobajt – kibibajt, megabajt – mebibajt itd.

Polityka 26.2011 (2813) z dnia 20.06.2011; Nauka; s. 64
Oryginalny tytuł tekstu: "Bomba zettabajtowa"
Więcej na ten temat
Reklama

Czytaj także

Społeczeństwo

Jak rozpoznać depresję u dzieci?

Niedawno pisaliśmy o niewydolnym systemie pomocy dla najmłodszych, którzy coraz częściej zmagają się z problemami psychicznymi. Jak działać, gdy system nie działa? – pytamy Lucynę Kicińską z Fundacji Dajemy Dzieciom Siłę, koordynatorkę telefonu zaufania dla dzieci i młodzieży 116 111.

Joanna Cieśla
09.04.2019
Reklama

Ta strona do poprawnego działania wymaga włączenia mechanizmu "ciasteczek" w przeglądarce.

Powrót na stronę główną