Potencjał i ryzyko ukryte w ciemnych danych
Nasz cyfrowy wszechświat szybko rośnie. Całkowita ilość generowanych przez nas danych wzrasta szybciej, niż możemy to kontrolować, ale większość danych wciąż pozostaje nieużywana lub bezwartościowa. W perspektywie finansów przedsiębiorstwa dane oznaczają przede wszystkim koszty ich przechowywania, opisywania i analizy, a także ryzyko związane z wyciekiem danych czy nawet karami za niedostosowanie do obowiązujących przepisów.
Widzieć i wiedzieć
Był rok 1967. Nasza wiedza o Wszechświecie miała za chwilę wykonać woltę za sprawą młodej kobiety, ledwie rozpoczynającej akademicką karierę – Very Cooper Rubin. Badając charakterystykę rotacji galaktyk spiralnych, badaczka doszła do przedziwnego odkrycia.
Rozpoczęła pracę w przekonaniu, że wirujące, płaskie galaktyki będą zachowywać się podobnie jak Układ Słoneczny. Założenie bazowało na oczywistej obserwacji: masa obiektów znajdujących się w środku galaktyki spiralnej znacznie przekracza masę gwiazd, planet, pyłów i gazów położonych na krawędziach takiego dysku. W związku z tym działanie grawitacji powinno spowodować wyższą prędkość galaktyki w jej środku, a najniższą prędkość na jej zewnętrznych, lżejszych rubieżach.
Tymczasem obliczenia i pomiary dokonane przez Rubin, a także modele stworzone na podstawie obliczeń wszystkich innych wcześniejszych badaczy zaprzeczyły tej tezie. Galaktyki wirowały z tą samą prędkością w każdym jej miejscu, podważając prawa Newtonowskiej fizyki.
Wszystkie zebrane na ten temat niezależne kalkulacje nie kłamały, ale to nie mogło być możliwe! Obserwowana Galaktyka Trójkąta, żeby poruszać się tak szybko na dalekich obrzeżach, powinna mieć dodatkowy balast równy 39 mld niewidzialnych słońc ukrytych przed oczami badaczy.
Odkrycie zaszokowało astronomów, którzy, jak się okazało, badali dotychczas zaledwie widzialny skrawek kosmosu. Historia zatoczyła koło, ponieważ naukowcy ponownie nie wiedzieli więcej, niż wiedzieli na temat natury Wszechświata. Wkrótce aż 85% kosmosu uznano za uformowany z „ciemnej materii”, która składa się z cząstek nieemitujących i niewchodzących w interakcję z widzialnym promieniowaniem. Niemożliwa do oświetlenia, pozostaje dla nas niewidzialna.
Cyfrowy bezkres
Uważa się, że kosmos rozszerza się nadal z dużą prędkością, ale nasz cyfrowy wszechświat poszerza się teraz w dużo bardziej zawrotnym tempie. Aż 90% danych gromadzonych na serwerach, które posiadamy obecnie, powstało w ciągu ostatnich pięciu lat1, dane zaś, które aktualnie generujemy i kopiujemy, według obliczeń firmy konsultingowej IDC podwajają się co dwa lata.
Codziennie wszyscy dodajemy łącznie 2,5 kwintyliona (1030) bajtów danych. Każdy program komputerowy, konto pocztowe, system firmowy, aplikacja mobilna, urządzenie podłączone do Internetu, każda transakcja finansowa w sklepie i użytkownik smartfona przez cały czas generują dane. Gromadzone w trakcie zaledwie jednej godziny dane o transakcjach klientów amerykańskiej sieci handlu detalicznego Wal-Mart przekraczają o 167 razy ilość danych zebranych w amerykańskiej Bibliotece Kongresu3.
To dopiero początek. W 2012 r. badania IDC zidentyfikowały największy wzrost źródeł informacji w obszarze maszynowo generowanych danych. Dziś nawet światła drogowe produkują dane, ale dopiero tworzący się rynek Internet of Things, czyli urządzeń podłączonych do sieci, spowoduje lawinę bitów. Gartner przewiduje ogromny wzrost tej technologii, do 20,8 mld urządzeń podłączonych do sieci do 2020 r.4
Opowiedzą one historię użytkowania oświetlenia, ciepła i klimatyzacji w biurowcach i domach, zbiorą dane o wykorzystaniu pralek, będą raportować zawartości lodówek i przez 24 godziny na dobę zapisywać obraz z kamer z cyfrowego dzwonka na frontowych drzwiach.
Dane wkraczają dzięki temu w nasze prywatne życie, a firmy prześcigają się w metodach ich pozyskiwania i wykorzystania. Jaki mają w tym cel?
Wykorzystałeś swój limit bezpłatnych treści
Pozostałe 80% artykułu dostępne jest dla zalogowanych użytkowników portalu. Zaloguj się, wybierz plan abonamentowy albo kup dostęp do artykułu/dokumentu.