BIG DATA. A Revolution That Will Transform How We Live | K. Cukier, V. Mayer-Schönberger

BIG DATA. A Revolution That Will Transform How We Live | K. Cukier, V. Mayer-Schönberger

BIG DATA. A Revolution That Will Transform How We Live, Work and Think

9 lat. Tyle czasu minęło od wydania książki BIG DATA A Revolution That Will Transform How We Live, Work and Think. Książka ta miała za zadanie przybliżyć “najgorętszy” trend czasów – wykorzystywanie dużych zbiorów danych, tzw. big data, do kreowania insightów konsumenckich.

Dziewięć lat to kupa czasu, szczególnie dla szybko rozwijającej się technologii. Zresztą już pierwsze zdania tej książki przypominają, że wiele się w tych latach wydarzyło. Autorzy wspominają w nich 2009 rok i epidemię świńskiej grypy. Cukier i Mayer-Schönberger piszą, że big data ułatwiały wtedy lokalizowanie centrów zakażeń poprzez analizę wyszukiwań w Google fraz związanych z objawami i nanoszenie ich na mapy. Piszą też, że w razie kolejnej epidemii, możliwości analizy danych będą jeszcze większe.

Dzisiaj, w 2022 roku, wiadomo już, że częściowo mieli rację. Pandemia Covid-19 udowodniła, że big data może o wiele więcej i inaczej, niż w 2009 roku. Ale nie sprawdziły się ich teorie, że ta wiedza zapobiegnie jej rozprzestrzenianiu. Ludzie są tylko ludźmi.

9 lat to wieki

Książka Big Data została wydana w 2013 roku i generalnie słabo się zestarzała, ale jest w niej kilka ciekawych informacji. Np. historie o pierwszych wielkich zbiorach danych – spisach ludności i tym, jak sobie z nimi radzono. Generalnie nie radzono. Analiza informacji trwała po 10 lat i więcej. Dopiero wprowadzenie pierwszych kalkulatorów pomogło i obniżyło czas do 5 lat. 

Ale nie samo radzenie sobie z przetwarzaniem informacjami było i jest najważniejsze, a ich ocena. Dlatego sporo jest też ciekawostek na temat statystyki i grup reprezentatywnych, na podstawie których można było wyciągać trafne wnioski z niewielkim błędem. 

Po co więc zbierać big data, skoro wystarczy przebadać grupę reprezentatywną i użyć statystyki? Autorzy przekonują, że dzięki temu obraz staje się bardziej pogłębiony i widać w nim więcej szczegółów.

Zresztą jest wiele innych “zdobyczy”, które były możliwe dzięki big data i machine learning, np. translatory, czy analizatory stylistyczne jak w wordzie, czy dokumentach Google. 

Mess in mess out

Znam zasadę „mess in mess out” i sądziłam, że dotyczy to także big data. Okazuje się jednak, że jest to błędne podejście w przypadku dużych zbiorów danych. Specjaliści uznali, ze „messiness” jest nie tylko nieuniknione, ale także niezbędne.

Bo świat jest nieidealny i dzięki przyjęciu tej niedoskonałości o wiele lepiej go rozumiemy. Nawet jeśli mamy pewien % niedokładności, to on nie wpływa na poprawność insightów. Oraz ta nieidealność danych może być zarządzana, jeśli się ją właściwie zaplanuje. 

Korelacja a nie przyczynowość

Autorzy tłumaczą też, że big data może powiedzieć co, ale nie powie dlaczego, ale to i tak będzie wystarczające. Nie będziemy potrzebowali wiedzieć, jak coś działa, bo będziemy wiedzieli, że działa.

Sugerują, że kończy się era stawiania hipotez i ich obalania, a zaczyna epoka, gdzie teorie nie będą już potrzebne, bo danych będzie ich tak dużo, że będą mówić same za siebie. Przekonują też, że do działania i podejmowania decyzji wystarczy wiedza o korelacjach, szukanie przyczynowości nie będzie już potrzebne. Choć co do tego sami chyba nie są przekonani, bo później z kolei piszą, że stawianie hipotez leży w naturze człowieka.

Przeszłość o przyszłości

Książka przewiduje też pewne trendy, np. zauważa ruchy antyszczepionkowe, czy wykorzystanie danych do personalizacji i różnych funkcji (np. ustawienia fotela w aucie do systemów antykradzieżowych).

Autorzy wyjaśniają też datafikację, czyli proces przerabiania informacji na dane, które później można wykorzystać do wyciągania wniosków. Jarają się także ilością danych kwantyfikowalnych z Facebooka. Nie wiedzą jeszcze o Cambridge Analytica. Książka została napisana także przed RODO, które m.in. zabrania zbierać dane „na wszelki wypadek”. Przynajmniej w teorii. 

Big data w 2013 roku

Trochę mnie irytował amerykański styl narracji, np. powtarzanie po kilka razy tych samych informacji, żeby na pewno każdy zrozumiał końcowe wnioski. Momentami też przysypiałam. Czytałam tę książkę po angielsku, do tego styl autorów nie ułatwiał zadania. Długie zdania i dużo technikaliów wpłynęły na ogólne znużenie. 

Męczyło mnie też czytanie o czymś, co dla mnie już się wydarzyło, a autorzy dopiero to wtedy odkrywali, np. gdy opisują rynkową wartość Facebooka i informacji. Tymczasem w 2022, FB już czasy świetności ma za sobą, a jakieś inne wymienione startupy, należą już do „zamierzchłej” przeszłości i dzisiaj w większości już nikt o nich nie pamięta.

Autorzy przytaczają też case sieci Target z 2011 roku, o nastolatce w ciąży, której ojciec robi aferę o newslettery. Tymczasem ta opowiedziana przez Duhigga historia nie jest prawdziwa. Reporter wymyślił ją na potrzeby wyjaśnienia, jak działa big data. Natomiast autorzy tej książki chyba o tym nie wiedzą. 

Odkrycie czy zagrożenie

Niby na końcu jest rozdział o zagrożeniach i ryzykach płynących z big data, to jednak mam wrażenie, że autorzy podchodzili do tego zbyt lekko. Piszą np. że “no są zagrożenia, ale za to będziemy mogli zmniejszać przestepczność”. Albo, że “no ok, im więcej i danych tym większe możliwości deanimizacji, ale nie ma się o co ciskać, bo w sumie to te dane i tak już ktoś zebrał, zapisał oraz skwantyfikował i pewnie ich kiedyś użyje”, więc w sumie to jakby się już wydarzyło. Nie podoba mi się takie podejście.  

BIG DATA. A Revolution That Will Transform How We Live, Work and Think

Autorzy podkreślali aspekty, które na razie okazały się nie do końca prawdziwe. Np. wielokrotnie wspominają o tym, że na ocenę ludzi będą wpływać prognozy zachowania, a nie ich faktyczne czyny. O ile się orientuję, to systemy tak nie działają.

Książka Cukiera i Mayer-Schönbergera niewątpliwie zawiera kilka ciekawych informacji. Niestety z dzisiejszej perspektywy wydaje się ona boleśnie niewystarczająca. Okazuje się, że książki o technologii bardzo szybko (i źle) się starzeją. Myślę, że jeśli ktoś interesuje się tą tematyką, to powinien sięgnąć po coś w tym temacie, co zostało napisane relatywnie niedawno.


Może Cię także zainteresować: Wiek paradoksów | Hello World


Tytuł recenzji: Co mówią nam dane?
Subiektywna ocena: 6/10
Tytuł oryginału: BIG DATA. A Revolution That Will Transform How We Live, Work and Think
Autorzy: Kenneth Cukier, Viktor Mayer-Schönberger
Wydawnictwo: John Murray Publishers
Data wydania: 2013
ISBN: 9781848547926
Liczba stron: 242