dades massives

26 Agost, 2019

Big data: la intel·ligència de les dades

Més de 7.400 milions d'habitants compartim el planeta Terra, i més de la meitat (4.388 milions) ens connectem a Internet. Per exemple tu, que estàs llegint aquest article. D'aquests, més de la meitat (3.986 milions) s'hi connecta a través de smartphones. Són les últimes dades de l'informe Global Digital 2019 Report que han presentat We Are Social i Hootsuite, on també es mostra l'evolució creixent i constant, la qual en aquest últim any ha representat un creixement del 9,1%. I seguim amb més xifres increïbles. Segons l'estudi elaborat per Digital Information World, en cada minut de 2018 es van enviar 18 milions de missatges a través de WhatsApp, es van publicar 481.000 tuits i es van fer 3,7 milions de cerques a Google. A més, en 60 segons es van veure 4,3 milions de vídeos a YouTube i els usuaris de Netflix van visualitzar 266.000 hores de continguts. Et sonen aquests serveis? N’has utilitzat algun durant els últims dies? Potser... tots? És il·lustratiu recordar l'exemple que la ràdio va tardar ni més ni menys que 38 anys a assolir 50 milions d'usuaris a tot el món. La televisió, en canvi, només va tardar 13 anys. Internet, amb prou feines 4. L'iPod, 3, i Facebook, 2 anys. Facebook té avui no 50, sinó 2.271 milions d'usuaris a tot el món, més que els habitants del país més poblat, la Xina. I tots ells cedeixen les seves dades. I és que estem vivint una època marcada per la revolució de les dades massives, que nosaltres cedim, de forma més o menys voluntària, a canvi de la suposada gratuïtat dels serveis. Però totes aquestes dades i metadades que pugem a la xarxa no servirien de gaire si no s'emmagatzemessin, classifiquessin i analitzessin. I és la disciplina que s'encarrega d'aquest procés la que rep el nom d' intel·ligència de dades o big data. A partir d'aquestes dades (o macrodades) podem generar coneixement, productes i serveis. Aquestes dades permeten, per exemple, predir el temps, analitzar paràmetres de salut, millorar l'eficiència energètica o vendre més i millor. I és que la intel·ligència de dades es troba en tots els serveis esmentats abans. Per exemple, si t'equivoques en escriure una paraula a Google, aquest la corregeix; Amazon, Netflix o Spotify ens mostren productes que ens poden interessar i Facebook ens suggereix amistats amb gent que és probable que coneguem. En tots aquests casos, s'està utilitzant el big data.Les quatre «ves baixes» Quines són les característiques principals del big data? Es podrien resumir en les quatre «ves baixes»: volum, velocitat, varietat i veracitat. És a dir, gestió d'un gran volum de dades, a la major velocitat possible, emmagatzemades al costat d'una extensa varietat d'informació, que ha d'estar constantment verificada. Volum: «les dades mai no dormen», se sol dir. I és veritat: el creixement de les dades és constant, es dobla cada 40 mesos. Això significa que es generen més dades en un sol dia dels que han existit en els últims 20 anys. Velocitat: la informació es processa tan ràpid que podem conèixer dades del present immediat i consultar què és el que està passant al món ara mateix. Això permet fer anàlisis molt detallades –i força complexes– que freqüentment s'integren en altres processos de treball i sistemes. Varietat: hi ha dades de molts formats i tipologies, segons la seva procedència. Es podrien classificar en: dades públiques (les que posseeixen les administracions públiques, per exemple, sobre transport, ús d'energia, sanitat, etc.); dades privades (derivades de transaccions comercials, de la navegació web, de la telefonia mòbil, etc.); dades comunitàries (produïdes principalment a les xarxes socials i generades per l'usuari); i finalment, dades quantified self (proporcionades per les mateixes persones que mesuren i quantifiquen els seus comportaments i accions: per exemple, les pulsacions durant la realització d'exercici físic que registren els wearables). Veracitat: les dades obtingudes han de ser fiables, íntegres i autèntiques, per la qual cosa serà necessari confirmar la seva veracitat. Això dependrà de les fonts i els recursos que hàgim usat per obtenir-les. Afinar la «intel·ligència» d'aquest gran volum de dades, encara que siguin veloces, variades i, amb sort, veraces, segueix sent el gran repte pendent.

INNOVACIÓ