Els humans estem acostumats a detectar patrons i tendències, cosa que en una època amb poca informació és relativament senzill.
Ara bé, això no és possible en plena era de les macrodades, ja que hi ha tantíssima informació disponible que els patrons i les tendències romanen ocults als ulls de qualsevol persona, sepultats entre milions i milions de dades.
Les empreses han acudit als ordinadors i al fenomen del big data perquè la tecnologia ens ajudi els humans a detectar aquests patrons invisibles, a posar llum en aquesta muntanya de dades, a buscar relacions entre fets aparentment inconnexos a través de la mineria de dades, per així prendre decisions que ajudin les empreses per exemple a incrementar les vendes.
I és interessant aquí introduir un concepte molt utilitzat a l’entorn del big data i que és que la correlació no significa causalitat.
Les diferències entre la causalitat i la correlació seria una cosa semblant a dir:
a.- no és el mateix afirmar que a és la causa segura de b (causalitat),
b.- que assenyalar que sembla que a i b estan relacionats (correlació).
La causalitat (el perquè de les coses) és aquella llei que estableix una relació directa entre una causa i un efecte, de manera que per arribar a aquesta conclusió certa (que a és la causa de b) cal prèviament experimentar, investigar i dedicar molt de temps i diners a validar que efectivament, hi ha una única relació directa entre aquesta causa i aquest efecte.
La causalitat -com el seu nom indica- ens ajuda a conèixer la causa de les coses, és a dir, a recórrer el camí de tornada des de l’efecte produït i cap a la causa que l’ha produït, per la qual cosa si el resultat d’aquesta investigació és positiu, això ens serveix per afirmar sense cap mena de dubte, que a és la causa de b, ja que no hi ha una explicació alternativa.
En canvi la correlació (el què de les coses, sense importar el perquè) simplement ens adverteix que entre a i b hi ha una possible relació però no ens explica amb certesa -al contrari de la causalitat- quina és la causa concreta que produeix aquest resultat.
Per tant la correlació seria una cosa així com que el fenomen a i el fenomen b s’observen alhora, que sembla que hi ha un patró comú entre tots dos o una correlació estadística, que tots dos es mouen junts, però sense poder afirmar de manera científica que a és la causa de b, com si faríem amb el principi de causalitat.
La correlació és un mètode per tant més ràpid i barat i per tant, la deducció a què arriba la correlació sobre la relació de la causa i l’efecte podríem dir que és feble, en el sentit que no es basa en aquest exercici científic de la causalitat que hem vist abans, sinó en un altre principi del tipus “si l’encerto, l’endevino”.