Causa causa causa causati (la causa de la causa és la causa del fet causat), és un principi utilitzat quan es tracta d’analitzar la relació entre un acte (causa) i la conseqüència (resultat).
Cum hoc ergo propter hoc (amb això, per tant a causa d’això) és segons la wikipedia, una fal·làcia que es comet en inferir que dos o més esdeveniments estan connectats causalment perquè es donen junts, és a dir que hi ha una relació causal entre dos o més esdeveniments per haver observat una correlació estadística entre ells.
Aquests dos principis llatins ens serveixen per parlar d’una altra llei de la transformació digital, aquesta vegada vinculada amb el big data, que parla de la causalitat i la correlació i també per analitzar el significat d’un altre dels mantres que escoltarem de boca dels experts transformació digital de forma insistent correlació no significa causalitat.
Un cop deixada anar l’anterior frase, el professor ens il·lustrarà amb frases del tipus els humans estem acostumats a detectar patrons i tendències, cosa que en una època amb poca informació és relativament senzill, però no en plena era de les macrodades, ja que existeix tantíssima informació disponible que els patrons i les tendències romanen ocults als ulls de qualsevol persona, sepultats entre milions i milions de dades.
A continuació ens deixarà anar el rotllo que les empreses han acudit als ordinadors i al fenomen del big data perquè la tecnologia ens ajudi els humans a detectar aquests patrons invisibles, a posar llum en aquesta muntanya de dades, a buscar relacions entre fets aparentment inconnexos a través de la mineria de dades, per així prendre decisions que ajudin les empreses a incrementar les vendes.
I finalment el mestre entrarà a parlar-nos dels que és més interessant des del meu punt de vista, això és les diferències entre la causalitat i la correlació, que resumidament i en una definició d’anar alguna cosa per casa seria una cosa així com que no és el mateix dir que a és la causa segura de b (causalitat), que per contra dir que sembla que a i b estan relacionats (correlació).
La causalitat (el perquè de les coses) és aquella llei que estableix una relació directa entre una causa i un efecte, de manera que per arribar a aquesta conclusió certa (que a és la causa de b) cal prèviament experimentar i investigar i dedicar molt de temps i diners a validar que efectivament, hi ha una única relació directa entre aquesta causa i aquest efecte.
La causalitat -com el seu nom indica- ens ajuda a conèixer la causa de les coses, és a dir a recórrer el camí de tornada des de l’efecte produït i cap a la causa que l’ha produït, per la qual cosa si el resultat d’aquesta investigació és positiu, això ens serveix per afirmar sense cap gènere de dubtes, que a és la causa de b, ja que no hi ha una explicació alternativa.
En canvi la correlació (el què de les coses, sense importar el perquè) simplement ens adverteix que entre a i b hi ha una possible relació però no ens explica amb certesa -al contrari de la causalitat- quina és la causa concreta que produeix aquest resultat.
Per tant la correlació seria una cosa així com que el fenomen a i el fenomen b s’observen alhora, que sembla que hi ha un patró comú entre tots dos o una correlació estadística, que tots dos es mouen junts, però sense poder afirmar de manera científica que a és la causa de b, com si faríem amb el principi de causalitat.
És un mètode per tant més ràpid i barat. Per tant, la deducció a què arriba la correlació sobre la relació de la causa i l’efecte podríem dir que és feble, en el sentit que no es basa en aquest exercici científic de la causalitat que hem vist abans, sinó en un altre principi del tipus “si l’encerto, l’endevino”.
I per acabar veurem un exemple típic de la correlació que barreja bolquers i cerveses.
S’explica -sense saber-se si és veritat o es tracta d’una faula- que en una anàlisi que va fer Walmart de les seves targetes de clients creuant les dades de milions de perfils de compres, van observar un patró de comportament (correlació i no causalitat) a les compres que feien un perfil determinat de clients -homes joves- un dia en concret -els divendres tard en tornar de la feina-.
Pel que sembla els pares adquirien a la mateixa compra bolquers i cerveses, el primer per als seus fills menors i el segon per als progenitors. Amb aquests resultats es diu que Walmart va reordenar algunes prestatgeries del supermercat de tal manera que, com ja us podeu imaginar, al costat dels bolquers es van posar prestatgeries amb cerveses, de manera que va aconseguir incrementar les vendes de la beguda en qüestió de manera molt notable.
Si tornem al mantra en qüestió -la causalitat suposa correlació però la correlació no sempre suposa causalitat-, i ho posem en relació amb el cas Walmart, veiem que el supermercat no va analitzar ni investigar el perquè de la compra a tots dos productes alhora, sinó que en va tenir prou amb el què, és a dir que la compra es duia a terme pels pares els divendres tardes, exemple clar que la correlació no sempre significa causalitat.