Causa causae causa causati (la causa de la causa es la causa de lo causado), es un principio utilizado cuando se trata de analizar la relación entre un acto (causa) y la consecuencia (resultado).

Cum hoc ergo propter hoc (con esto, por tanto a causa de esto) es según la wikipedia, una falacia que se comete al inferir que dos o más eventos están conectados causalmente porque se dan juntos, es decir que existe una relación causal entre dos o más eventos por haberse observado una correlación estadística entre ellos.

Estos dos latinajos nos sirven para hablar de otra ley de la transformación digital, esta vez vinculada con el big data, que habla de la causalidad y la correlación y también para analizar el significado de otro de los mantras que escucharemos de boca de los expertos en transformación digital de forma machacona:

“correlación no significa causalidad”.

Una vez soltada la anterior frase, el profesor nos ilustrará con frases del tipo los humanos estamos acostumbrados a detectar patrones y tendencias, lo que en una época con poca información es relativamente sencillo, pero no en plena era de los macrodatos, ya que existe tantísima información disponible que los patrones y las tendencias permanecen ocultos a los ojos de cualquier persona, sepultados entre millones y millones de datos.

A continuación nos soltará el rollo que las empresas han acudido a los ordenadores y al fenómeno del big data para que la tecnología nos ayude a los humanos a detectar esos patrones invisibles, a poner luz en esa montaña de datos, a buscar relaciones entre hechos aparentemente inconexos a través de la minería de datos, para así tomar decisiones que ayuden a las empresas a incrementar las ventas.

Y finalmente el maestro entrará a hablarnos de los que es más interesante desde mi punto de vista, esto es las diferencias entre la causalidad y la correlación, que resumidamente y en una definición de ir algo por casa seria algo así como que no es lo mismo decir que a es la causa segura de b (causalidad), que por el contrario decir que parece que a y b están relacionados (correlación).

La causalidad (el porqué de la cosas) es aquella ley que establece una relación directa entre una causa y un efecto, de tal manera que para llegar a esa conclusión cierta (que a es la causa de b) es necesario previamente experimentar e investigar y dedicar mucho tiempo y dinero a validar que efectivamente, existe una única relación directa entre esa causa y ese efecto.

La causalidad -como su nombre indica-, nos ayuda a conocer la causa de las cosas, es decir a recorrer el camino de vuelta desde el efecto producido y hacia la causa que lo ha producido, por lo que si el resultado de esa investigación es positivo, ello nos sirve para afirmar sin ningún genero de dudas, que a es la causa de b, ya que no existe una explicación alternativa.

En cambio la correlación (el qué de las cosas, sin importar el porqué) simplemente nos advierte que entre a y b existe una posible relación pero no nos explica a ciencia cierta -al contrario de la causalidad- cual es la causa concreta que produce ese resultado.

Por tanto la correlación sería algo así como que el fenómeno a y el fenómeno b se observan al mismo tiempo, que parece que existe un patrón común entre ambos o una correlación estadística, que los dos se mueven juntos, pero sin poder afirmar de manera científica que a es la causa de b, como si haríamos con el principio de causalidad.

Es un metodo por tanto mas rápido y barato.

Por tanto, la deducción a la que llega la correlación sobre la relación de la causa y el efecto podríamos decir que es débil, en el sentido que no se basa en ese ejercicio científico de la causalidad que hemos visto antes, sino en otro principio del tipo “si la acierto, la adivino”.

Y para finalizar veremos un ejemplo típico de la correlación que mezcla pañales y cervezas.

Se explica -sin saberse si es verdad o se trata de una fábula- que en un análisis que hizo Walmart de sus tarjetas de clientes cruzando los datos de millones de perfiles de compras, observaron un patrón de comportamiento (correlación y no causalidad) en las compras que hacían un perfil determinado de clientes -hombres jóvenes- un día en concreto -los viernes tarde al volver del trabajo-.

Al parecer los padres adquirían en la misma compra pañales y cervezas, lo primero para sus hijos menores y lo segundo para los progenitores.

Con esos resultados se dice que Walmart reordenó algunas estanterías del supermercado de tal manera que, como ya os podéis imaginar, al lado de los pañales se pusieron estanterías con cervezas, con lo que consiguió incrementar las ventas de la bebida en cuestión de manera muy notable.

Si volvemos al mantra en cuestión -la causalidad supone correlación pero la correlación no siempre supone causalidad-, y lo ponemos en relación con el caso Walmart, vemos que el supermercado no analizó ni investigó el porqué de la compra de ambos productos a la vez, sino que tuvo suficiente con el qué, es decir que la compra se llevaba a cabo por los padres los viernes tardes, ejemplo claro que la correlación no siempre significa causalidad.