Los humanos estamos acostumbrados a detectar patrones y tendencias, lo que en una época con poca información es relativamente sencillo. Ahora bien, ello no es posible en plena era de los macrodatos, ya que existe tantísima información disponible que los patrones y las tendencias permanecen ocultos a los ojos de cualquier persona, sepultados entre millones y millones de datos.

Las empresas han acudido a los ordenadores y al fenómeno del big data para que la tecnología nos ayude a los humanos a detectar esos patrones invisibles, a poner luz en esa montaña de datos, a buscar relaciones entre hechos aparentemente inconexos a través de la minería de datos, para así tomar decisiones que ayuden a las empresas por ejemplo a incrementar las ventas.

Y es interesante aquí introducir un concepto muy utilizado en el entorno del big data y que es que la correlación no significa causalidad. Las diferencias entre la causalidad y la correlación sería algo parecido a decir:

a.- no es lo mismo afirmar que a es la causa segura de b (causalidad),

b.- que señalar que parece que a y b están relacionados (correlación).

La causalidad (el porqué de la cosas) es aquella ley que establece una relación directa entre una causa y un efecto, de tal manera que para llegar a esa conclusión cierta (que a es la causa de b) es necesario previamente experimentar, investigar y dedicar mucho tiempo y dinero a validar que efectivamente, existe una única relación directa entre esa causa y ese efecto.

La causalidad -como su nombre indica-, nos ayuda a conocer la causa de las cosas, es decir a recorrer el camino de vuelta desde el efecto producido y hacia la causa que lo ha producido, por lo que si el resultado de esa investigación es positivo, ello nos sirve para afirmar sin ningún género de dudas, que a es la causa de b, ya que no existe una explicación alternativa.

En cambio la correlación (el qué de las cosas, sin importar el porqué) simplemente nos advierte que entre a y b existe una posible relación pero no nos explica a ciencia cierta -al contrario de la causalidad- cual es la causa concreta que produce ese resultado.

Por tanto la correlación sería algo así como que el fenómeno a y el fenómeno b se observan al mismo tiempo, que parece que existe un patrón común entre ambos o una correlación estadística, que los dos se mueven juntos, pero sin poder afirmar de manera científica que a es la causa de b, como si haríamos con el principio de causalidad.

La correlación es un método por tanto más rápido y barato y por tanto, la deducción a la que llega la correlación sobre la relación de la causa y el efecto podríamos decir que es débil, en el sentido que no se basa en ese ejercicio científico de la causalidad que hemos visto antes, sino en otro principio del tipo “si la acierto, la adivino”.