El 28 de gener es va obrir a la signatura el conveni 108 de 1981 del Consell d’Europa, el primer instrument internacional jurídicament vinculant que regula el dret a la protecció de dades, motiu pel qual cada any el dia 28 de gener se celebra el dia internacional de la protecció de dades a tot el món.

Les dades en general són una matèria primera de gran valor econòmic i clau per a qualsevol negoci, ja que permeten crear una nova forma de valor -la coneguda com a economia de les dades- de la qual són exemple les anomenades GAFA -Google, Apple, Facebook i Amazon- que basen el seu model de negoci a l’explotació de les nostres dades personals en un entorn de plataforma digital.

El big data –o dades massives– es refereix al procediment creat per aprofitar aquestes dades que generem les empreses consistent en l’anàlisi de grans volums de dades que sovint es capten a temps real en una gran varietat de formats.

L’objectiu final és l’extracció de coneixement per a la presa de decisions a partir de la detecció de patrons, tendències o correlacions, descobrint coneixement ocult dins d’un gran volum de dades –el cas Walmart, amb els bolquers i la cervesa n’és un exemple conegut-, cosa que suposa començar a deixar de banda la intuïció i l’experiència com a úniques eines per prendre decisions -utensilis adequats només per a un món amb poques. dades-però insuficients per a l’economia digital basada en el big data.

És per això que la normativa de protecció de dades és necessària en tot procés de big data, si partim que moltes de les coses que succeeixen a la nostra vida quotidiana deixen un rastre en forma de dada personal, que escaparia al nostre control com a ciutadans si no existís aquesta normativa -el reglament 2016/679 i la llei 3/2018-, les agències o autoritats de protecció de dades i la figura clau del delegat de protecció de dades.

Les empreses volen conèixer millor els nostres gustos i interessos, adequar els seus productes i ofertes als nostres patrons de consum i adaptar així les campanyes de màrqueting, encara que hi ha casos on l’anàlisi de les dades de consum a la web d’un supermercat porten a conseqüències diguem-ne “ imprevistes” a l’àmbit familiar com el que va passar a la cadena target dels EUA.

És el curiós cas d’una adolescent que estava embarassada sense que el seu pare ho conegués, i que a causa dels patrons de recerca que la futura mare havia generat al portal del supermercat -bolquers, biberons i xumets-, aquest establiment havia deduït que aquella clienta estava embarassada.

El supermercat va enviar ràpidament a casa de la menor cupons de descompte per a productes per a criatures i quan el pare els va veure, es va presentar fet una fera al supermercat demanant explicacions de la raó per la qual enviaven aquesta informació a una menor d’edat.

La història acaba amb una segona visita del pare al supermercat sol·licitat disculpes, ja que es veu que l´únic membre de la família que desconeixia que la seva filla estava embarassada era ell, el pare.

L’any 2006 Netflix va anunciar un premi d’1 milió de dòlars per a aquelles propostes que milloressin el seu algorisme de cerca en un 10%.

El nom del concurs era Netflix Prize.

Perquè això fos tècnicament possible, Netflix va decidir compartir sense coneixement dels seus clients, 100 milions de classificacions de pel·lícules de gairebé 500.000 subscriptors, dades que eren –teòricament– anònimes ja que amb elles no podia identificar-se cap client de Netflix.

Aquest historial de lloguer dels clients consistia en informació tal com la data, la qualificació i els comentaris a les pel·lícules de Netflix, informació que seria suficient perquè els concursants del concurs fessin la proposta de millora de l’algorisme.

Però el cert és que va passar una cosa inesperada.

Unes setmanes després de l’inici del concurs, Arvind Narayanan i Vitaly Shmatikov, investigadors de la Universitat de Texas a Austin, van poder reidentificar alguns dels clients anònims de Netflix.

La pregunta és i com va ser possible si les dades de Netflix eren anònimes?

L’estratègia dels investigadors va ser comparar dues fonts d’informació diferents, d’una banda les classificacions anònimes de Netflix i de l’altra les classificacions públiques a Internet Movie Database (IMDb), portal d’internet que emmagatzema i comparteix informació sobre pel·lícules i on els usuaris es registren i identifiquen.

Així creuant informació dels dos portals, va ser com van localitzar diversos perfils anònims de Netflix que coincidien a la perfecció amb els d’IMDb, resultant que en alguns casos els perfils en ambdós portals eren de la mateixa persona.

Encara que pugui semblar que la llista de les pel·lícules que visualitza un client no és matèria sensible, una usuària de Netflix les dades del qual s’havien utilitzat en el projecte Netflix Prize va demanar a la companyia, ja que estava entre les persones reidentificades.

La clienta en qüestió era una mare lesbiana que no havia compartit amb ningú -ni amb els seus fills- la seva orientació sexual, per la qual cosa el resultat del projecte clarament la perjudicada en treure a la llum una informació que ella havia guardat gelosament.

La qüestió a debatre és si l’empresa hauria d’haver sabut que era possible reidentificar els clients amb dades anònimes i, per això, hagués hagut d’aplicar mesures addicionals de seguretat o simplement no llançar el projecte.

Ramon Arnó va participar amb una xerrada titulada Vols vendre per internet? Aprèn com posar el teu negoci online.

El dia 10-11-2013 al Centre de Cultures i Cooperació Transfronterera, Campus de Cappont, Lleida