La sintaxi de les dades

Fa temps em van regalar un joc d’imants per a la nevera que consistia en una caixa de 510 imants, amb una paraula cada un, per poder combinar-los i fer frases i missatges a la porta de la nevera. La veritat és que, després d’unes primeres proves, el joc va quedar abandonat, perquè es trigava molt de temps a trobar la paraula desitjada per construir el missatge que un volia.

Una manera de simplificar i accelerar el procés de recerca hagués estat ficar en diferents caixes o bosses de plàstic les diferents categories de paraules-imants: articles, noms, adjectius, verbs, adverbis, preposicions, conjuncions, etc. Però, tot i així, està clar que el procés de recerca física de paraules és molt més lent que el procés mental … o que un procés digital.

Potser per això, hi havia qui renunciava a fer frases elaborades amb aquests imants i els feia servir simplement per fer la llista de la compra a la porta de la nevera, utilitzant tan sols aquelles paraules (noms) dels productes que solia comprar i col·locant-los en dos grups o columnes, a esquerra o dreta, segons hagués “reserves “a la nevera o calgués comprar-los.

Little Data, Big Data i Intel·ligència Artificial

les dades són les paraules soltes i representen la unitat bàsica d’informació. les oracions es construeixen a partir de la unió (coherent) de diverses paraules i és així com vam passar d’una informació bàsica a una informació més completa (coneixement) sobre alguna cosa o sobre algú, a l’establir diferents relacions entre aquestes paraules o dades, que no estan com “llançades a l’ aire “o juxtaposades.

El Big Data ha augmentat la possibilitat de tractar grans volums de dades i establir més relacions entre ells

Una cosa semblant passa amb el tractament informàtic de les dades. Les Bases de Dades que coneixíem i fèiem servir fins ara cabien en un full Excel ( “Little Data”) i s’ordenaven en registres (horitzontals) i camps (verticals), amb una relació entre ells de mera juxtaposició. Si imprimíssim el full Excel i agaféssim unes tisores i talléssim per les línies, tindríem una cosa semblant a el joc d’imants.

el Big Data ha augmentat la possibilitat de tractar grans volums de dades i establir més relacions entre ells (o correlacions) i, tot i que sens dubte suposa un gran pas en el tractament de la informació, obtenint “dades enriquits”, però, seguim en la fase de “balbuceig” dels nens, quan comencen a parlar i ho fan només amb paraules soltes: pare, mare, aigua, meu, no, …

La Intel·ligència Artificial permet, entre altres coses, processar, entendre ( “intelligere”) i elaborar informació en llenguatge natural. És a dir, poder passar de comunicar-nos, com els nens o com els apatxes, amb paraules soltes, a fer-ho amb oracions elaborades, en què, a la valor semàntic i morfològic de cada paraula se li afegeix el seu valor sintàctic (el lloc que ocupa en l’oració).

Hem passat d’una “web semàntica” a una “web sintàctica”, en la qual a el significat se li afegeix més informació

Així és com estem passant, a poc a poc, gairebé sense adonar-nos, en un salt d’una rellevància que potser encara no s’aprecia ni es valora prou, de la “web semàntica”, en què el important era el significat de les paraules, en si mateixes i en el seu context, a la “web sintàctica”, en la qual a el significat se li afegeix més informació, derivada de la posició i la funció de la paraula en una oració.

Aplicacions pràctiques i conseqüències jurídiques

Si, en lloc de oa part de categories morfològiques o semàntiques, fem servir categories sintàctiques per al trac ent i anàlisi de dades, convindrem que no té ni ofereix el mateix valor informatiu un “atribut”, en les oracions copulatives, que un “complement” (directe, indirecte o circumstancial), en les oracions predicatives o un complement del nom, en qualsevol tipus d’oració.

Un atribut té una relació molt intensa amb el subjecte, definint o identificant el que una persona “és” o com “està”, mentre que el que es “predica” d’algú (complements de el verb) té una relació menys intensa amb el subjecte; aporta informació complementària. Per exemple, no és el mateix dir: “Joan és espanyol” (atribut), que dir: “Joan està a Espanya” (complement circumstancial de lloc).

De la mateixa manera, com el Dret ha de respondre i aplicar-se a la realitat de les coses, no han de tenir la mateixa “intensitat de protecció” les dades que afecten l’ésser o la identitat d’algú (i al seu honor, intimitat i pròpia imatge), que altres dades que són merament complementaris o circumstancials .De fet, sempre s’han distingit dades personals especialment protegides, per la seva naturalesa, però també podria tenir-se en compte la intensitat de la relació amb el subjecte.

Portabilitat o cancel·lació?

Una altra conseqüència jurídica té a veure amb la sempiterna pregunta de qui són les dades? Perquè hi ha dades que els ciutadans aporten (omplint un formulari) i hi ha dades que les empreses elaboren, aplicant els seus algoritmes sobre aquestes dades. De qui són les dades ?: ¿de qui els aporta o de qui els treballa ?, de l’subjecte “afectat”, o de l’empresa que ha invertit recursos en elaborar-los?

Com deia en un article anterior, una cosa és ser el “propietari” de les dades i una altra, ser un “afectat” o interessat, com en el cas de les fotografies. les dades que aporten els clients són com els aliments crus de mercat o la matèria primera amb la qual un xef prepara un plat, però el producte elaborat i la recepta amb la qual s’ha fet (l’algoritme) semblen, més aviat, que són de xef.

el Reglament europeu de Protecció de Dades reconeix un nou dret dels ciutadans a la portabilitat dels “seus” dades (article 20). Però es refereix només a les dades “que hagi facilitat a un responsable de l’tractament”. Què passa amb les dades que l’empresa ha elaborat a partir d’aquells ?, se’ls ha de lliurar ?, o només els ha de cancel·lar, si així li ho demana l’afectat o interessat per aquestes dades?

què passa amb les dades que l’empresa ha elaborat? ¿els ha de cancel·lar, si ho demana l’interessat?

la meva opinió és que l’empresa no ha de lliurar a el client que vol marxar a una altra empresa les dades elaborades per ella, sinó només les facilitades en el seu moment pel client (els aliments crus o la matèria primera), perquè el contrari seria facilitar a la competència (per enginyeria inversa), el coneixement dels algoritmes utilitzats, que constitueixen un actiu estratègic de cada empresa, com són les receptes d’un xef.

Això sí, crec que, si un client vol marxar d’una empresa i emportar les seves dades, té dret que l’empresa cancel·li totes les dades que s’ha elaborat a partir dels quals ell ha facilitat, tant a través dels formularis com de la tecnologia que l’empresa ha posat a la seva disposició, per prestar-seus serveis (per exemple, les dades que els bancs o asseguradores recopilen a través dels seus targetes).

Borja Adsuara és professor, advocat, consultor i expert en dret i estratègia digital.

Deixa un comentari

L'adreça electrònica no es publicarà. Els camps necessaris estan marcats amb *