lunedì 13 maggio 2013

Privacy - 4: Il 'percorso euristico'

Ci tengo a precisare che è un termine di mia invenzione, senza pretese di correttezza tecnica; ritengo (altrimenti non starei qui a sciorinarlo XD) che sia però quanto in pratica viene applicato ai fini della stima del privato.


Appunti precedenti:
  1. Analisi dei dati
  2. Alcuni 'perchè'
  3. La statistica
Utente: fruitore del servizio (web, internet, connessione, ecc...)
Agente: colui che "spia"; persona fisica, software, azienda, ecc...
Percorso euristico: schema di correlazione tra i dati privati dell'utente
Stima del privato: catalogazione ed ordinamento dei dati dell'utente, basata sul percorso euristico, ai fin di determinare una stima quanto più possibile precisa sugli orientamenti dell'utente stesso
Profilo: schema (parzialmente pre-impostato) al quale far coincidere l'utente soggetto, in base alla 'stima del privato'; il profilo "cataloga" l'utente in modo da fornire una risposta automatica, ma altresì il più possibile veritiera, alle domande di volta in volta postegli: cosa desidera comprare, dove preferisce passare il tempo libero, quali interessi lo avvicinano ad un'area commerciale, ecc...
  • Lo schema 
Lo schema che presento è sicuramente incompleto ed approssimativo - nonchè imbarazzante dal punto di vista grafico - ma vuole solo rendere un'idea del discorso che vado a fare.


SUDDIVISIONE
  • Contesto
    • interna : dati conservati in locale
    • esterna : dati trasmessi e/o conservati in remoto
  • Sostanza
    • reale   : identità reale
    • virtuale: identità/attività virtuale

DATI
  • Anagrafici (1)
  • Finanziari
    • rendite (2)
    • possedimenti (1)
    • investimenti (3) (4)
  • Esperienziali
    • forti     
    • deboli

DATI ESPERIENZIALI
  • Forti
    • privati    
      • famiglia (1)
      • amore (1) (2) (3) (4)
      • amici (1) (4)
    • lavorativi (2) (3) (4)
  • Deboli     
    • attività (1) (2) (3) (4)
    • commerciali
      • acquisti (2) (3)
      • gusti (1) (4)
      • esigenze (1) (2) (3) (4)
      • budget (1) (2) (3)
    • di opinione 
      • politici (1) (2) (4)
      • religiosi (1) (4)
      • sociali (1) (2) (3) (4)

Possiamo vedere che si parte essenzialmente da una classificazione qualitativa dei dati: vengono separati in generi (anagrafici, finanziari, ecc...), classi (rendite, possedimenti, ecc...) e poi alcuni in sottoclassi (privati, lavorativi, ecc...) e ancora in tipi (acquisti, gusti, esigenze, ecc...).
Accanto ad ogni dato, sui diversi livelli, appare un numero di correlazione, che è poi la 'linea base' del percorso euristico. Questi numeri indicano quali dati ne "richiamano" altri, proprio come le note in un testo. Ma, a differenza di queste, non hanno un "senso" di lettura, in quanto, per esempio, il numero '1' è leggibile come: 'dati anagrafici da cui si ricavano dati familiari'; ma anche come: 'dati delle amicizie da cui si risale a quelli anagrafici'.


  • Il metodo (a grandi linee)
Come vedete i termini 'ricavare' e 'risalire' acquistano quindi precisi significati, ma la relazione è biunivoca; ed è complessa (nel significato già visto, di più livelli), infatti si parla di correlazione.

Se quindi un agente entrasse in possesso di alcuni dati anagrafici, potrebbe tentare (con l'aiuto della statistica, come si è detto la scorsa volta) di ricavare quelli familiari; per esempio, incrociando luoghi lavorativi e di frequentazione con dati statistici sulle frequentazioni del luogo, ecc...
Se entrasse prima in possesso di quelli delle amicizie - e questo è davvero l'esempio tipico dei dati in cui entrano in possesso regolarmente gli agenti più diffusi in assoluto, quelli commerciali, attraverso le piattaforme sociali, come Facebook - dovrebbe allo stesso modo usare tabelle statistiche e l'insieme dei dati a sua disposizione per poter risalire a quelli anagrafici (probabili perlomeno).

Anche se, in pratica, il lavoro è quasi lo stesso, sia che si vada "verso il basso" che "verso l'alto", la differenziazione sta nel fatto che i dati più sensibilli sono quelli in alto. E, non a caso e per fortuna degli utenti, sono anche quelli meno accessibili.
Se ci fate caso, infatti, pur essendo la qualità del lavoro necessario la stessa - fondamentalmente quella illustrata fin'ora: spiare ed incrociare i dati ricavati con quelli statistici - diventa diversa la quantità di questo lavoro. "Scendere" richiede molto meno lavoro (e quindi molti meno dati) che non "salire" sullo schema.

Prendiamo quindi una prima visione del come la quantità dei dati possa trasformarsi, attraverso appunto il 'percorso euristico', in qualità...


  • La compilazione
Allora appare chiaro come, andando a compilare uno schema simile a quello proposto con dati acquisiti e certi - per esempio attraverso le amicizie facebook, i dati anagrafici lì presenti, i like a pagine di prodotti commerciali, come anche a quelle di gruppi politici o religiosi - si ottiene una base di correlazione già piuttosto ampia. Si possono già stabilire percorsi confermati, che indicano una strada, o perlomeno una tendenza, che a sua volta consente di ipotizzare altri dati e ulteriori relazioni; e così via. Se l'osservazione sull'utente si estende abbastanza nel tempo, la conferma o smentita dei percorsi e delle relazioni ipotizzate saranno un aiuto fondamentale per la stima di altri dati e relazioni, stima sempre più accurata. Come detto sopra, i punti focali al momento non disponibili come dato certo, si potranno sostituire delle ipotesi statistiche.

Fate caso che ho parlato di 'osservazione sull'utente' ma attenzione a non farsi fuorviare da quest'espressione. Detta così è facile pensare ad una spia dedicata, che si fissi su un singolo cittadino e lo osservi ininterrottamente. Ovviamente non è questo il caso e un comportamento di questo tipo si verifica solo in casi di carattere giudiziario... credo :P


  • Gruppi di osservazione
Di solito l'osservazione dell'utente è contestualizzata in un blocco, un gruppo di utenti che per qualche ragione vengono "monitorati" con determinati criteri.
I "confini" di questo blocco stabiliscono come scegliere i candidati e ovviamente sono dipendenti dallo scopo finale. Per esempio, se lo scopo è vendere un prodotto sportivo per la pesca, l'agente creerà dei blocchi di osservazione con utenti iscritti ai forum di pesca.

Ovviamente ho banalizzato molto, ma il concetto è questo.

Anche questo passaggio ha una sua importanza a proposito della prospettiva delle ricerche in questa "materia".
Infatti il meccanismo dei gruppi di 'osservazione' che ho qui ipotizzato è di fatto l'unico possibile in un "universo digitale" con milioni di utenti e centinaia (almeno) di siti che li raccolgono. Non sarebbe pensabile, e nemmeno sensato, di monitorarne uno per uno. O meglio, non in tutte le fasi della ricerca; prima è necessario scandagliare il web alla ricerca di macro-gruppi che si prestano agli interessi dell'agente. I quali verranno a loro volta scandagliati per affinare la ricerca, in un processo iterativo che porti poi a quei nomi che interessano realmente.

Ma tutto ciò evidenzia come il meccanismo stesso favorisca le grandi aziende e i giganteschi monopoli delle multinazionali. Infatti un'azienda che si occupi di più settori potrà utilizzare i risultati delle varie scansioni per iniziarne altre, inerenti ad altri prodotti, già da una fase meno "grezza" rispetto alla prima ricerca, in quanto già effettuata una prima scrematura.
Ovviamente questo non avrebbe senso per un'aziendina che produce canne da pesca: una volta appurato che ad un certo gruppo non interessa nulla della pesca, quel blocco di ricerca è concluso e inutilizzabile.
Se invece si parla di una multinazionale che produce cibo per animali, tanto quanto prodotti per l'agricoltura piuttosto che attrezzature sportive (sto sparando, ma non è che sia impossibile), allora ecco che quello che viene scartato da una parte funzina bene per l'altra.

Infine, il meccanismo stesso per sua natura è molto lento a partire, ma poi, mano a mano che procede, sempre più rapido.
Anche questa caratteristica favorisce le grandi aziende, perchè queste hanno sia più mezzi - che possono assorbire l'impatto iniziale e anche diluirlo maggiormente - che più tempo a disposizione. Così potranno stabilire criteri di ricerca più precisi, mirati ma, allo stesso tempo, molto più massificati: quello che l'aziendina può stabilire in un blocco di poche centinaia di campioni (=utenti), la grande azienda lo farà per migliaia o anche decine di migliaia.


  • La violazione "consapevole"
Da quanto detto fino ad ora dovrebbe apparire chiaro un concetto: attraverso diversi stratagemmi, gli agenti sono in grado di ricostruire una stima del privato anche molto attendibile, solo attraverso dati ed informazioni che è l'utente stesso a fornire!

Altra caratteristica tipica dell'eurismo è quella di avere una buona parte di empirismo.
In un'osservazione a medio-lungo termine si possono "mettere alla prova" le ipotesi, per esempio, sui gusti e le abitudini dell'utente. Proponendo di volta in volta prodotti specifici di una certa tendenza ipotizzata, ed osservando i riscontri (banalmente: l'utente compra o no ciò che gli viene proposto?), l'agente è in grado di ottenere dati a duplice risvolto:
  1. compila il profilo privato dell'utente in modo sempre più mirato
  2. può farcire le tabelle statistiche di ulteriori nuovi dati, che potranno essere utilizzati nelle profilazioni successive.

Nessun commento:

Posta un commento