Chi è Cambridge Analytica e come usa le tracce digitali dei cittadini online

11 min lettura

La maggior parte dei nostri comportamenti, sia online che offline, lascia dietro di sé delle tracce digitali. Da esempi più ovvi, come la ricerca di un paio di scarpe su Google al numero di passi giornalieri calcolati dal nostro smartphone, nessun dato viene perduto e tutto viene archiviato. L’incrocio di dati provenienti da una molteplicità di fonti e utenti viene definito “big data”.

Nella nostra quotidianità, ci capita spesso di imbatterci in banner pubblicitari di siti che abbiamo visitato e, ai nostri occhi, questa tecnica di marketing è diventata piuttosto prevedibile. Ora, però, grazie a un promettente psicometrista polacco di nome Michal Kosinski, l’utilizzo dei big data consente di raccogliere informazioni decisamente più private, con la rapidità di pochi click, sugli abitanti di un’intera nazione.

Per comprendere però nel dettaglio come funziona questo processo, è necessario fare alcune premesse.

Dai vecchi questionari ai Big Data

La psicometria è quella branca della psicologia che cerca di misurare costrutti astratti e intangibili. Per svolgere questa operazione, un tratto come la personalità, viene scomposto in indicatori visibili e misurabili: ad esempio, avere molti amici e riuscire facilmente a socializzare sono buoni indicatori della personalità estroversa. Una volta definita la gamma di indicatori, è necessario stabilire la metodologia migliore per rilevarli. Sino ad oggi, gli strumenti privilegiati dagli psicologi sono stati i questionari standardizzati, ossia una serie di domande rivolte a un soggetto al quale si chiede di assegnare dei punteggi rispetto a determinate affermazioni. Ad esempio, in un test per la valutazione del tratto di personalità “apertura” (attribuibile ad una persona creativa, anticonformista e originale) si potrebbe chiedere a qualcuno di determinare in che misura si è “generalmente propensi a nuove esperienze” su una scala che va da 0 (per nulla) a 3 (del tutto).

Grazie all’impiego di sofisticate metodologie statistiche, oggi è possibile valutare, in maniera alquanto accurata, i tratti di personalità tramite il modello del Big Five. La teoria propone una classificazione formata da cinque fattori: apertura, coscienziosità, estroversione, piacevolezza e stabilità emotiva. La combinazione tra le cinque dimensioni del modello OCEAN (openness, consciousness, extroversion, agreeableness, neuroticism), costituisce la configurazione di personalità di ogni individuo. Numerose ricerche hanno dimostrato che conoscere il profilo della personalità di una persona, consente di prevederne il comportamento in maniera piuttosto attendibile (ad esempio la performance lavorativa, la qualità della vita coniugale, e così via).

Ottenere questo genere di informazioni è interessante all’interno di molti contesti, uno tra tutti il marketing politico ed elettorale. Chi si occupa di comunicazione, sa bene che non esiste un messaggio efficace per tutti allo stesso modo e, per questo motivo, una tecnica ampiamente utilizzata nel marketing è la segmentazione, cioè differenziare il messaggio a sulla base di un ipotetico ricevente differente. La segmentazione può essere facilmente realizzata sulla base delle caratteristiche sociodemografiche (sesso, età, genere, ecc.). Questo approccio, pur basandosi su dati oggettivi, non sempre riesce a spiegare i reali comportamenti del target analizzato.

Un altro modo per segmentare il target è l’analisi psicografica, ossia valutare le caratteristiche psicologiche (la personalità, ad esempio) dei soggetti di cui si vuole influenzare un determinato comportamento, come la scelta elettorale. L’approccio psicografico si è rivelato estremamente efficace ma, per metterlo in atto, sarebbe stato necessario somministrare un questionario basato sul Big Five all’intero elettorato americano, una procedura molto dispendiosa in termini di risorse e alla quale molti elettori avrebbero potuto opporsi.

Ed è qui che entra in gioco Kosinski.

Big Data e personalità

Michal Kosinski, nel 2008, viene accettato all’Università di Cambridge per lavorare al suo Dottorato di Ricerca presso il Psychometrics Centre. Insieme al suo collega, David Stilwell, sviluppa un’applicazione denominata MyPersonality che consente agli utenti di Facebook di compilare diversi questionari psicometrici, inclusa una versione del Big Five Questionnaire. Gli utenti rispondono alle domande per ricevere una descrizione accurata del loro profilo di personalità e, a quel punto, possono decidere se condividere o meno i dati del loro profilo Facebook con i ricercatori. In pochi mesi, i due dottorandi di Cambridge ottennero la più grande combinazione tra punteggi psicometrici e profili di Facebook mai collezionata nella storia.

Chi possiede una qualche familiarità con la statistica, immaginerà subito quali tipi di studi Kosinski e Stilwell iniziarono a condurre: “semplici” correlazioni e regressioni (ipotesi di relazione causa-effetto tra variabili) tra i punteggi ottenuti ai test psicometrici (personalità, intelligenza, qualità della vita) e ogni sorta di traccia digitale.

Nel 2013 Kosinski pubblicò i primi risultati in un articolo considerato il quarto lavoro più influente di sempre secondo la rivista “Altmetrics” e il primo tra quelli pubblicati da PNAS, dal titolo "Private traits and attributes are predictable from digital records of human behavior".

Lo studio si basava su dati raccolti da un campione di 58466 volontari. L’obiettivo è stato dimostrare la capacità predittiva dei Like di Facebook di attributi personali come l’orientamento sessuale, la religione, la personalità, l’intelligenza e l’uso di sostanze stupefacenti. Come si vede nei risultati riportati nel grafico sotto, un numero medio di circa 170 like è sufficiente per predire il colore della pelle (95%), l’omosessualità (88% di precisione per gli uomini e il 75% per le donne) e l’affiliazione al partito Democratico o Repubblicano (85%).

Accuratezza del modello predittivo per ciascun attributo
Infogram

Una delle appendici dell’articolo consiste in una lista dei Like maggiormente rappresentativi di alcuni tratti. Ad esempio, gli uomini che seguono la pagina della famosa linea cosmetica MAC saranno più probabilmente gay mentre uno dei migliori indicatori dell’eterosessualità è essere un follower dei Wu-Tang Clan. Chiaramente, prendere in considerazione un singolo Like sarebbe troppo poco per produrre una predizione effettiva. Tuttavia, quando si hanno a disposizione combinazioni di migliaia di dati riguardo un singolo individuo, un computer può imparare a conoscere una persona meglio dei suoi colleghi, amici e addirittura parenti e partner.

Ad oggi, Kosinski e colleghi non si limitano all’impiego dei Like, ma cercano di esplorare il potere predittivo di un ampio raggio di tracce digitali: la musica che ascoltiamo, la struttura della nostra rete sociale, l’attività fisica quotidiana registrata dai nostri smartphone, ciò che scriviamo nei nostri stati e molto, molto altro ancora. Kosinski, nella sua intervista per Vice, dichiara: «Il nostro smartphone è un vasto questionario psicologico che noi compiliamo incessantemente, sia consapevolmente che inconsapevolmente».

Big Five ti osserva per avere il tuo voto: arriva Cambridge Analytica

Per chi opera nel campo della ricerca psicologica, questo filone ha una portata rivoluzionaria perché può disporre di campioni ampi e rappresentativi, al contrario di quanto avvenuto sino a questo momento. Kosinski e Stilwell, infatti, denunciarono nel 2004 che uno tra i principali limiti della ricerca psicologica consisteva nel basarsi su dati raccolti da campioni WEIRD (Western, Educated, Industrialized, Reached, Democratic), ossia occidentali, istruiti, industrializzati, benestanti e democratici. Questo limite è dovuto agli altissimi costi di reclutamento e di conseguenza spesso si finisce per accontentarsi di campioni composti prevalentemente da studenti universitari di psicologia. Al contrario, l’utilizzo del web per la raccolta dati, consente di abbattere notevolmente i limiti spazio-temporali come dimostrato dai due dottorandi di Cambridge che, in breve tempo, raccolsero i dati di circa 7,5 milioni di utenti (di cui il 40% condivise i dati del profilo Facebook), equamente distribuiti per genere e nazionalità (parliamo di 45 nazioni, compresi gli USA).

I ricercatori sembrano sposare una filosofia Open-Source e infatti hanno messo a disposizione un wiki con l’obiettivo di condividere pubblicamente i dati raccolti. Anche grazie a questo atteggiamento, il lavoro di Kosinski non è passato inosservato. Vice riporta che nel giorno della pubblicazione di alcune sue ricerche, Kosinski abbia ricevuto due telefonate: un’offerta di lavoro e una minaccia di denuncia, entrambe da Facebook.

La storia si fa ampiamente più intricata quando, nel 2014, il gruppo di ricerca di Kosinski viene approcciato da Aleksandr Kogan, un collega del Dipartimento di Psicologia a Cambridge. Kogan comunica ai dottorandi l’interesse di un’azienda per il metodo OCEAN e per il database di MyPersonality, aggiungendo, però, di non essere autorizzato a rivelare le finalità della proposta. La società in questione si chiama Strategic Communciation Laboratories - SCL., un’azienda che offre servizi di marketing e comunicazione politica basandosi su modelli psicografici. All’epoca Kosinksi non sapeva nulla dell’identità della SCL, ma i suoi cattivi presentimenti si sarebbero successivamente rivelati corretti.

Nel 2013, la SCL crea Cambridge Analytica, uno spin-off dedicato al marketing elettorale. Grazie al supporto di Kogan, la società acquisisce, all’insaputa del team di ricerca di Kosinski, la metodologia OCEAN. Inoltre, in maniera perfettamente legale, Cambridge Analytica acquista il database dell’elettorato statunitense con l’obiettivo di catturare ogni singola informazione riguardo al potenziale elettore. Il risultato? Cambridge Analytica dispone di un profilo dettagliato di ogni singolo cittadino americano composto dai suoi dati anagrafici, tratti di personalità, suoi principali interessi e molto altro ancora.

Brexit e le elezioni presidenziali negli Usa: i successi di Cambridge Analytica

Cambridge Analytica ha acquisito graduale popolarità a partire dal novembre del 2015, quando Nigel Farage aveva annunciato che la più radicale delle campagne della Brexit, “Leave.EU”, era stata commissionata a una società di Big Data, in grado di valutare i profili di personalità di un target utilizzando tracce digitali. Si trattava di Cambridge Analytica.

Dopo il successo della Brexit, Cambridge Analytica prende parte a una campagna elettorale condotta in un contesto culturale e socio-politico profondamente diverso rispetto a quello del Regno Unito: le primarie Repubblicane negli Stati Uniti d’America. Alexander Nix, amministratore delegato di Cambridge Analytica, durante il Concordia Summit, illustra il modo di operare della società e gli strabilianti risultati ottenuti con il Senatore Cruz.

Solo 18 mesi fa, il Senatore Cruz era uno dei candidati meno popolari. Meno del 40% della popolazione aveva sentito parlare di lui. A distanza di un anno e mezzo, Cruz rappresentava l’unica reale minaccia al fenomeno Donald Trump. Cosa ha reso possibile tutto questo?

(Alexander Nix)

La ricetta proposta da Nix è composta da tre ingredienti: scienze comportamentali, big data e tecnologia.

«L’idea che tutte le donne debbano ricevere lo stesso messaggio in base al loro genere o tutti gli Afro Americani in base alla loro etnia è assolutamente ridicola». Nix non nega l’importanza dei fattori sociodemografici, ma la segmentazione psicografica assume una funzione strategica perché «comprendere la personalità significa anticipare il comportamento in genere e, ovviamente, anche il comportamento di voto». Andando avanti, Nix mostra in un’infografica cinque volti corrispondenti a ogni tratto di personalità del Big 5 e spiega che, grazie a questi dati, diventa possibile personalizzare tutti i messaggi inerenti ai temi dell’agenda elettorale, come ad esempio il secondo emendamento.

Nix mostra in un’infografica cinque volti corrispondenti a ogni tratto di personalità del Big 5.

Nix spiega: «Gli elettori con alti livelli di chiusura e piacevolezza, sono persone legate alla tradizione, alla cura della famiglia e della comunità». Di conseguenza, un messaggio personalizzato per questo target potrebbe essere un’immagine di un uomo che insegna al figlio come utilizzare un’arma da fuoco nelle campagne degli Stati Uniti al tramonto con la didascalia “From father to son, since the birth of our nation” (Di padre in figlio, sin dalla nascita della nostra nazione). La potenza del messaggio consiste nel raccontare valori e scenari coerenti rispetto a ciò che si crede e ciò che si pensa.

Nix presenta una tipologia di messaggio psicografico

Nel passato il processo creativo seguiva un percorso top-down: menti brillanti si radunavano e pensavano a degli slogan geniali come “beans means Heinz” e i messaggi venivano lanciati con la speranza che funzionassero. Oggi non è necessario indovinare quale soluzione potrebbe funzionare perché i dati ci permettono di prevedere esattamente che tipo di messaggio funzionerà e con chi.

(Alexander Nix)

I dati di cui Nix parla sono l’incrocio di informazioni sociodemografiche (es. età, genere), psicografiche (es. lo stile di vita, le abitudini del consumatore) e comportamentali (es. la personalità, l’immaginario, i valori). In ogni campagna elettorale, trovare elettori indecisi è cruciale e i dati legati alla personalità rappresentano un tesoro per il manager della comunicazione. Nix presenta in un grafico a torta la composizione di un gruppo definito “persuasion”, ossia elettori che intendono votare, ma che c’è bisogno che si spostino più a destra per scegliere il Senatore Cruz. Il profilo di personalità medio del gruppo persuasion, composto da 45mila elettori, è caratterizzato da un buon livello di stabilità emotiva, da un basso livello di apertura e un alto livello di coscienziosità. Inoltre i persuasion sono interessati a una serie di argomenti, tra cui i gun rights (i diritti legati al possesso di armi da fuoco).

«L’idea che ogni persona riceva lo stesso messaggio, la stessa email è morta. I miei figli sicuramente non capiranno mai questa nozione di comunicazione di massa» .Per Nix la comunicazione sarà sempre più “cucita su misura”. Ciascuno riceverà non solo informazioni sui prodotti d’interesse, ma il messaggio verrà personalizzato utilizzando i valori e la concezione del mondo di ogni singolo individuo.

Nix conclude il suo discorso con un ammonimento: «La campagna di Cruz è terminata. Ciò che ora vorrei dirvi è che uno dei due candidati rimasti, sta utilizzando la nostra metodologia e sarà davvero molto interessante vedere che impatto avrà nelle prossime sette settimane».

Cambridge Analytica ha poi lavorato per la campagna presidenziale di Trump.

"Non abbiamo costruito la bomba, abbiamo solo mostrato che la bomba esiste"

Non è possibile definire, a posteriori, quanto Cambridge Analytica abbia influenzato il risultato delle elezioni di Donald Trump e della Brexit e non ci sono evidenze per affermare che le cose sarebbero andate diversamente.

Tuttavia, l’impiego dei Big Data per scopi elettorali sollecita inevitabilmente riflessioni di natura etica. David Miller, professore di Sociologia all’Università di Bath, afferma: «Per gli elettori, dovrebbe essere sempre trasparente la fonte dell’informazione. Al contrario, se questa non è chiara, sarebbe lecito chiedersi se stiamo vivendo in una democrazia o meno».

Anche l’European Data Protection Supervisor (EDPS) si è espressa nel 2015: “I Big data, se usati responsabilmente, possono portare benefici significativi alla società. Ma ci sono serie preoccupazioni riguardo la tutela del diritto alla libertà degli individui, incluso il diritto alla privacy”. Secondo l’EDPS i maggiori rischi riguardano l’assenza di trasparenza, l’asimmetria informativa e l’inaffidabilità dei dati. Basti pensare che i Big Data potrebbero essere usati per prevenire azioni che probabilmente si realizzeranno ma che non si sono ancora verificate: anticipare la performance scolastica di un bambino (tramite la misurazione del quoziente intellettivo, delle capacità di attenzione, e così via), il rischio di suicidio o di commettere un crimine. Il Norwegian Big Data Report definisce tale condizione “Dittatura dei Dati” in quanto i giudizi non sarebbero più formulati sulla base delle azioni ma su ciò che i dati indicano riguardo le possibili future azioni.

L’EDPS afferma: “Potrebbero essere identificate correlazioni casuali (prive di una relazione di causa-effetto) anche nel caso di assenza di relazione causale. In tali casi c’è il rischio di trarre conclusioni inaccurate e, se applicate a livello individuale, potenzialmente discriminatorie”.

Per quanto fare previsioni su ciò che accadrà nel giro dei prossimi mesi sia complesso (in mancanza di Big Data), si prospetta uno scenario altamente probabile: Kosinski, oggi ricercatore presso l’Università di Stanford, continuerà a studiare le proprietà psicometriche delle “tracce digitali”, causando notevole scompiglio per le possibili ripercussioni delle sue ricerche. In uno dei suoi più recenti lavori, ad esempio, lo psicologo ha mostrato una forte relazione tra orientamento sessuale e tratti del viso ricavati da fotografie reperibili sul web. Dal giorno della pubblicazione dei risultati, Kosinski, dopo essere stato accusato da alcuni di essere colpevole per la vittoria di Trump, è diventato anche uno dei principali nemici della comunità LGBQT. In seguito alle ripetute minacce di morte, Kosinski ha così replicato: «Noi non abbiamo colpe. Non abbiamo costruito la bomba, abbiamo solo mostrato che la bomba esiste».

Foto in anteprima: il CEO di Cambridge Analytica, Alexander Nix, parla al Concordia Summit 2016, via NS Tech

Segnala un errore

Valigia Blu

Chi è Cambridge Analytica e come usa le tracce digitali dei cittadini online

Iscriviti alla nostra Newsletter

Dai vecchi questionari ai Big Data

Big Data e personalità

Big Five ti osserva per avere il tuo voto: arriva Cambridge Analytica

Brexit e le elezioni presidenziali negli Usa: i successi di Cambridge Analytica

"Non abbiamo costruito la bomba, abbiamo solo mostrato che la bomba esiste"

Iscriviti alla nostra Newsletter

Referendum Lombardia: i pro e i contro del voto elettronico

Molestie sul lavoro: perché in Italia un caso “Weinstein” non c’è e non ci sarà

Chi è Cambridge Analytica e come usa le tracce digitali dei cittadini online