Il futuro della pubblicità online è nei dati in poche mani e nelle piattaforme chiuse

13 min lettura

Chi è pronto per il GDPR?

È il giugno del 2017, circa un anno dopo l’approvazione del Regolamento europeo in materia di protezione dei dati personali e un anno prima della sua attuazione, quando IAB Europe (Interactive Advertising Bureau, organizzazione pubblicitaria che sviluppa standard di settore, conduce ricerche e fornisce supporto legale per il settore della pubblicità online) mette per iscritto queste parole:

“Consent under the GDPR must be 'informed', that is, the user consenting to the processing must have prior information as to the identity of the data controller processing his or her personal data and the purposes of the processing.
As it is technically impossible [...] in a real-time bidding (RTB) scenario, programmatic trading, the area of fastest growth in digital advertising spend, would seem, at least prima facie, to be incompatible with consent under GDPR”

(Il consenso in base al GDPR deve essere “informato”, cioè l'utente che acconsente al trattamento deve disporre di informazioni preliminari in merito all'identità del titolare che tratta i suoi dati e alle finalità del trattamento.
Essendo tecnicamente impossibile [...] in uno scenario di offerte in tempo reale (RTB), il trading programmatico, l'area di maggiore crescita della spesa pubblicitaria digitale, sembrerebbe, almeno a prima vista, non conforme al consenso come previsto dal GDPR)

Da allora la piattaforma IAB è stata aggiornata, e IAB adesso sostiene che sia conforme alla normativa, ma i dubbi rimangono, considerato che si moltiplicano i reclami ai Garanti europei in relazione al trattamento dei dati personali nell’ambito del sistema pubblicitario online. Nel frattempo al GDPR si sono affiancate numerose altre normative a tutela dei dati personali, come il California Consumer Privacy Act (CCPA) e la Lei Geral de Proteção de Dados (LGPD) del Brasile.

I cookie di terze parti nel corso degli anni sono diventati il pilastro trainante della pubblicità online, ma le crescenti preoccupazioni sulle violazioni della privacy hanno portato i principali produttori di browser ad investire in misure che blocchino o limitino i tracker pubblicitari. E non solo.

A settembre 2020 Apple introduce iOS 14, con importanti modifiche a livello privacy. Anche se il rilascio della funzionalità ATT (App Tracking Transparency) è stato posticipato al 2021, il nuovo framework modifica l’utilizzo dell’IDFA (Identifier for Advertisers), l’identificatore univoco per i dispositivi mobili Apple utilizzato per indirizzare e misurare l’efficacia della pubblicità a livello di utente. Gli IDFA sono stati introdotti da Apple nel 2016 in risposta alla crescente disattivazione da parte degli utenti del monitoraggio degli annunci, così consentendo comunque agli inserzionisti di inviare pubblicità personalizzata. Ma al 2020 il tasso di dispositivi con IDFA attivo era di circa il 24% (18% in Europa), evidenziando il fastidio degli utenti al tracciamento online in costante aumento.

Per cui con iOS 14 Apple chiede agli utenti di attivare espressamente la condivisione IDFA quando utilizzano una App, se non la attivano comunque la raccolta dei dati (di prima parte, chi raccoglie il dato) avviene (e potranno essere utilizzati a fini pubblicitari, ma solo dalla prima parte) ma non la condivisione con le terze parti. Inoltre, se precedentemente il sistema pubblicitario consentiva una raccolta dei dati granulare, a livello di singolo utente, con iOS 14 si passa ai dati aggregati, l’indirizzamento della pubblicità avverrà, quindi, a livello di gruppi.

Quindi, gli annunci basati sul remarketing o retargeting non funzioneranno più per gli utenti che hanno scelto di non condividere il proprio IDFA, e i sistemi di misurazione dell’efficacia delle campagne pubblicitarie dovranno passare per l’API di Apple. Ma ciò non vuol dire che le persone vedranno meno pubblicità, chi sceglie di rinunciare alla condivisione dell’identificativo vedrà comunque una quantità uguale di pubblicità, ma non sarà più personalizzata.

Google abolisce i cookie?

La risposta di Google ai cambiamenti in atto nel settore pubblicitario non si fa attendere. Se Mozilla Firefox e Apple Safari si sono incamminati sulla strada del blocco dei tracker di terze parti, se sono nati browser privacy-enhanced che evidentemente incontrano il favore degli utenti, Google non può far finta di nulla rischiando di perdere l’ampia quota di mercato del suo browser Chrome (circa il 63%), e nel gennaio 2020 annuncia che anch’esso non consentirà più l’uso di tracker di terze parti. Ma non subito, la modifica sarà attuata nel corso di due anni (2022), così preferendo un approccio graduale. L’intenzione di Google, infatti, è quella di introdurre una nuova soluzione tecnica per la pubblicità online che sia, dicono, meno invasiva rispetto agli attuali cookie.

Secondo Google i cookie consentono agli inserzionisti di tracciare gli utenti nel corso della navigazione online tra i vari siti, così permettendo loro di farsi un’idea degli interessi dei cittadini e fornire annunci personalizzati. Il settore pubblicitario online, sostiene, è necessario per mantenere il web “aperto a tutti”, permettendo una remunerazione per i servizi offerti. L’alternativa sarebbe offrire solo servizi a pagamento. Ma, precisa Google, l’assenza di trasparenza e gli abusi del tracciamento online hanno reso gli utenti sempre più insofferenti. Per questo occorre cambiare le regole del gioco. L’idea è di eliminare i cookie di terze parti, sostituendoli con la Privacy Sandbox, una tecnologia che offre “pubblicità basata sugli interessi” o, per dirla in termini più tecnici, Federated Learning of Cohorts (FloC). L’annuncio è di agosto 2019.

Ma che cosa è l’apprendimento federato? In realtà Google lavora da tempo su questa tecnologia, che è già presente in moltissimi smartphone (Android ma anche iOS). Il Federated learning consente agli smartphone di apprendere in modo collaborativo un modello di previsione condiviso, mantenendo nel contempo tutti i dati sul dispositivo (con ciò aumentando la protezione dei dati) senza inviarli nel cloud (quindi senza condividerli con altri). In sostanza si va oltre l’uso di modelli locali di previsione portando anche l’addestramento del modello sul dispositivo.
Uno smartphone, ad esempio, scarica il modello previsionale (un algoritmo), e il modello impara durante l’uso. Alla fine del periodo di riferimento riassume le modifiche al modello e le invia (cifrate) al server (senza i dati), dove l’aggiornamento viene unificato con tutti gli aggiornamenti che provengono dagli altri smartphone, in modo da migliorare l’algoritmo stesso. I dati di training rimangono quindi sul dispositivo.

Così funziona e si aggiorna Google Board dal 2016, tramite un algoritmo di autoapprendimento (machine learning) che risiede sul dispositivo. Quando Gboard suggerisce una query, lo smartphone memorizza localmente le informazioni sul contesto e l’eventuale click sulla query, e l’algoritmo elabora (ovviamente quando il dispositivo è inattivo) la cronologia per migliorare il modello, ma sempre sul dispositivo. L’apprendimento federato funziona senza alcuna necessità di inviare i dati in cloud.

FloC, il machine learning applicato alla pubblicità

FloC (Evaluation of Cohort Algorithms for the FLoC API) è un API, cioè un’interfaccia che definisce le interazioni tra più software, basata sul concetto di “coorte” (cohorts). Coorte è anche un termine militare, ma ha un preciso significato in statistica, indicando un gruppo di persone accomunate da interessi, eventi o circostanze. La coorte è quindi un gruppo di utenti che ha un comportamento di navigazione online simile, che viene algoritmicamente riassunto in un hash, e quindi assegnato (rigorosamente su base algoritmica) ad un identificatore di coorte.

I problemi affrontati dal team di Google nello sviluppo di questa tecnologia sono i seguenti:
- quanto grande deve essere la coorte?
- che livello di similarità devono avere gli utenti assegnati alla coorte?
- le informazioni devono essere inviate ad un server centrale per il calcolo dell’ID di coorte?
È immediatamente ovvio che si tratta di bilanciare le esigenze di privacy degli utenti con l’utilità della tecnologia ai fini dell’invio della pubblicità. Più grande è la coorte, maggiore è la tutela della privacy, ma minore è l’efficacia della pubblicità inviata. Occorre, quindi, una sorta di “autorità” (centralizzata?) che vigili che le coorti non siano troppo piccole.

In sintesi FloC è un’applicazione della privacy differenziale, una tecnica di anonimizzazione progettata per raccogliere dati dagli utenti senza rivelare informazioni personali. L’approccio è sostanzialmente quello di nascondere un singolo individuo in un gruppo, una folla di persone, in tal modo sostituendo all’identificatore individuale (del dispositivo) un identificatore condiviso da un gruppo accomunato da interessi, così garantendo una maggiore tutela privacy. Con FloC le aziende e gli inserzionisti non raggiungeranno più i singoli individui, ma gli annunci saranno personalizzati in base agli interessi di un gruppo omogeneo.

Nel corso del 2021 (probabilmente entro fine marzo) Google avvierà i test per indirizzare gli annunci a gruppi di interessi (FLEDGE) senza che il browser riveli le abitudini dei singoli individui. Il tutto avviene a livello browser. Un’azienda può costruire un gruppo di interessi (coorte), ad esempio un gruppo di persone che hanno letto un certo tipo di contenuto sul loro sito. Questa coorte può essere utilizzata per indirizzare la pubblicità, e l’attività può anche essere delegata a terzi, e quindi è possibile anche indirizzare pubblicità quando i soggetti della coorte stanno visitando altri siti (remarketing).

L’asta (Real Time Bidding) per gli spazi pubblicitari avviene direttamente sul dispositivo (a livello di browser), e il codice dedicato non è abilitato a comunicare con i server dell’acquirente né del venditore. Il browser acquisisce i dati (il flusso relativo alle offerte per gli spazi pubblicitari) solo da un server definito attendibile. È il browser, quindi, che gestisce il tutto, mantenendo sul dispositivo le informazioni sulle coorti a cui ha aderito, e su chi “possiede” (il soggetto che crea la coorte) il gruppo di interesse. È il browser che concede l’autorizzazione all’accesso alla coorte, col permesso del “proprietario” del gruppo e del gestore del sito che si sta visitando. Quest’ultimo può, infatti, consentire o negare alle terze parti l’accesso alla coorte. Poiché l’asta avviene sul dispositivo, il gestore del sito che si sta visitando (venditore) può eseguire una propria asta, può includere uno script di terze parti (a cui delega) per eseguire l’asta o utilizzare un provider di servizi condivisi che esegue l’asta. Il venditore decide quali acquirenti possono partecipare all’asta, e quali offerte sono idonee. Alla fine è sempre a livello di browser che si decide l’annuncio vincente.

Secondo i test dei team pubblicitari di Google, FloC è una valida alternativa ai cookie di terze parti garantendo un risultato di conversione pari a circa il 95% rispetto alla pubblicità basata sui cookie.

Cosa cambierà con FLoC

Google ha precisato che non ha alcuna intenzione, una volta eliminati i cookie di terze parti (di profilazione), di sostituirli con una tecnologia altrettanto invasiva, quanto piuttosto di passare da un monitoraggio individuale ad un monitoraggio per dati aggregati. I progressi nell’aggregazione e nell’anonimizzazione, nell’elaborazione su dispositivo (con gli smartphone sempre più potenti), consentono un passo in avanti nella tutela della privacy.
Ovviamente questo non vuol dire che i cookie scompariranno del tutto. Altre aziende potranno trovare metodi alternativi per il tracciamento individuale degli utenti, ma Google smetterà di farlo entro il 2022, bloccando sul suo browser i tentativi di accesso ai dati individuali.

Le modifiche entreranno in vigore entro il 2022, e da quel momento Google non dovrebbe più creare profili individuali per i suoi sistemi pubblicitari, e il targeting sarà basato solo su dati aggregati. Le modifiche riguarderanno solo la navigazione su web, non gli annunci per App su smartphone che saranno sempre basati sulla tecnologia pubblicitaria di Google.

Google, però, sta modificando la propria tecnologia, non quella di altre aziende e circuiti pubblicitari che, se basati su cookie di terze parti, continueranno a funzionare allo stesso modo. Inoltre un’azienda che raccoglie dati direttamente dagli utenti (cookie di prima parte, cioè impostati direttamente dal sito che si sta navigando in quel momento) sarà ancora in grado di inviare pubblicità mirata in base ai propri dati raccolti sui propri siti o siti di partner, eventualmente anche utilizzando la tecnologia di Google per l’invio degli annunci. Non mancheranno, ovviamente, i tentativi di aggirare le restrizioni, come ad esempio l’utilizzo del cloaking CNAME per far passare il codice di monitoraggio (mascherandolo) di terza parte come se in realtà fosse di prima parte, una tecnica per la quale Apple ha predisposto delle contromisure (per i sistemi non-Apple è possibile usare uBlock Origin).

Ma l’idea di Google ha fatto nascere molti dubbi. Sembrerebbe un passo in avanti nella tutela della privacy, ma secondo l’EFF non lo è, o comunque è insufficiente. L’identificativo assegnato al browser è un’etichetta che riassume il comportamento dell’utilizzatore del dispositivo, cosa gli piace, dove va, cosa compra, con chi si relaziona. Insomma, un unico grande cookie.
Inoltre all’interno della coorte possono essere inseriti anche dati sensibili, anche se Google sostiene che il browser potrà lasciarli fuori dal processo di apprendimento (lista delle categorie proibite). Le specifiche del progetto non sono ancora chiare, il punto debole è la grandezza delle coorti, perché è ovvio che più è piccola la coorte più facile sarebbe l’identificazione del singolo. Infatti, nell’ambito di una coorte (pensiamo ad una di un migliaio di persone) sarebbe molto più semplice utilizzare l’impronta del browser (fingerprint) per identificare il singolo individuo. In questa direzione FloC creerebbe addirittura più rischi per la privacy delle persone. Per questo Google propone un “amministratore” che raggruppi le coorti se queste sono troppo piccole e quindi pericolose per la privacy degli utenti.

Inoltre, indipendentemente dalla grandezza delle coorti, l’aggregazione dei gruppi consente sempre il targeting per interessi, con rischi di discriminazioni (a livello di gruppo) in base anche a caratteristiche quali l’etnia, gli abusi, le malattie, ecc... Non dimentichiamo, infatti, che l’algoritmo di FloC crea le coorti anche in base alla navigazione, per cui in teoria potrebbero essere accomunate persone che visitano un sito che si occupa di depressione.

La proliferazione dei walled garden

Google è un'azienda il cui business è principalmente (circa l’80%) incentrato sulla vendita di annunci pubblicitari, e quindi è ovvio che cerchi di difendere il suo business. Considerate le pressioni sulle aziende per risolvere i problemi di violazione della privacy nell’ambito del settore pubblicitario, Google da un lato cerca di convincere le aziende e i governi che la pubblicità personalizzata è necessaria (studio di Google del 2019: Effect of disabling third-party cookies on publisher revenue), dall’altro crea una alternativa ai cookie pubblicitari, eliminandoli dal suo browser Chrome.

Il risultato finale molto probabilmente sarà la realizzazione di un walled garden, un giardino recintato che stringerà la presa di Google sul settore pubblicitario, costringendo tutti a dipendere da lei. Infatti il Garante per la concorrenza del Regno Unito ha aperto un’indagine. Sia chiaro, il problema non è Google, ma l’intero settore pubblicitario online che si basa sull’invasione della privacy degli individui con tutte le ricadute sociali conosciute. Anche la mossa di Apple si inscrive nella stessa prospettiva, infatti le critiche al nuovo framework di Apple evidenziano come realizzi di fatto un walled garden costringendo tutti a dipendere da Apple per l’invio e la misurazione della pubblicità (infatti Apple rimuoverà le App di ByteDance e Tencent che introducono degli identificatori proprietari e alternativi rispetto a quelli di Apple).

Facebook, ad esempio, ha in prima battuta accusato aspramente Apple di voler sfruttare la propria posizione dominante per interferire col business delle altre aziende (ma l’autorità per la concorrenza francese ha respinto la richiesta di misure provvisorie urgenti). In un secondo momento, però, Zuckerberg sembra essersi ricreduto, in quanto ha sostenuto che la mossa di Apple alla fine potrebbe addirittura favorire Facebook, costringendo molte aziende a condurre le proprie attività commerciali e pubblicitarie sulle piattaforme legate a Facebook (Instagram, ecc...), cioè a finire nel loro walled garden.

Allo stesso modo altri attori del settore pubblicitario stanno studiano le loro soluzioni per l’annunciata dipartita dei cookie di terze parti. Tra le tante Trade Desk con l’Unified ID 2, basato su email anonime dei consumatori raccolte dall’utente che accede a un sito web o a una App (su smartphone o anche TV connessa a internet, il settore della pubblicità su CTV, connected TV, è uno di quelli a maggiore crescita). La soluzione incentrata su email rende Trade Desk indipendente dalle scelte del browser, e quindi non danneggiata dalle mosse di Google. Oppure la Authenticated Traffic Solution (ATS) di LiveRamp, anche questa soluzione senza cookie. L’idea è di affidarsi ai dati di prima parte (quindi cookie di prima parte ma anche dati come email e numero di telefono raccolti da altre fonti) per creare grafici dell’identità di clienti e potenziali clienti per garantire la commercializzazione attraverso prodotti pubblicitari.

L’impressione, quindi, è che l’effetto di queste modifiche al funzionamento del settore pubblicitario online alla fine non sarà tanto quello di tutelare maggiormente i cittadini, quanto piuttosto di concentrare il controllo dei dati nelle mani delle poche piattaforme che li raccolgono direttamente, e costringere tutti gli altri attori del settore ad elemosinare l’accesso a tali dati (individuali o aggregati che siano).

Il punto è che non dovremmo essere costretti a scegliere tra un tracciamento individuale e uno aggregato, il tracciamento vecchio e quello nuovo, come se ridurre l’invasione della privacy sia un successo. Quello che occorre è prendere coscienza che il tracciamento individuale online è un problema serio che va affrontato e risolto definitivamente. Ed è fondamentale capire che non possiamo attendere le mosse delle aziende, né possiamo aspettarci che siano loro a tutelare i nostri diritti, la tutela della privacy non è e non sarà mai lo scopo delle aziende, il cui fine ultimo è il profitto. La tutela della privacy entra in gioco solo come elemento di concorrenza tra le aziende, laddove queste sentono che i loro clienti non sono soddisfatti. Così Apple corre ai ripari e introduce funzionalità a tutela della privacy per non avere clienti scontenti e per potersi accreditare in contrasto ad aziende quali Google e Facebook.

Dobbiamo accontentarci di scegliere l’azienda che viola di meno la privacy dei cittadini, oppure possiamo pretendere una reale alternativa che non si basi sull’invasione delle nostre sfere private?

L’industria pubblicitaria, sia chiaro, non è solo Google, Facebook, Apple, Trade Desk o LiveRamp, ma una quantità enorme (circa 8000) di aziende che vivono sui nostri dati, tra i quali spiccano i circuiti pubblicitari che servono i giornali e l’editoria. Uno studio (Online Tracking and Publishers’ Revenues: An Empirical Analysis) di un team di economisti sostiene che il “vantaggio” della pubblicità comportamentale è valutabile nell’ordine del 4%, a fronte di costi degli annunci aumentati anche del 500%. Poi, un esperimento dell’NPO, l’emittente pubblica belga, evidenzia che passare dalla pubblicità comportamentale (targetizzata) a quella contestuale (senza tracciamento degli utenti) non riduce i ricavi pubblicitari, anzi sembrerebbe aumentarli. L’alternativa sembra che ci sia, allora. Se per le aziende può essere più “difficile” ridurre i profitti, almeno l’editoria, i giornali, potrebbero mettere i loro lettori al primo posto e rinunciare a una tecnologia che ha gravi ricadute negative sulla società. Quello che manca è la volontà di cambiare, e l’interesse a tutelare i cittadini.

Il futuro della pubblicità online è nei dati in poche mani e nelle piattaforme chiuse