Grazie ai miglioramenti nella portata e nell'efficacia della digitalizzazione dei dati, per le organizzazioni di ogni tipo è più semplice costruire profili personali basati sui dati acquisiti dalle persone. Ciò va oltre le informazioni di base come nome, età e indirizzo: oggi quasi tutte le informazioni personali esistono in formato digitale, da quelle apparentemente innocue (come interessi e hobby, preferenze di acquisto, relazioni ecc.) a quelle estremamente private (come numeri di previdenza sociale, informazioni sul credito, dati sanitari, posizione e spostamenti ecc.).
In molti casi, le informazioni che condividiamo online, consapevolmente o meno, vengono utilizzate dalle macchine per renderle più intelligenti. La foto di un cucciolo che pubblichiamo sui social media aiuta a insegnare ad algoritmi semi-intelligenti a riconoscere un cucciolo quando lo vedono. Le ricerche che effettuiamo online insegnano alle macchine a comprendere e riprodurre meglio il linguaggio umano.
Tuttavia, a prescindere dal modo in cui i dati vengono utilizzati, il fatto che esistano e siano a disposizione di utenti sconosciuti sta diventando un motivo di allarme importante. I clienti (per non parlare dei legislatori) di tutto il mondo stanno iniziando a chiedere che le aziende diano ai proprietari dei dati originali l'ultima parola su come questi vengono raccolti e utilizzati.
Per questo motivo, le organizzazioni che stabiliscono e seguono politiche sulla privacy dei dati genuine sono più in grado di instaurare un rapporto di fiducia con i propri clienti. Allo stesso tempo, eliminano i rischi legali associati alla violazione di leggi, standard e regolamenti nuovi e futuri sulla privacy dei dati. La recente multa di 5 miliardi di dollari inflitta a Facebook dalla FTC è un esempio di quanto possano essere salate le sanzioni per la violazione di queste leggi.