Le applicazioni mobili intrattengono, facilitano la comunicazione con amici e familiari e forniscono strumenti utili (mappe, pagamenti elettronici, gestione del conto in banca, degli abbonamenti tv, ecc.). E in base al lavoro che devono svolgere le applicazioni richiedono l’accesso ad alcune informazioni degli utenti sui dispositivi, ad esempio i dati personali e i dati dei sensori provenienti da componenti, come le telecamere e GPS. Al fine di proteggere gli utenti e aiutare gli sviluppatori a navigare nei complessi ambienti delle app e della privacy, Google analizza la gestione della privacy e della sicurezza di ogni applicazione inserita nel catalogo di Google Play. Come questo processo di analisi avviene è stato spiegato nel dettaglio in un post sul blog di Google da Martin Pelikan, Giles Hogben, e Ulfar Erlingsson del team Sicurezza e Privacy della società di Mountain View.
Abbiamo anticipato che Google effettua la analisi per ogni app presente nel Google Play Store al fine di comprendere come gestisce privacy degli utenti e quanta sicurezza puo’ avere. Successivamente, ogni app analizzata viene confrontata con altre app con caratteristiche simili. La creazione di gruppi di app simili consente a Google di delineare quale è il comportamento medio di ciascuna app, cosi’ da stabilire dei confini per stabilire se un’app si puo’ considerare pericolosa o intrusiva. Questo processo consente di individuare applicazioni che raccolgono o inviano dati sensibili senza necessità chiara e rende più facile per gli utenti trovare applicazioni che forniscono le funzionalità giuste e rispettano la loro privacy.
Ad esempio, la maggior parte delle applicazioni che consentono di aprire ebook non hanno bisogno di conoscere la posizione precisa di un utente per funzionare e questo può essere stabilito analizzando altre applicazioni dello stesso genere; quindi, se una app pre la lettura di ebook chiede l’accesso al GPS, Google puo’ considerarla ‘pericolosa’. Al contrario, le applicazioni di mappatura e navigazione devono conoscere la posizione di un utente e richiedono spesso l’accesso al sensore GPS.
Il modo piu’ semplice per creare gruppi di app simili è creare un insieme fisso di categorie e assegnare ciascuna applicazione ad una o più categorie, ad esempio ‘Strumenti’, ‘Produttività’ e ‘Giochi’. Secondo Google, tuttavia, le categorie cosiddette ‘fisse’ sono troppo generiche per monitorare le numerose distinzioni nell’insieme di applicazioni mobili disponibili nello store, e andare manualmente ad analizzare ciascuna app è qualcosa di impensabile, oltre che essere un compito che Martin Pelikan, Giles Hogben, e Ulfar Erlingsson hanno definito "noioso e sbagliato". Per risolvere questo problema, Google ha sviluppato un algoritmo di apprendimento profondo (deep learning) per raggruppare applicazioni mobili con funzionalità simili.
L’approccio che utilizza Google sfrutta il deep learning per identificare gruppi di applicazioni con funzionalità simili utilizzando metadati, quali descrizioni di testo e metriche raccolte dagli utenti come ad esempio il numero di installazioni. Quindi i gruppi di app vengono utilizzati per identificare eventuali segnali anomali e potenzialmente dannosi legati alla privacy e alla sicurezza, dalle autorizzazioni richieste di ciascuna applicazione e dai suoi comportamenti osservati. La correlazione tra i diversi gruppi di confronto e i segnali sulla sicurezza aiutano a decidere quali applicazioni promuovere e determinare invece quali applicazioni meritano un’attenzione più attenta dagli esperti ‘umani’ in materia di sicurezza e privacy. Google attraverso i risultati dell’algoritmo utilizzato aiuta inoltre gli sviluppatori di app a migliorare la privacy e la sicurezza delle loro applicazioni.
Per ulteriori informazioni sugli sforzi di Google per rilevare e combattere le applicazioni potenzialmente dannose (PHA) su Android, è possibile consultare il sito Classifications for Potentially Harmful Applications gestito dal Team di Android sulla Sicurezza.