En discutant avec mes amis et ma famille, je me suis aperçu qu'il y avait un mythe autour du smartphone et des assistants vocaux qui plane depuis quelques années maintenant, et qui s'accroche encore fermement dans l'esprit des gens.

Google et Apple nous écouteraient-ils au travers de nos smartphones ?

Vous l'avez sûrement déjà entendu, la fameuse phrase : "L'autre jour j'ai parlé d'une nouvelle tondeuse et Google s'est mis à m'afficher des pubs de tondeuse, sans que je fasse la moindre recherche !"

Alors : mensonge, déformation involontaire de la réalité ou écoute à grande échelle ?

Réponse : rien de tout ça !

Pourtant, nos smartphones peuvent nous écouter, ils sont en capacité physique de le faire, notamment avec les assistants vocaux à qui on donne tous les droits, alors pourquoi ne le feraient-ils pas ?

Nous allons découvrir cela ensemble.

Les limitations techniques

Si les géants de la téléphonie devaient sauvegarder l'entièreté des conversations audio de tous les téléphones du marché dans leurs datacenters afin de faire tourner des algorithmes de reconnaissance du langage, les volumes de données générées seraient colossaux.

Mais surtout, la pertinence des informations récoltées est si faible que le cout de l'opération ne serait, à l'heure d'aujourd'hui, impossible à rentabiliser (pour de la publicité).

De plus, si ces données étaient belles et bien envoyées sur des serveurs distants, n'importe qui serait en mesure de voir sa consommation de données mobiles ou wifi exploser, car de la donnée sonore exploitable serait aux alentours de 1Mo par minute.

1Mo par minute donnerait une consommation de donnée de 1,44Go par jour pour 1 téléphone.

D'ailleurs des tests ont été fait pour voir si certains téléphones écoutent en dehors des assistants vocaux, la réponse est non.

Why phones that secretly listen to us are a myth
A mobile security firm carries out a research investigation to test the popular conspiracy theory.

Quid de l'écoute en local ?

Et si nos téléphones nous enregistraient et effectuaient une détection de mots-clés en local ? Cela résoudrait le problème du stockage pour Google en même temps de résoudre le fait de consommer de la bande passante à l'utilisateur.

Et par la même occasion d'être plus "discret".

Même si la théorie est alléchante, la réalité est plus complexe, faire tourner un algorithme de reconnaissance vocale sur un téléphone pose de nombre limite :

  • Le modèle de machine learning complet que fait tourner Google sur ses serveurs pèse 100Go (rien que pour le modèle).
  • La consommation de batterie serait énorme
  • La capacité de calcul serait suffisant pour faire des reconnaissances de mots-clés précis, mais pas de phrases complexe

C'est d'ailleurs pour cette raison que chaque assistant vocal possède son propre mot-clé de déclenchement fixe (OK Google, Alexa, Dis Siri,...) car seul le modèle mathématique de détection de ce mot-clé bien précis est compilé et utilisé en local par le téléphone, pour optimiser la détection et éviter d'écouter dans le vide.

À noter que Google a déjà lancé des expérimentation de reconnaissance en local pour son assistant, mais cela ne fonctionne que sur les téléphones Pixel et en anglais uniquement.

Pourtant, ce ne sont pas ces limitations techniques qui sont derrière la raison pour laquelle Google ne vous écoute pas avec votre téléphone, et la raison est encore plus vicieuse.

La vraie raison

Google n'a pas besoin de vous écouter, car vous lui donnez déjà toutes les informations lors de votre navigation sur le web, et ce même sans que vous vous en rendiez compte.

Grâce à ses algorithmes de détections de pattern affinés depuis des dizaines d'années, chacune de vos recherches et de vos actions sur internet contiennent un sens caché sur vous qui en dit en réalité plus long sur vos intentions, vos désirs et qui vous êtes.

"Les étapes pour vendre un appartement", "Frais de notaire", "Comment cloturer un jardin" : en trois recherche à quelques mois d'interval, vous avez donné la possibilité aux entreprises de publicité qu'il y a 80% de chances que vous ayez vendu votre appartement pour acheter une maison.

Si vous êtiez en appartement, il y a de fortes chances pour que vous n'ayez pas encore de tondeuse... La suite est logique.

Et plus encore, Google va mettre en relation toutes les recherches des gens dans votre foyer grâce à votre adresse IP commune, donc vous pouvez avoir des pubs ciblées, croisées avec les recherches de quelqu'un d'autre !

Sachez que c'est avec ces mêmes modèles de détection de pattern que Facebook peut deviner les cycles menstruels des femmes qui parcourent le site avec une précision de 96% (alors que c'est une information plutôt très intime).

Ad targeting by menstrual cycle at Facebook
Facebook is testing timing ads to its female users’ menstrual cycles. The social network’s data scientists have uncovered that women are more likely to buy fashion items during ovulation. Facebook…
Evidemment c'est un exemple parmi tant d'autres.

Le message que je veux faire passer ici c'est que votre historique de navigation et de recherches contient en réalité beaucoup plus de données implicites que vous ne le pensez, et leur pertinence est bien plus grande que vos conversation de tous les jours.

Voilà pourquoi Google n'a pas besoin de nous écouter, nous lui donnons déjà tout, sans le faire exprès.

Conclusion

Cet article n'a surtout pas vocation à vous dire de faire confiance les yeux fermés aux géants du numérique mondiaux, et que des systèmes d'écoutes ne seront jamais mis en place, ce serait fou que de l'affirmer.

En revanche les mythes et légendes sont prones à nous faire oublier les bonnes informations qui sont parfois plus sournoisement cachées : "Votre recherche internet est bien plus précieuse pour Google que vos discussions entre amis".

Les articles les plus populaires du blog

Envie de continuer à lire des articles autour du développement web (entre autres) ? Voici la sélection des articles de mon blog les plus lus par la communauté !

Voir la sélection 🚀

Recevez les articles de la semaine par e-mail pour ne rien manquer !

S'abonner à la newsletter 📧

À propos de l'auteur

Hello, je suis Nicolas Brondin-Bernard, ingénieur web indépendant depuis 2015 passionné par le partage d'expériences et de connaissances.

Aujourd'hui je suis aussi coach pour développeurs web juniors, tu peux me contacter sur nicolas@brondin.com, sur mon site ou devenir membre de ma newsletter pour ne jamais louper le meilleur article de la semaine et être tenu au courant de mes projets !


Photo par Thomas Kolnowski sur Unsplash