Tout comme dans mon récent article où je reviens sur le vrai sens du terme "hacker", les termes de "Deep Web" et de "Dark Web" sont souvent utilisés à tord, parfois comme synonymes (ce qu'il ne sont pas).

Mon objectif est donc de vous donner une définition suffisamment simple mais précise pour que vous compreniez bien la différence entre ces deux espaces numériques.

Le Deep Web

La traduction litérale du "Deep Web" donne en français le "Web Profond", ce qui, vous allez voir, en dit long sur sa vraie nature.

On parle parfois aussi de "web invisible" (invisible web) ou de "web caché" (hidden web).

Si tous ces termes peuvent avoir une connotation un peu mystérieuse, ou sombre, ce qu'une coïncidence, car le Deep Web désigne simplement la partie du web standard qui n'est pas indexée par les moteurs de recherches classiques.

Pour les pages qui sont indexées, on parle parfois du "web de surface" (surface web).

Le contenu d'un site peut-être rendu indisponible aux moteurs de recherche pour de nombreuses raisons comme :

  • Les méta-données du site spécifient que certaines pages ne doivent pas être indexées
  • Le site requiert une authentification pour accéder aux données
  • Le contenu est payant
  • Le contenu est accessible uniquement après une intéraction spécifique (ex: page de remerciement de commande)
  • ...

Une bonne partie du Deep Web est constitué de contenus comme les réseaux sociaux, les blogs payants, les e-mails privés et les données bancaires (au travers des clients web), etc...

Il ne devrait donc pas y avoir de connotation illégale avec le Deep Web, ce dernier désigne seulement les informations rendues innaccessibles pour les moteurs de recherche.

D'après plusieurs estimations, le contenu du Deep Web représenterait entre 90 et 96% du web global, laissant donc seulement 4% aux moteurs de recherche.

Le contenu du Deep Web reste néanmoins accessible via une URL classique (nom de domaine ou une adresse IP).

Le Dark Web

Littéralement le "Web sombre" en français, le "Dark Web" désigne un ensemble de sites et ressources accessibles uniquement au travers de réseaux virtuels spécifiques forçant l'anonymisation de ses utilisateurs.

Il tient son nom des nombreuses activités illégales prenant place en son sein, notamment la pédo-pornographie, la vente de matériels et produits illégaux, de logiciels malveillants et autres services plus ou moins sombres.

Attention, même si une grosse partie du Dark Web est en lien avec des affaires illégales, c'est aussi un outil utilisé par des communautés politiques dissidentes souhaitant garder leur anonymat vis à vis de leurs gouvernements.

Le "Dark Web" est consistué de plusieurs réseaux différents, ayant chacun leur fonctionnement, on parle alors de "Dark Nets", le plus connu étant TOR (The Onion Routing).

L'anonymisation au sein de ces réseaux se fait notamment grâce à la navigation "peer-to-peer" (ou pair à pair en français), pour afficher un site sur le Dark Web, un client devra envoyer une requête qui passera de nombreux noeuds du réseaux avant d'arriver au serveur web.

Chaque noeud ne connaissant que le noeud précédent et suivant, le serveur web final ne connaitra donc pas l'adresse du client et inversement, en y ajoutant le fait que chaque message est encrypté et découpé, la communication y reste anonyme, tant que l'utilisateur n'y fourni pas de données personnelles de son plein gré.

Le dark web est donc innaccessible pour les moteurs de recherche classiques, son contenu fait donc partie du deep web.

On pourrait comparer ce réseau à un VPN, la différence étant que les serveurs intermédiaires d'un VPN appartiennent à la même entité et l'utilisateur n'est pas à l'abris que des logs soient gardés sur ces derniers, tandis que chaque utilisateur d'un Dark net devient un noeud du réseau et ne connait qu'une partie des données (chiffrées).

Les URLs pour accéder à un site du Dark Web sont différentes car elles ne sont pas réglementées par l'ICANN, par exemple pour le réseau TOR, les adresses se terminent en .onion.

En général, on accède au Dark web (en tout cas à l'un des réseaux qui le compose) grâce à un navigateur spécialisé (TOR Browser par exemple), mais il est possible d'utiliser un navigateur classique si l'on ajoute un proxy du réseau cible rattaché à des URLs particulières (comme *.onion).

Cette dernière méthode n'est néanmoins pas recommandée car l'éditeur du navigateur pourrait éventuellement avoir accès aux données de navigation finales si cette fonctionnalité est disponible dans le navigateur en question.

Conclusion

Le "Dark web" est une sous-partie du "Deep web" car son contenu n'est pas indexable, mais il est loin de représenter l'entièreté du "Deep web".

Pour donner une image : une chaise est un meuble, mais tous les meubles ne sont pas des chaises, ici c'est la même chose, le "Dark web" fait partie du "Deep web", mais l'inverse n'est pas vrai.

J'espère que cet article vous aura plu, et à bientôt sur le blog !

À propos de l'auteur

Hello, je suis Nicolas Brondin-Bernard, ingénieur web indépendant depuis 2015 passionné par le partage de d'expériences et de connaissances.

Aujourd'hui je suis aussi coach pour développeurs web juniors, tu peux me contacter sur nicolas@brondin.com, sur mon site ou devenir membre de ma newsletter pour ne jamais louper le meilleur article de la semaine et être tenu au courant de mes projets !


Photo par Uriel SC sur Unsplash