Courte réponse à une question posée par un collègue développeur à la suite d’une discussion sur le bienfondé de l’utilisation des CDN externes.
Question qui revient régulièrement : le profiling commercial, qu’est-ce que c’est ?
C’est le fait de collecter un grand nombre de données sur les internautes et d’établir sur eux un profil qui servira à leur envoyer de la publicité ciblée. C’est une spécialité de Google, Facebook et compagnie.
Le problème des CDN “gratuits” (et surtout ceux de Google, même si ils s’en défendent) ainsi que des systèmes de stats (et de toute resource venant d’un domaine externe comme les boutons Facebook, Pinterest…) c’est que qu’ils permettent aux boîtes qui contrôlent le serveur externe de savoir que t’es allé sur tel site, que t’as visité tel page, et donc d’enrichir ton profil commercial.
C’est impossible à détecter côté client car même si tu bloques les cookies, il est possible d’utiliser des heuristiques assez performantes pour identifier de manière fiable un internaute. En gros le système de Google détermine qu’une connexion avec la même IP, le même navigateur, les mêmes plugins… correspond à une personne unique et lui génère une empreinte. Ensuite c’est assez simple de savoir que la dite personne (via son empreinte) a visité le site A chargeant sont jQuery via Google Hosted Libraries, le site B qui utilise Google Analytics et le site C qui a un bouton “+1”), on enrichi son profil commercial, et quand il arrive sur le site D qui balance du AdWords, on sait qu’il aime la bière et les frites donc on essaie de lui vendre une place pour un match de Lens.
C’est plus ou moins comme ça que fonctionne Criteo mais aussi et surtout Adwords et les pubs de “pages” Facebook.