Cloaking – Définition et synonymes

Le cloaking est une technique d’optimisation des moteurs de recherche (SEO) dans laquelle le contenu présenté à l’araignée du moteur de recherche diffère de celui présenté au navigateur de l’utilisateur. Cela se fait en fournissant un contenu basé sur les adresses IP ou l’en-tête HTTP de l’agent utilisateur de l’utilisateur qui demande la page. Lorsqu’un utilisateur est identifié comme une araignée de moteur de recherche, un script côté serveur fournit une version différente de la page Web, une version qui contient du contenu non présent dans la page visible ou qui est présente mais non interrogeable. Le but du camouflage est parfois d’amener les moteurs de recherche à afficher la page alors qu’elle ne serait pas affichée autrement (Black Hat SEO). Cependant, il peut également s’agir d’une technique fonctionnelle (quoique désuète) pour informer les moteurs de recherche d’un contenu qu’ils ne pourraient autrement pas localiser car il est intégré dans des conteneurs non textuels tels que la vidéo ou certains composants Adobe Flash.

Depuis 2006, de meilleures méthodes d’accessibilité sont disponibles, y compris une amélioration progressive, de sorte que le cloaking n’est pas considéré comme nécessaire par les partisans de cette méthode.[who?] Le cloaking est souvent utilisé comme technique de spamdexing, pour essayer de tromper les moteurs de recherche en donnant au site concerné un meilleur classement; il peut également être utilisé pour inciter les utilisateurs de moteurs de recherche à visiter un site basé sur la description du moteur de recherche qui semble avoir un contenu sensiblement différent, voire pornographique.

Le camouflage est une forme de la technique de la page de porte.

Une technique similaire est également utilisée dans le répertoire Web du projet Open Directory. Il diffère de plusieurs manières du camouflage des moteurs de recherche:

  • Il vise à tromper les éditeurs humains plutôt que les araignées des moteurs de recherche informatiques.
  • La décision de masquer ou non est souvent basée sur le référent HTTP, l’agent utilisateur ou l’adresse IP du visiteur; mais les techniques plus avancées peuvent aussi se baser sur l’analyse du comportement du client après quelques requêtes de pages: la quantité brute, la commande et la latence entre les requêtes HTTP ultérieures envoyées aux pages d’un site internet, plus la présence d’un vérifier le fichier robots.txt, sont quelques-uns des paramètres dans lesquels les araignées des moteurs de recherche diffèrent grandement du comportement naturel de l’utilisateur. Le référent indique l’URL de la page où un utilisateur a cliqué sur un lien pour accéder à la page. Certains cloakers donneront la fausse page à quiconque provenant d’un site Web d’annuaire Web, car les éditeurs d’annuaire analysent généralement les sites en cliquant sur les liens qui apparaissent sur une page Web d’annuaire. D’autres cloakers donnent la fausse page à tout le monde sauf ceux provenant d’un moteur de recherche majeur; cela rend le camouflage plus difficile à détecter, sans leur coûter beaucoup de visiteurs, car la plupart des gens trouvent des sites Web à l’aide d’un moteur de recherche.

Point de vue du chapeau noir

De plus en plus, pour qu’une page sans popularité naturelle en raison d’un contenu convaincant ou gratifiant soit bien classée dans les moteurs de recherche, les webmasters conçoivent des pages exclusivement pour les moteurs de recherche. Il en résulte des pages avec trop de mots-clés et d’autres facteurs qui peuvent être « conviviaux » pour les moteurs de recherche, mais qui rendent les pages difficiles à utiliser pour les visiteurs réels. Par conséquent, les professionnels du référencement black hat considèrent le cloaking comme une technique importante pour permettre aux webmasters de diviser leurs efforts et de cibler séparément les araignées des moteurs de recherche et les visiteurs humains. Le cloaking permet une expérience utilisateur élevée tout en satisfaisant la concentration minimale de mots-clés nécessaire pour se classer dans un moteur de recherche.

Le cloaking IP fait référence à la possibilité d’envoyer le même e-mail plusieurs fois. Le cloaking IP est utilisé pour maintenir l’intégrité d’un jeton de messagerie et d’un serveur SendMail correspondant. Les e-mails par lots sont publiés avec d’énormes listes de diffusion. Étant donné que les adresses e-mail de la liste sont renvoyées en raison d’une erreur, l’adresse IP doit être randomisée pour éviter qu’elle ne soit marquée comme spam. Le cloaking IP est utilisé dans cette phase du blitz d’e-mails comme un outil pour construire une liste. Une fois qu’une liste est créée, l’adresse IP n’a plus besoin de cloaking car la liste contient de vraies adresses e-mail.

En septembre 2007, Ralph Tegtmeier et Ed Purkiss ont inventé le terme «mosaic cloaking» dans lequel les pages dynamiques sont construites comme des éléments de contenu et seules certaines parties des pages, javascript et CSS, sont modifiées, réduisant simultanément le contraste entre les pages. secrète et «conviviale» en augmentant la capacité de fournir un contenu ciblé à diverses araignées et visiteurs humains.

Cloaking versus livraison IP

La livraison IP peut être considérée comme une variante plus bénigne du camouflage, où un contenu différent est proposé en fonction de l’adresse IP du demandeur. Avec le camouflage, les moteurs de recherche et les gens ne voient jamais les pages de l’autre, tandis qu’avec d’autres utilisations de la livraison IP, les moteurs de recherche et les gens peuvent voir les mêmes pages. Cette technique est parfois utilisée par les sites riches en graphiques qui ont peu de contenu textuel que les araignées peuvent analyser.

Une utilisation de la livraison IP consiste à déterminer l’emplacement du demandeur et à fournir un contenu rédigé spécifiquement pour ce pays. Ce n’est pas nécessairement du camouflage. Par exemple, Google utilise la diffusion IP pour les programmes publicitaires AdWords et AdSense afin de cibler les utilisateurs dans différentes zones géographiques.

La livraison IP est une méthode grossière et peu fiable pour déterminer la langue dans laquelle livrer le contenu. De nombreux pays et régions sont multilingues ou le demandeur peut être un ressortissant étranger. Une meilleure méthode de négociation du contenu consiste à examiner l’en-tête HTTP Accept-Language du client.

Depuis 2006, de nombreux sites ont adopté la livraison IP pour personnaliser le contenu de leurs clients réguliers. Bon nombre des 1000 meilleurs sites, y compris des sites comme Amazon (amazon.com), utilisent activement la livraison IP. Aucun d’entre eux n’a été banni des moteurs de recherche car leur intention n’est pas trompeuse.