Un article sur le pouce, parce que j’ai lu un tas d’aneries sur le sujet, et pas grand monde qui évoque le fond du sujet.

Google est passé en HTTPS (S pour secure, SSL) et ne fournit plus les mots clés.
Yahoo est passé en HTTPS et certains sites ne recoivent plus le referer, donc plus les mots clés ni la provenance du traffic.
Bing va passer en HTTPS, idem.

La question à 2 balles: qui fait bien, qui se plante ?
Je lis partout que le grand et magnanime Google a , dans sa tanière de hacker aux ailes blanches, trouvé un moyen de contourner le bonz, et fait tout bien quand le méchant Yahoo met tout le monde dans la mouise en cachant le referer.

Mise au point, explication de texte.
Internet repose sur des formats ouverts, des protocoles que tout le monde, même si on s’appelle Grande gueule, est censé respecter.
Dans un échange avec un site SSL (url en HTTPS), rien ne filtre. Un observateur sait que votre machine parle avec tel domaine, mais ne peut lire ni le contenu, ni l’url même du document demandé.
Dans un échange HTTP, tout est en clair.

Dans les specs d’internet, il est notifié, volontairement et par mesure de sécurité, qu’un navigateur qui passe d’un site HTTPS à un site HTTP ne DOIT PAS laisser filtrer de referer.
Dans le cas contraire, ce qu’on essaye de cacher/protéger via SSL « fuit » quand on sort. c’est interdit, volontairement, par conception.

Dans le cas de Yahoo, c’est ce qui se passe.
HTTPS(Yahoo) => HTTP (Votre site) : plus de referer (et c’est dans le referer que passe le KW)

Ce n’est pas Yahoo qui a viré quoi que ce soit. C’est le navigateur des visiteurs qui a fait ce qu’il est censé faire.
La parade dépend de vous, pas de Google ni de Yahoo ou d’un navigateur spécifique : passez votre site en SSL.
HTTPS(Yahoo) => HTTPS (Votre site) : referer et kw ok , tout le monde est content.

C’est prévu comme ça, ça marche comme ça, tout va bien.

Maintenant, le cas Google.
Qu’est ce qu’il a fait ?

Google piétine les protocoles internet et joue à ça :
HTTPS (Google) => HTTP (page google qui filtre ce qu’il veut bien) => HTTP ou HTTPS (votre site)

1- Google passe par une page interne qui filtre des datas. Il enlève les datas qu’il veut, quand il veut, pour qui il veut.
2- que le site final soit en https ou pas, on passe par une page http, on colle un référer Google, on envoie sur le site.

Ici, le filtre est le fait, volontaire, de Google.
De plus, quand on passe de google (https) à votre site, le referer fuit (contraire aux règles).

D’un coté (Yahoo, Bing), on a donc un effet de bord des protocoles internet, que chacun peut corriger pour son site s’il s’en donne la peine.
De l’autre (Google), un opérateur qui décide de filtrer ce qu’il veut et de laisser fuir des informations qui ne devraient pas voir le jour.

Tweeter !
Partager sur Facebook
Plus sur Google+

Update: Ca marche dans les deux sens: Pensez que si vous passez votre site en SSL, vous récupèrerez les referer de tous les sites https qui vous envoient du traffic (surprises possible), mais que vos liens sortants vers des sites http ne laisseront plus fuir le referer. Dans certains cas, c’est gênant: par exemple si vous apportez du traffic à un autre site, qui du jour au lendemain ne vous trouve plus dans ses referer… il peut avoir du mal à comprendre.
La seule solution: HTTPS everywhere !

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *


Ce blog est désormais dofollow, mais je sabre allègrement les liens et commentaires sans substance.