.

Les données de compétition d’Adwords Keyword Tools sont-elles utilisables en SEO?

Publié le 20 mai 2009 par Jean

adwordsAdwords keyword tool est probablement l’outil de recherche de mots clés le plus populaire pour le référencement naturel et payant. C’est un outil puissant montrant des données relativement fiables pour estimer le volume de recherches effectuées chaque mois avec un mot clé. Cet outil donne aussi le niveau de compétition que se livrent les annonceurs du réseau Adwords pour ces mêmes mots clés. Cette dernière donnée peut-elle être utilisée pour estimer la compétition pour un mot clé dans un contexte de référencement naturel ? Je débattais de la question récemment avec mes collègues et j’ai décidé d’en avoir le coeur net.

La compétition pour un mot clé est une donnée très importante qui permet de savoir à quel point il sera difficile d’obtenir une position intéressante dans les moteurs de recherche. Viser un mot clé très populaire peut sembler attractif, mais il faut s’assurer que le site ait ce qu’il faut pour se positionner dans la première page des résultats de recherche pour espérer obtenir du trafic. La démarche d’Adviso est donc de balancer le volume de recherche et la compétition des mots clés en fonction du PageRank du site. Ainsi, seuls des sites à très haut PageRank peuvent espérer se positionner sur des mots clés très compétitifs comme « iPod ». Il serait préférable pour un site à plus faible PageRank de viser des mots clés moins compétitifs tels que « étui rose pour iPod vendu au Canada ».

Plusieurs facteurs expliquent la compétition pour un mot clé. Le premier est simplement sa popularité « naturelle ». Un mot comme « voiture » est très général et il est donc très probable qu’il se retrouve dans des milliers de site internet sans que les auteurs des sites aient vraiment eu l’intention de se positionner sur le mot clé en utilisant le SEO. Ce type de compétition peut être estimé simplement en faisant une recherche sur Google, le nombre de pages possédant le mot clé est inscrit à la mention « Résulats 1-10 sur un total de <nombre> pour <mot clé>. La popularité/compétition naturelle va décroître en fonction du nombre de mots clés présents dans la phrase de recherche (« internet » vs « consultant en marketing internet »).

resultats_21

Le deuxième facteur expliquant la compétitivité d’un mot clé se résume souvent à des facteurs monétaires : plus il y a d’argent à faire avec un mot clé, plus de sites seront optimisés pour ce dernier et plus il sera difficile pour un nouvel entrant de se positionner correctement. Ce deuxième type de compétition est aussi facile à déterminer en utilisant la commande allintitle dans Google. Cette commande permet de savoir combien de sites possèdent le mot clé dans la balise TITLE, l’élément le plus important en SEO. Il est certain que l’ensemble des sites possédant un mot clé dans leur balise TITLE n’ont pas nécessairement une intention SEO, mais c’est un bon point de départ pour estimer le nombre de sites qui ont fait des efforts minimums. C’est la donnée de compétition pour les mots clés la plus fiable à mon avis, et de celle d’une bonne partie de la communauté SEO. Il existe beaucoup d’autres outils permettant d’estimer la compétition pour un mot clé, mais ceux-ci sont généralement basés sur les deux facteurs cités ci-dessus.

allintitle_2
Ayant un bon bagage scientifique et sortant d’un cours de stats au MBA, j’ai décidé d’utiliser une approche statistique pour prouver mon point : une régression multivariée. Certain vont trouver que c’est un peu comme tuer une mouche avec un 12, mais cette approche permet d’éliminer les ambiguïtés et les divergences d’interprétation puisque les critères d’analyse sont généralement reconnus. Pour les non-matheux, cette méthode permet de savoir s’il y a une association entre un facteur et un autre (F-value), la force/confiance de cette association (P-value) et à quel point un facteur explique l’autre (R2). Mon échantillon consiste en 30 mots clés provenant de 3 secteurs ayant des volumes de recherche et une compétitivité très différente : assurance, moniteurs pour bébé et batteries pour cellulaire. Les facteurs explicatifs (X) utilisés sont : 1) La donnée d’ « advertiser competition » provenant de Adwords (sujet principal de l’étude) et  2) le volume de recherche donné par Adwords (pour déterminer si la compétition pour un mot clé serait directement fonction de la demande). Ces variables ont été opposées premièrement contre le nombre de sites compétiteurs déterminés par la commande « allintitle » et deuxièmement contre le nombre total de sites compétiteurs, pour des fins de vérification.

Les résultats sont les suivants : il n’y a pas d’association entre les données de « advertiser competiton » d’ Adwords et la compétitivité pour un mot clé d’un point de vue SEO (p=0.67). L’utilisation des données d’ Adwords pour déterminer la compétition pour un mot clé est donc à proscrire. C’est dommage, parce qu’il serait très simple de pouvoir utiliser les données d’Adwords plutôt qu’utiliser la commande allintitle pour valider des mots clés un par un. Une très forte association a cependant été détectée entre le volume de recherche et la compétition pour un mot clé (p<0.001), ce qui suggère simplement que plus un mot clé est en demande, plus il y aura des sites compétitionnant pour le trafic organique. Rien de vraiment surprenant ici. Le coefficient de détermination (R2=0.95) très élevé obtenu après une régression univariée montre aussi que 95% de la compétition est expliquée par le volume de recherche, ce qui fait que seulement 5% des mots clés peuvent être considérés comme « de niche » (haut volume de recherche/faible compétition). Fait intéressant, le comportement des annonceurs est différent en PPC comparativement au SEO puisqu’il y a peu d’association entre le volume de recherches  et l’« advertiser competition », ce qui suggère que les annonceurs d’Adwords sont davantage intéressés par leur retour sur investissement par clic plutôt qu’obtenir un simple volume de visiteurs.

Une des limites importantes de cette étude est qu’elle utilise un critère d’évaluation général pour développer une méthode pour trouver les aberrations statistiques que représentent par définition les mots clés de niche. Tout en gardant ce fait en perspective, je considère qu’il vaut mieux utiliser la commande allintitle pour mesurer efficacement la compétition des mots clés, même si cela représente davantage de travail. La validité et la qualité des données n’en seront que meilleures.

  • Twitter
  • Facebook
  • del.icio.us
  • LinkedIn
  • StumbleUpon
  • Digg

Tags: ,

6 réponses à “Les données de compétition d’Adwords Keyword Tools sont-elles utilisables en SEO?”

  1. Louis-Dominic Parizeau commente:

    Jean, peux-tu publier ton fichier source? Je serais curieux de voir les mots clés choisis et les données de compétition.

  2. Jean Thibaudeau commente:

    Salut Louis,
    voici mon dataset. http://www.jeanthibaudeau.com-a.googlepages.com/Competition.xlsx

  3. Jean-Sebastien commente:

    Salut Jean,
    Je crois que tu as sauté une étape dans ta régression et c’est notamment la sélection de variable. Le R carré sert à évaluer si les variables sélectionnées prédisent adéquatement le F(x) dans ton cas ton R carré ajusté est assez bas (0,61), surtout lorsque tu as que 3 prédicteurs. Je n’ai pas saisi ce que tu voulais prédire au juste. Est-ce le Advertiser competition, n KW ou la compétition ? Tu peux par contre évaluer la corrélation entre la compétion et le allintitle. Je serais intéressé par cette donnée, avec un échantillon plus grand ! ;)

    Pour ton modèle, j’aurais opté tout d’abord par des tests de sélection de prédicteurs tels que la méthode Stepwise qui teste plusieurs itération de modèle choisissant celui qui offre la R carré le plus élevé. J’aurais aussi testé l’interaction entre les prédicteurs. Lorsqu’ils sont hautement corrélés, ils nuisent à la robustesse du modèle. Dans le cas échéant, tu crées de nouvelles variables joignant les deux prédicteurs.

  4. John commente:

    Absolument d’Accord avec cet article!

  5. Jean Thibaudeau commente:

    @ JS
    R2: Utiliser le F est beaucoup plus approprié pour évaluer la qualité du modèle. Le R2 est utilisé ici pour déterminer quel pourcentage de la variabilité est mesuré par les variables.

    Je que je voulais prédire: Je ne cherchais pas à prédire quelque chose (dans le sens de créer un modèle, du moins, dans un premier temps). Mon objectif était plutôt de valider si les données de “Advertiser competition” étaient semblables au données de compétition de “allintitle”.

    Échantillon plus grand: C’est la réponse statistique universelle, mais elle demande des efforts conséquents. J’aurais cependant pu calculer ma power avant de faire l’étude, mais j’ai trouvé que c’était overkill pour un simple blog post. Mon attitude aurait été différente dans le cadre d’un vrai papier.

    Stepwise: Je ne suis pas fan de la méthode, surtout avec un faible nombre de variable.

    Interaction entre les prédicteurs: Bon point. C’est pourquoi j’ai fais des regréssions univariées avec chacun des prédicteurs vs variable dépendante (allintitle), avec sensiblement les mêmes résultats.

  6. Jean-Sebastien commente:

    AH! Je viens de comprendre! Pourquoi n’as-tu pas testé s’il y avait une différence significative entre deux échantillons dépendants (Advertiser competition VS allintitle) avec un Test-T ? Je serais tenté de croire que c’était le but de ton étude.

    Merci pour les précisions!

Ajouter un commentaire


 


Clicky Web Analytics