Comparaison de la précision : SEMrush vs SimilarWeb
Publié: 2022-04-12L'une des pratiques d'analyse marketing les plus courantes est l'analyse comparative du marché. Supposons que votre équipe marketing soit à 5 points de pourcentage de la réalisation du plan. Si le marché au cours de la période en question a diminué de 15 %, votre équipe marketing a peut-être encore affiché un résultat positif. Mais si le marché a augmenté du même volume, votre marketing ne va pas si bien.
Il existe de nombreux outils pour l'analyse comparative des concurrents. Chacun d'eux collecte des données de trafic et les traite cependant différemment. Et vous ne pouvez pas vous attendre à une précision à 100% de leur part. Compte tenu de cela, quels outils sont suffisamment précis pour que vous puissiez utiliser les résultats pour effectuer une analyse significative ?
Nous avons mené des recherches pour savoir à quel point deux analyseurs de trafic populaires - SEMrush Traffic Analytics et SimilarWeb - sont précis. Comme base de comparaison, nous avons utilisé les données des comptes Google Analytics de 787 sites Web anonymisés observés par OWOX BI.
Avant de partager nos résultats, examinons comment fonctionnent les services d'analyse du trafic.
Où SEMrush et SimilarWeb obtiennent des données
SimilarWeb utilise les sources de données suivantes :
- Données directes des propriétaires de sites Web
- Données de partenaires et de fournisseurs d'accès Internet avec des millions d'utilisateurs
- Sources de données publiques : technologies brevetées et mécanismes d'indexation qui analysent en permanence les données publiques
- Données de panel anonymisées des extensions de navigateur sur les sites Web visités
Les rapports SEMrush Traffic Analytics sont également basés sur des données anonymisées recueillies auprès de sources tierces et traitées à l'aide d'algorithmes d'intelligence artificielle. Ces données sont collectées et approximées sur la base de données comportementales anonymisées sur des millions d'internautes.
Au cours des 10 dernières années, SEMrush a lancé quelques outils qui révèlent non seulement des données sur les positions de recherche des concurrents, mais également ce que font les concurrents dans leur recherche payante, leurs relations publiques, leur marketing de contenu et leurs médias sociaux, ainsi que des données détaillées sur le trafic de leur site Web. SEMrush utilise les sources de données les plus pertinentes pour chaque sphère marketing (SEO, PPC, contenu, SMM).
Comment nous avons comparé les services et calculé la précision
SEMrush et SimilarWeb peuvent être utilisés pour évaluer les concurrents, les prospects et le trafic généré par les partenaires. Comme nous avons accès aux données anonymisées de Google Analytics des utilisateurs d'OWOX BI, nous avons supposé que nous disposions de données raisonnablement précises sur les visiteurs d'un certain nombre de sites Web anonymisés. Nous avons ensuite comparé les données fournies par SEMrush et SimilarWeb pour ces mêmes sites Web anonymisés avec les données de Google Analytics. Notre tâche était de décrire les inexactitudes dans des domaines d'activité particuliers et de voir leur importance pour chaque service.
L'échantillon de données
Notre échantillon était composé de données collectées à partir de Google Analytics, SEMrush et SimilarWeb pour toutes les sessions de janvier 2020 sur chacun des 787 sites Web. Ces sites Web sont basés en Australie, au Canada, aux États-Unis, au Royaume-Uni et en Allemagne et ont été regroupés par domaine d'activité :
- Informatique, électronique et technologie
- Divertissement
- La finance
- Santé et beauté
- Emplois et scolarité
- Actualités et médias
- Services professionnels
- Détail
- Télécom
- Voyage
Approche de comparaison
Pour connaître la précision des calculs de trafic des concurrents par SimilarWeb et SEMrush, nous avons fusionné les données suivantes dans un seul tableau :
- Données Google Analytics anonymisées de 787 sites Web avec plus de 100 000 visiteurs par mois selon OWOX BI
- Données sur le trafic de ces mêmes sites Web selon SEMrush et SimilarWeb
Nous avons exclu les sites Web à faible trafic qui pourraient être causés par des filtres pour les propriétés.
Ensuite, nous avons calculé la valeur absolue des écarts entre les données fournies par SEMrush et SimilarWeb par rapport à Google Analytics.
Comme les écarts pouvaient être positifs ou négatifs et que seule la précision nous intéressait, nous avons utilisé la valeur absolue. Cela nous a également évité une erreur potentielle avec des calculs dans lesquels des valeurs positives et négatives pourraient aboutir à zéro.
Ensuite, nous avons segmenté nos sites Web par nombre de sessions par mois :
- 100 000 – 500 000
- 500 001 – 1 000 000
- Plus de 1 000 000
Résultats de recherche
Plus l'écart type est élevé, plus l'inexactitude des données du service donné est importante, mesurée par rapport à la référence Google Analytics. L'écart pour SimilarWeb se situait entre 57 % et 61 % et n'était pas corrélé aux volumes de trafic du site Web. Les données SEMrush ont montré une tendance claire : les sites Web avec d'énormes volumes de trafic (1 000 000 sessions ou plus) ont montré une plus grande précision et un écart plus faible (45 %) par rapport aux données de Google Analytics.

Pour les sites Web avec 500 000 sessions ou plus, les chiffres étaient de 9 à 12 points de pourcentage plus précis dans SEMrush. Pour les projets à faible trafic, SimilarWeb fonctionnait légèrement mieux, mais les deux services présentaient de grandes inexactitudes parmi ce groupe de sites Web.

Ces différences de précision sont causées par les algorithmes de collecte et de traitement de SimilarWeb et SEMrush ainsi que par des aspects particuliers des données de parcours de navigation. Les services d'analyse du trafic utilisent des algorithmes d'intelligence artificielle et d'apprentissage automatique pour approximer les données sur tous les visiteurs du site Web en fonction des données de flux de clics, qui sont des données sur des échantillons de trafic du site Web. Ainsi, plus le site Web est petit, moins les approximations basées sur les données de parcours sont précises.
Que faire si votre site Web et les sites de vos concurrents ont un faible trafic et que la précision de vos données est extrêmement faible ? Dans ce cas, vous devez vous comparer à des concurrents plus importants sur votre marché. Si vous comparez certains grands acteurs du marché, vous verrez non seulement leurs performances, mais également les tendances générales du marché. Et en comparant les performances et les tendances révélées par SimilarWeb ou SEMrush avec vos propres réalisations, vous pourrez constater l'efficacité de votre marketing.
Le graphique ci-dessous décrit la part des observations - le pourcentage de sites Web au sein de chaque segment pour lesquels SimilarWeb et SEMrush étaient respectivement plus proches du benchmark de Google Analytics. Par exemple, dans le segment des plus d'un million de sessions, SEMrush a fourni des données plus précises que SimilarWeb pour 57 % des sites Web analysés :

En comparant le segment de 100 000 à 500 000 sessions dans les graphiques Écart type et Part des observations, nous découvrons un aperçu intéressant : les données SEMrush ont un écart type plus élevé, ce qui nous indique que les approximations de session sont généralement moins précises. Dans le même temps, SEMrush est toujours plus précis dans 53% des cas. Pour faire court, SEMrush fait moins d'erreurs, mais les erreurs qu'il commet ont tendance à être massives.
La précision des données dépend de plusieurs facteurs :
- Comment Google Analytics est configuré, quelles pages ont des balises GA et ce que mesurent exactement ces balises.
- Le degré d'activité du site Web sur Google. Pour un site Web de redirection comme celui d'un réseau publicitaire ou d'un site Web promotionnel avec un trafic publicitaire payant massif, SEMrush affichera des chiffres inférieurs.
- Quelle est l'importance de la part du trafic organique pour le site Web. SEMrush est probablement plus précis pour les sites avec une plus grande part de trafic organique.
- La région et le monde des affaires. Supposons que SEMrush ait plus de projets aux États-Unis. Dans ce cas, il disposera de plus de données provenant des États-Unis et les calculs pour les sites américains seront plus précis.
Les deux graphiques suivants illustrent l'écart type et la part de données plus précises des deux services segmentés par domaine d'activité.
Comme vous pouvez le constater, la déviation de SEMrush et de SimilarWeb dépend de la sphère commerciale :

Le pourcentage de sites web pour lesquels SimilarWeb et SEMrush se sont rapprochés du benchmark Google Analytics dépend également de la sphère métier :

Par exemple, dans le domaine informatique , SimilarWeb était plus précis pour 58 % des sites Web et SEMrush était plus précis pour 42 % des sites Web (la première colonne du graphique ci-dessus).
Ce graphique à points montre les valeurs d'écart positives et négatives pour SEMrush (points bleus) et SimilarWeb (points verts) :

Même visuellement, vous pouvez conclure que la partie inférieure du graphique a plus de points verts, ce qui signifie que SimilarWeb est plus susceptible d'afficher des valeurs inférieures aux données de trafic réelles de Google Analytics.
Pour résumer
Nous avons trouvé que:
- La précision de SimilarWeb et de SEMrush est similaire.
- SEMrush a montré de meilleurs résultats pour les sites Web de taille moyenne. Les erreurs étaient rares, et si les erreurs étaient évitées, les données étaient plus précises.
- Dans le segment des plus d'un million de sessions, SEMrush était plus précis que SimilarWeb.
- SimilarWeb est plus susceptible de sous-estimer les volumes de trafic.
Ce qu'il est important de retenir, c'est que ni SimilarWeb ni SEMrush ne vous garantissent une précision à 100 %. Pour analyser vos propres données de site Web, vous disposez de Google Analytics. Mais SimilarWeb et SEMrush suffisent pour comparer indépendamment les sites Web et reconnaître les tendances. Cependant, lorsque vous utilisez un outil d'analyse, vous devez comprendre l'origine des données collectées et les écarts de mesures.