Définition : Test de similarité

Les tests de similarités sont principalement effectués par Google et d’autres acteurs pour détecter des contenus dupliqués sur Internet. Si lors d’un test le taux de similarité obtenu est trop élevé entre 2 textes alors Google va considérer qu’il s’agit de contenu dupliqué.

Les tests de similarités ont pour but d’alléger la gestion des index, d’éviter les doublons dans les pages de résultats, de détecter le plagiat et d’identifier les pratiques de black hat seo (notamment par le bais de la création de splogs).

Les pratiques de content spinning les plus avancées ont pour vocation d’industrialiser la production de contenus texte tout en évitant que les différents contenus apparaissent comme similaires et dupliqués. Les auteurs et logiciels de content spinning opèrent donc également des contrôle de similarité pour vérifier que les textes créés ne soient pas considérés comme du duplicate content.