Définition : TF*IDF

TF*IDF est l’initiale de « Term Frequency * Inverse Document Frequency ».

Il s’agit d’un ratio ou indicateur qui met en relation la fréquence d’un mot dans une page web (Term frenquency) et sa plus ou moins grande rareté dans l’ensemble des pages web rencontrées (Inverse Document Frequency). La prise en compte du TF*IDF permet d’aller au-delà d’un « simple » indice de densité de mot clé.

Le TF*IDF est donc un indicateur de la pertinence d’une page sur une thématique donnée et est utilisé en regard de la requête saisie par un Internaute.