Réseau de similarité

Dans les réseau ci-dessous, chaque nœud représente un des documents comparés (positionnez votre souris dessus pour afficher le nom de fichier en infobulle) et l'épaisseur du lien entre deux nœuds représente le nombre de séquences de quatre mots consécutifs communes entre deux documents (les couleurs sont attribuées aléatoirement et n'ont donc aucune signification).

Repérage d'intertextualité dans les documents

Dans chaque document, chaque mot en rouge correspond à une séquence d'au moins quatre mots consécutifs (avec les trois mots suivants) trouvée dans un autre document du corpus. Passez la souris sur un mot en rouge pour savoir dans quel(s) autre(s) document(s) ce mot et les trois suivants ont été trouvés.

La couleur rouge est d'autant plus pâle que la séquence de quatre mots a été trouvée fréquemment dans le corpus.