Inversement, les mots rares, c`est-à

Transcription

Inversement, les mots rares, c`est-à
Inversement, les mots rares, c’est-à-dire les moins fréquents, ne présentent qu’un intérêt
limité et occasionnel (le mot “lanterne” est sûrement moins utile que le mot “temps”, par
exemple).
Un mot qui n’apparaît qu’une fois dans un texte s’appelle un hapax.
Il existe une loi mathématique (appelée loi de Zipf) qui montre que la fréquence des
mots d’un texte est inversement proportionnelle à leur rang. Cela signifie que, si l’on fait
un classement des mots d’un texte en utilisant leurs fréquences, on obtient la formule
suivante : rang d’un mot multiplié par sa fréquence = constante. Pour simplifier, le
centième mot sera cent fois plus rare que le premier.
En fait, cette loi n’est valable que si l’on ne tient pas compte des extrêmes (les mots les
plus fréquents et les mots les plus rares).
10.5. Lisibilité :
(notion qui s’exprime conventionnellement en degrés). Un texte écrit possède des
particularités de surface : des phrases longues, moyennes, ou brèves, des mots longs,
moyens, ou courts. Ces particularités d’ordre visuel déterminent la complexité du texte.
Des phrases très longues dotées de mots longs (comme chez Proust) offrent un degré de
lisibilité plus faible que des phrases brèves dotées de mots courts (comme les bandes
dessinées, ou les histoires pour enfants).
Cette notion de lisibilité est associée directement à la mémoire de travail, qui possède ses
propres contraintes. Par exemple, on considère en moyenne qu’une personne retiendra un
maximum de sept mots en mémoire immédiate : une phrase écrite de quatorze mots
p.82 sur 97