Si la longueur moyenne des mots en français écrit est de 4 à 5 lettres, il serait faux de croire que la plupart des mots comportent 4 à 5 lettres. Une étude plus fine, grâce à un programme en Perl, me permets de montrer la répartition des mots selon leur nombre de lettres. On voit nettement que les mots de 2, 3, 4 et 5 lettres sont les plus fréquents, avec une nette dominance pour les mots de 2 lettres. C'est bien sûr la haute fréquence de "de" "la" "et" "le" "il","un", qui explique ce fait de langue (à eux seuls, ces six items pèsent entre 10% et 13% des corpus).
Il conviendrait donc, dans les manuels de lecture, de privilégier à la fois ces "petits mots" en raison de leur fréquence élevée, et les mots les plus courts (et toutefois fréquents) en raison cette fois de l'empan visuel (voir Pour un modèle de lecture).
Pour résumer, les manuels de lecture devraient présenter :
1) les petits mots les plus fréquents ;
2) essentiellement des mots de une à cinq lettres ;
3) des mots dont le choix permet la plus grande représentation du système phonologique du français (voir pour exemple le contenu du Test02 et ses justifications théoriques).