Analyse du TEST01
Environnement : trigrammes.
Constat : à l'oral, 80% des syllabes en français sont ouvertes (c'est-à-dire terminées par une voyelle, comme " pa / ri " ) ;
20% sont fermées (c'est-à-dire terminées par une consonne, comme " par / mi " ).
Hypothèse : l'apprenti-lecteur, lorsqu'il est au stade pré-orthographique du décodage, commet des erreurs dans l'environnement de syllabe fermée CVC (consonne+voyelle+consonne), et tend à reproduire par hypercorrection la structure CV de la syllabe ouverte (consonne+voyelle, ou encore consonne+consonne+voyelle).
Si les résultats montrent une très nette tendance à commettre une erreur dans les syllabes fermées en les transformant en syllabes ouvertes (par exemple si un mot comme "quatorze" est lu "quatroze"), alors on pourra conclure qu'il s'agit non pas de hasard mais d'une rection idiophonologique dans l'acte de décodage.
L'analyse a été effectuée en répertoriant toutes les erreurs rencontrées (quelles qu'elles soient), puis à retenir celles qui sont en adéquation avec le sujet de cette étude (autrement dit les erreurs qui portent directement sur les trigrammes considérés, voir tableaux ci-dessous). Ensuite, chacune de ces adéquation a été observée : s'il s'agit d'une erreur du type CV+C > CVC (une syllabe ouverte lue comme une syllabe fermée) ou d'une erreur du type CVC > CV+C ou CCV(une syllabe fermée lue comme une syllabe ouverte), un point est attribué à la catégorie où s'effectue l'erreur.
L'ensemble de ce comptage est repris en sous-totaux, avec pourcentage.
Pour l'instant, j'ai répertorié 7482 erreurs, dont 18,82% en adéquation avec les trigrammes.
Dans 71,22 % des cas, on a effectivement une hypercorrection qui réduit une syllabe fermée à une syllabe ouverte.
Sur les 17 matrices (les 17 types de trigrammes), une seule possède un résultat opposé à mon hypothèse. Il s'agit de la matrice SAR, pour laquelle la structure en syllabe fermée est plus élevée. Il faudra tenter de comprendre ce contre-exemple...
En structure sous-jacente, on a donc le décodage suivant :
CVC > CV+C
ou bien
CVC > CCV
Nota : Mon hypothèse relève de l'existence de " schèmes phonotactiques ", et à ce titre j'ai traité les données avec des matrices, quelle que soit la consonne de substitution. Par exemple, que "quatorze" soit lu "quatroze" ou "quatloze", le mécanisme est le même, et comptera pour un point dans le trigramme "TOR". Ce n'est donc pas la consonne qui est importante, mais le fait que cela soit une consonne.
L'étude qui suit a porté sur la lecture du TEST01 à des enfants jeunes décodeurs. La transcription n'est pas phonétique, mais phonémique, et en alphabet ordinaire. Chaque transcription doit donc se lire comme un mot normal. Le "e" final, lorsqu'il est ajouté, signifie la présence d'un schwa. En revanche, il ne sera pas lu s'il existe déjà dans le mot (par exemple pour "cirée"). Cette notation est suffisante pour ce type d'étude, car il s'agit de répertorier des erreurs de lecture (substitutions, inversions, épenthèses) et non de transcrire fidèlement la prononciation. On est là au niveau phonologique.