Annotation de la cohérence dans un corpus de textes d’élèves d’école et collège

Bras Myriam, Vieu Laure

SHS Web of Conferences(2024)

引用 0|浏览0
暂无评分
摘要
Cet article traite de la question de la cohérence dans des productions écrites d’élèves d’école et collège. Le corpus analysé est issu du corpus RESOLCO, il est constitué de 36 textes d’élèves d’école primaire et de collège (CE2, 6ème et 3ème) produits selon une même consigne d’écriture, une tâche-problème demandant aux élèves la production d’un texte narratif impliquant la résolution d’anaphores de divers types. Il a été annoté dans le cadre du projet ECalm avec l’objectif d’analyser la cohérence à partir de l’identification de relations entre segments de texte. Le schéma d’annotation est basé sur la Segmented Discourse Representation Theory qui définit de façon formelle ce qu’est une représentation de discours cohérente. L’article présente la méthodologie de segmentation des textes en Unités de Discours Élémentaires et d’annotation en Relations de Discours et en problèmes de cohérence (incohérences locales, impossibilités d’inférer une Relation de Discours, ou impossibilités d’attacher la représentation d’un segment au reste de la représentation), réalisant une extension originale de la SDRT. L’analyse des annotations met en évidence une tendance à la baisse de ces trois types d’indicateurs, traduisant une progression de la cohérence du CE2 à la 3ème, avec un palier significatif entre le CE2 et la 6ème, à corréler avec un saut majeur de compétences rédactionnelles entre la fin du cycle 2 et la fin du cycle 3. La théorie, mise à l’épreuve ici pour la première fois sur des textes d’apprenants, se trouve ainsi validée empiriquement dans sa version étendue.
更多
查看译文
关键词
cohérence du discours,textes d’élèves,corpus annoté en relations de discours
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要