谷歌浏览器插件
订阅小程序
在清言上使用

Corpus de registres différents pour le développement d’un aligneur d’unités polylexicales

Claire Lemaire,Jean-Philippe Guilbaud

Lexique(s) et genre(s) textuel(s) : approches sur corpus(2020)

引用 0|浏览0
暂无评分
摘要
Comment trouver des données exprimant les mêmes concepts dans des registres de langue différents ? Après un essai infructueux d’extraction terminologique à partir de corpus comparables spécialisés dans le domaine du médical dans trois langues différentes (anglais, allemand, français), l’idée est d’ajouter pour chaque langue des sous-corpus du registre vulgarisé afin d’y détecter des relations de synonymie. Or ce type de ressources n’existe pas pour l’allemand de spécialité dans le domaine du médical. Nous présentons la constitution d’un corpus de 400 000 mots en allemand dans le domaine de la cancérologie, subdivisé en deux sous-corpus de même taille. À partir d’équivalents en allemand du mot-clé «cancer du sein», nous avons recueilli pour un premier sous-corpus, des textes qui s’adressent à des patientes (et des patients) ou à leurs familles, et pour un second sous-corpus, des textes qui s’adressent à des médecins ou des chercheurs en médecine.
更多
查看译文
关键词
corpus,de
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要