谷歌浏览器插件
订阅小程序
在清言上使用

A CURATEd CATalog: Rethinking the Extraction of Pretraining Corpora for Mid-Resourced Languages.

Jorge Palomar-Giner, José Javier Saiz, Ferran Espuña, Mario Mina, Severino Da Dalt,Joan Llop,Malte Ostendorff,Pedro Ortiz Suarez,Georg Rehm,Aitor Gonzalez-Agirre,Marta Villegas

International Conference on Computational Linguistics(2024)

引用 0|浏览13
暂无评分
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要