谷歌浏览器插件
订阅小程序
在清言上使用

Pré-screening Et Études De Faisabilité : L’apport Des Entrepôts De Données De Cliniques

Revue d'épidémiologie et de santé publique(2019)

引用 0|浏览12
暂无评分
摘要
Le projet ONCOSHARe (« ONCOlogy big data SHAring for Research ») vise à démontrer, au sein du cancéropôle Grand Ouest, la valeur ajoutée des données de cancérologie centrées patient pour la recherche. Nous proposons d’améliorer le recrutement dans les études d’oncologie via eHOP, un Entrepôt de données cliniques (EDC), pour faciliter le pré-screening. L’automatisation du pré-screening pose trois difficultés : l’extraction des critères d’éligibilité (CE), l’extraction d’entités cliniques depuis les comptes rendus (CR) textuels, l’export des données vers un standard de réutilisation. Nous avons abordé ces problèmes au travers d’études cliniques d’onco-pneumologie du registre d’OncoBretagne et de l’EDC du CHU de Rennes. Les CE en texte libre ont été convertis en requêtes, les variables impliquées ont été décrites. Lorsque ces variables n’étaient pas structurées au sein d’eHOP, elles étaient extraites des CR à l’aide d’algorithmes de Traitement automatique du langage (TAL) qui ont été évalués par rapport à une extraction manuelle. Les données étaient exportées dans un format standardisé. La conversion des CE en requêtes révèle certaines limitations : certains ne pouvaient être évalués (ex : compliance), devaient être réévalués à l’inclusion (ex : biologie standard), étaient trop ambigus ou trop spécifiques. Au total, 361 CE au sein de 49 études ont été convertis en 464 requêtes, impliquant 23 variables distinctes. Dix variables n’étaient pas pertinentes pour le pré-screening, 4 étaient déjà structurées dans l’EDC. Le TAL a permis l’extraction des codes morphologiques CIM-O (rappe : 97,8 %, précision : 100 %), du score OMS (rappel : 100 %, précision : 100 %), du TNM (rappel : 98,0 %, précision : 97,6 %) et du stade (rappel : 99,7 %, précision : 97,5 %). Les données étaient exportées aux formats OSIRIS et OMOP common-data-model. La conversion des CE en requêtes demeure complexe. En attendant l’adoption d’un standard structuré, leur conversion manuelle semble inévitable. Les principales variables d’éligibilité ont été extraites d’eHOP vers un standard de réutilisation, sur lequel les requêtes sont exécutées. Nous avons décrit un pipeline complet, de l’intégration des données dans l’EDC à leur réutilisation pour le pré-screening.
更多
查看译文
关键词
Oncologie,Entrepôt de données,Pré-screening,Etude de faisabilité,Traitement automatique du langage
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要