Laurentiu Aurelian Apostol
Automatic contradiction detection in clinical trial proposal documents.
Rel. Paolo Garza, Luca Anselma. Politecnico di Torino, Master of science program in Data Science And Engineering, 2024
|
Preview |
PDF (Tesi_di_laurea)
- Thesis
Licence: Creative Commons Attribution Non-commercial No Derivatives. Download (1MB) | Preview |
Abstract
Questa tesi riguarda il rilevamento automatizzato di incongruenze nei documenti di proposta di trial clinici, concentrandosi specificamente sulle contraddizioni tra tabelle e testo a loro associato. Il lavoro è motivato dal collo di bottiglia rappresentato dal processo di approvazione dei trial clinici, dove incongruenze nei documenti possono portare a respingimenti e richieste di correzione, aumentando notevolmente i tempi di approvazione. Operando entro i limiti imposti da un dataset ristretto, file non in formato “machine readable”, risorse computazionali contenute e un dominio specializzato, il risultato di questo progetto è una pipeline per il rilevamento delle contraddizioni tra tabelle e testo. Il sistema combina elaborazione OCR con l'intervento manuale, utilizza regole predefinite ed embedding semantici per l'identificazione del testo rilevante per ogni tabella e impiega una prompt chain per la classificazione delle contraddizioni.
Per affrontare la scarsità di esempi contraddittori, è stato sviluppato un processo di generazione di dati sintetici, creando versioni modificate di coppie tabella-testo non contraddittorie già presenti nel dataset
Relators
Academic year
Publication type
Number of Pages
Course of studies
Classe di laurea
Aziende collaboratrici
URI
![]() |
Modify record (reserved for operators) |
