Laurentiu Aurelian Apostol
Automatic contradiction detection in clinical trial proposal documents.
Rel. Paolo Garza, Luca Anselma. Politecnico di Torino, Corso di laurea magistrale in Data Science And Engineering, 2024
|
Preview |
PDF (Tesi_di_laurea)
- Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives. Download (1MB) | Preview |
Abstract
Questa tesi riguarda il rilevamento automatizzato di incongruenze nei documenti di proposta di trial clinici, concentrandosi specificamente sulle contraddizioni tra tabelle e testo a loro associato. Il lavoro è motivato dal collo di bottiglia rappresentato dal processo di approvazione dei trial clinici, dove incongruenze nei documenti possono portare a respingimenti e richieste di correzione, aumentando notevolmente i tempi di approvazione. Operando entro i limiti imposti da un dataset ristretto, file non in formato “machine readable”, risorse computazionali contenute e un dominio specializzato, il risultato di questo progetto è una pipeline per il rilevamento delle contraddizioni tra tabelle e testo. Il sistema combina elaborazione OCR con l'intervento manuale, utilizza regole predefinite ed embedding semantici per l'identificazione del testo rilevante per ogni tabella e impiega una prompt chain per la classificazione delle contraddizioni.
Per affrontare la scarsità di esempi contraddittori, è stato sviluppato un processo di generazione di dati sintetici, creando versioni modificate di coppie tabella-testo non contraddittorie già presenti nel dataset
Relatori
Anno Accademico
Tipo di pubblicazione
Numero di pagine
Corso di laurea
Classe di laurea
Aziende collaboratrici
URI
![]() |
Modifica (riservato agli operatori) |
