Andreino Garibaldi
Analisi del traffico di una rete wireless mediante algoritmi di estrazione di Itemset generalizzati = Analysis of traffic data in a wireless network by means of generalized Itemset extraction algorithms.
Rel. Tania Cerquitelli, Paolo Garza. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering), 2019
|
PDF (Tesi_di_laurea)
- Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives. Download (3MB) | Preview |
Abstract: |
L'attività di estrazione di itemset generalizzati è una tecnica di data mining ben consolidata che ha per obiettivo la scoperta della conoscenza nascosta nei dati analizzati a diversi livelli di astrazione, che è come dire aggregati secondo tassonomie costruite sui dati stessi. In tale modo è possibile recuperare a un più alto grado di astrazione quegli itemset che altrimenti, per la loro scarsa frequenza osservata, sarebbero eliminati nel processo di data mining. Tuttavia, i tradizionali itemset generalizzati non sempre e non tutti possiedono un vero valore aggiunto in quanto essi sovente esprimono semplicemente la medesima conoscenza già espressa dai loro discendenti estratti a più basso livello, costituendone pertanto una mera ridondanza. Tra i diversi metodi proposti per superare tale limite, uno è rappresentato dall’estrazione dei cosiddetti Maximal Expressive Generalized Itemset (Max-EGI), ovvero l’estrazione dei soli itemset ad alto livello che rappresentino dati non già ricompresi in alcuno dei loro discendenti frequenti a più basso livello. In questo lavoro sono stati analizzati e comparati i risultati dell’applicazione di questi metodi (tradizionale e Max-EGI) a dati reali sperimentali, costituiti dalla raccolta del traffico wireless della rete di ateneo e, inoltre, anche introdotte nuove misure di interesse per gli itemset. L’analisi ha mostrato la netta superiorità dell’innovativo Max-EGI extraction algorithm rispetto al tradizionale GENIO Algorithm per quanto riguarda la riduzione delle ridondanze, mentre non è apparso qualitativamente ragguardevole il suo apporto nella generazione di nuovi itemset espressivi. Per contro, il lavoro ha evidenziato le criticità insite nella definizione della tassonomia e dei criteri di discretizzazione di talune feature e i loro effetti sui risultati generati dagli algoritmi, proponendone gli opportuni emendamenti. |
---|---|
Relators: | Tania Cerquitelli, Paolo Garza |
Academic year: | 2018/19 |
Publication type: | Electronic |
Number of Pages: | 110 |
Subjects: | |
Corso di laurea: | Corso di laurea magistrale in Ingegneria Informatica (Computer Engineering) |
Classe di laurea: | New organization > Master science > LM-32 - COMPUTER SYSTEMS ENGINEERING |
Aziende collaboratrici: | UNSPECIFIED |
URI: | http://webthesis.biblio.polito.it/id/eprint/11537 |
Modify record (reserved for operators) |