Jacopo Dominici
Metodi di machine learning per caratterizzare i clienti aziendali = Machine learning methods to characterize business customers.
Rel. Gianluca Mastrantonio. Politecnico di Torino, Corso di laurea magistrale in Ingegneria Matematica, 2022
|
PDF (Tesi_di_laurea)
- Tesi
Licenza: Creative Commons Attribution Non-commercial No Derivatives. Download (4MB) | Preview |
Abstract: |
Nell’elaborato viene illustrato il progetto svolto nell’azienda Omicron Consulting s.r.l. per capire quali possono essere i loro possibili clienti. La ricerca dei potenziali clienti è una tematica molto importante per un’azienda. Per prima cosa permette a qust’ultima di evitare di proporre beni e servizi a tutte le aziende ma solo a quelle interessate. Grazie alla caratterizzazione dei possibili clienti è possibile capire su cosa basare l’offerta da parte dell’azienda aiutando così anche la sezione marketing poichè conoscendo a priori il target dei clienti è più facile indirizzare le strategie. Questo lavoro ha quindi l’obiettivo di fornire un punto di riferimento per l’azienda e consentire di ottimizzare tempo e risorse. L’analisi si è basata nell’individuare i possibili clienti tra le aziende situate nelle province di Torino, Milano e Roma che appartengono al settore di consulenza informatica e produzione di software. La tesi presenta un primo capitolo dove viene illustrata la parte iniziale del progetto, che tratta la raccolta dei dati e la gestione dei valori mancanti. Sono stati analizzati i metodi che consentono di gestire i valori mancanti, ovvero l’eliminazione dei record oppure l’imputazione del valore mancante. Nel dettaglio è stata utilizzata poi la tecnica dell’imputazione del dato mancante tramite modelli di regressione. Nel secondo capitolo viene riportata la cluster analysis con la quale sono state trovate e caratterizzate tutte le aziende che possono essere possibili clienti per l’azienda Omicron Consulting s.r.l. In questo capitolo troviamo la descrizione degli algoritmi di clustering K-Means e DBSCAN e il confronto dei risultati ottenuti con questi algoritmi tramite l’utilizzo degli indici Silhouette e Dunn. Una volta individuati i diversi gruppi di aziende simili tra loro è stato possibile individuare tra questi i gruppi composti da aziende che potranno essere possibili clienti o meno. Sono stati individuati come cluster dei possibili clienti quei cluster tale per cui la percentuale di aziende che sono clienti al loro interno supera un determinato target, dove il target scelto è pari alla percentuale di aziende che sono clienti all’interno dell’intero dataset. Infine nell’ultimo capitolo vengono illustrate le varie tecniche di classificazione e confrontati i risultati ottenuti con essi. Questo è stato fatto per classificare in futuro le aziende non presenti nel database come possibili clienti o meno. Sono stati analizzati nel dettaglio gli algoritmi Support Vector Machines, Regressione Logistica, Decision Tree e Random Forest, e confrontati i risultati ottenuti da essi tramite la curva ROC. |
---|---|
Relators: | Gianluca Mastrantonio |
Academic year: | 2022/23 |
Publication type: | Electronic |
Number of Pages: | 59 |
Subjects: | |
Corso di laurea: | Corso di laurea magistrale in Ingegneria Matematica |
Classe di laurea: | New organization > Master science > LM-44 - MATHEMATICAL MODELLING FOR ENGINEERING |
Aziende collaboratrici: | OMICRON CONSULTING Srl |
URI: | http://webthesis.biblio.polito.it/id/eprint/24867 |
Modify record (reserved for operators) |