La classificazione è uno degli obiettivi principali dell’analisi dei Big Data. In questo capitolo, presento la tecnica degli alberi decisionali. Ne riassumo, anzitutto, la logica di base e ne illustro, a partire da un semplice esempio, alcuni dettagli computazionali. Successivamente, utilizzando KNIME, una potente piattaforma user friendly per l’analisi dei Big Data, analizzo un dataset remoto su Amazon S3, mostro i principali risultati ottenuti e accenno ad alcune strategie più complesse d’analisi. Concludo il contributo con una panoramica sulle metriche e le tecniche più diffuse per valutare la bontà di un modello di classificazione e con un bilancio metodologico sulle applicazioni degli alberi decisionali nelle scienze sociali.
Trobia (2020). Gli algoritmi di classificazione per i Big Data e la loro valutazione. In S. Gozzo, C. Pennisi, V. Asero, & R. Sampugnaro (a cura di), Big Data e processi decisionali. Strumenti per l'analisi delle decisioni giuridiche, politiche, economiche e sociali (pp. 47-71). Milano : Egea.
Data di pubblicazione: | 2020 | |
Titolo: | Gli algoritmi di classificazione per i Big Data e la loro valutazione | |
Autori: | ||
Citazione: | Trobia (2020). Gli algoritmi di classificazione per i Big Data e la loro valutazione. In S. Gozzo, C. Pennisi, V. Asero, & R. Sampugnaro (a cura di), Big Data e processi decisionali. Strumenti per l'analisi delle decisioni giuridiche, politiche, economiche e sociali (pp. 47-71). Milano : Egea. | |
Abstract: | La classificazione è uno degli obiettivi principali dell’analisi dei Big Data. In questo capitolo, presento la tecnica degli alberi decisionali. Ne riassumo, anzitutto, la logica di base e ne illustro, a partire da un semplice esempio, alcuni dettagli computazionali. Successivamente, utilizzando KNIME, una potente piattaforma user friendly per l’analisi dei Big Data, analizzo un dataset remoto su Amazon S3, mostro i principali risultati ottenuti e accenno ad alcune strategie più complesse d’analisi. Concludo il contributo con una panoramica sulle metriche e le tecniche più diffuse per valutare la bontà di un modello di classificazione e con un bilancio metodologico sulle applicazioni degli alberi decisionali nelle scienze sociali. | |
Settore Scientifico Disciplinare: | Settore SPS/07 - Sociologia Generale | |
Appare nelle tipologie: | 2.01 Capitolo o Saggio |
File in questo prodotto:
File | Descrizione | Tipologia | Licenza | |
---|---|---|---|---|
Big data (Trobia).pdf | Versione Editoriale | Administrator Richiedi una copia | ||
Big data (Trobia)_compressed-1-20.pdf | prima parte | Versione Editoriale | Administrator Richiedi una copia | |
Big data (Trobia)_compressed-21-34.pdf | seconda parte | Versione Editoriale | Administrator Richiedi una copia |