Analisi Predittiva con Naive Bayes Classifiers

La classificazione Bayesiana è una tecnica statistica con la quale si determina la probabilità di un elemento di appartenere a una certa classe. Per esempio, questa tecnica può essere impiegata per stimare la probabilità di un cliente di appartenere alla classe dei compratori di tablet PC, dati alcuni attributi del cliente quali: il tipo di lavoro svolto, l’età, il reddito, lo stato civile, ecc.

La tecnica si basa sul teorema di Bayes, matematico e ministro presbiteriano britannico del diciottesimo secolo. Il teorema definisce la probabilità condizionata (o a posteriori) di un evento rispetto ad un altro.

L’algoritmo naïve bayesian classifier assume che l’effetto di un attributo su una data classe è indipendente dai valori degli altri attributi. Tale assunzione, chiamata indipendenza condizionale delle classi, ha lo scopo di semplificare i calcoli e proprio per questo l’algoritmo prende il nome di “naïve”. Quando tale assunzione è vera nella realtà, l’accuratezza dell’algoritmo è paragonabile a quella dei decision tree e delle reti neurali.

L’algoritmo possiede i seguenti punti di forza:

– Lavora bene in caso di “rumore” nei dati.
– Tende a non considerare gli attributi irrilevanti.
– Il training del modello è molto più semplice rispetto ad altri algoritmi.

Il rovescio della medaglia è rappresentato dall’assunzione dell’indipendenza degli attributi, che può non essere presente nella realtà.

Leggi l’articolo completo Naive bayes classification

Alessandro Rezzani

Sono un consulente senior nell’ambito della Business Intelligence, specializzato in analisi di Big Data e tecniche di Analisi Predittiva. Nel 2016 ho fondato Dataskills, presto diventata azienda di riferimento nel territorio italiano per soluzioni di Data Science. Sono anche ricercatore e professore presso l’Università Bocconi di Milano.
Leggi la mia Biografia

Iscrivi alla newsletter





Dichiaro di aver letto ed accetto l’informativa sulla privacy

Alessandro Rezzani

Sono un consulente senior nell’ambito della Business Intelligence, specializzato in analisi di Big Data e tecniche di Analisi Predittiva. Nel 2016 ho fondato Dataskills, presto diventata azienda di riferimento nel territorio italiano per soluzioni di Data Science. Sono anche ricercatore e professore presso l’Università Bocconi di Milano.
Leggi la mia Biografia