
La classificazione Bayesiana è una tecnica statistica con la quale si determina la probabilità di un elemento di appartenere a una certa classe. Per esempio, questa tecnica può essere impiegata per stimare la probabilità di un cliente di appartenere alla classe dei compratori di tablet PC, dati alcuni attributi del cliente quali: il tipo di lavoro svolto, l’età, il reddito, lo stato civile, ecc.
La tecnica si basa sul teorema di Bayes, matematico e ministro presbiteriano britannico del diciottesimo secolo. Il teorema definisce la probabilità condizionata (o a posteriori) di un evento rispetto ad un altro.
L’algoritmo naïve bayesian classifier assume che l’effetto di un attributo su una data classe è indipendente dai valori degli altri attributi. Tale assunzione, chiamata indipendenza condizionale delle classi, ha lo scopo di semplificare i calcoli e proprio per questo l’algoritmo prende il nome di “naïve”. Quando tale assunzione è vera nella realtà, l’accuratezza dell’algoritmo è paragonabile a quella dei decision tree e delle reti neurali.
L’algoritmo possiede i seguenti punti di forza:
– Lavora bene in caso di “rumore” nei dati.
– Tende a non considerare gli attributi irrilevanti.
– Il training del modello è molto più semplice rispetto ad altri algoritmi.
Il rovescio della medaglia è rappresentato dall’assunzione dell’indipendenza degli attributi, che può non essere presente nella realtà.
Leggi l’articolo completo Naive bayes classification
Leave A Comment