DataSkills è una realtà che opera a tutto campo nel mondo della data science

Caratteristiche del data mining

Concetti base del Data Mining

Descrizione
Il data mining utilizza tecniche analitiche per identificare pattern nascosti nei dati.

Il data mining può trattare:
  • Dati qualitativi
  • Dati qualitativi
  • Dati testuali
  • Immagini e suoni

Non richiede ipotesi a priori da parte del ricercatore, nemmeno sulla forma distributiva delle variabili.

E’ necessaria una buona conoscenza de business nel cui ambito si vogliono applicare le tecniche di data mining. Ciò consente la corretta valutazione e selezione dei dati di partenza rilevanti. Inoltre occorre aver pienamente compreso i requisiti e gli obiettivi che si vogliono raggiungere, al fine di poter interpretare nel modo corretto i risultati dei modelli.

L’analista e il sistema di data mining devono interagire al fine di produrre un modello valido. L’analista sceglie i dati da analizzare, configura il sistema di data mining e valuta i risultati. Il processo può essere ripetuto per affinare il modello.

Gli algoritmi sono ottimizzati per minimizzare i tempi di elaborazione anche in presenza di un numero elevato di osservazione e un numero elevato di variabili.

I software i data mining offrono propongono i risultati in forma semplice, anche attraverso l’uso di strumenti visuali che ne facilitano l’interpretazione.