DataSkills è una realtà che opera a tutto campo nel mondo della data science

Corporate Business Intelligence: la BI per aziende

La Business Intelligence ha un’architettura complessa, composta da molti elementi. Possiamo però identificare tre macro aree in cui raggruppare le categorie di elementi che compongono il sistema, come mostrato nella figura seguente:


  • Macro area dell’alimentazione dati
  • L’area dell’alimentazione dati ricomprende le fonti dati, il sottosistema ETL, il sottosistema di data quality e l’area di “staging” dei dati. Le categorie di strumenti che fanno parte di quest’area concorrono a fornire dati al data warehouse.

  • Macro area del data warehouse
  • Data warehouse e data mart sono i concetti chiave che costituiscono la seconda macro area. Il data warehouse concentra in sé il patrimonio dati aziendale ed è il punto di partenza per le attività di analisi.

  • Macro area dell’analisi
  • L’area analitica è costituita dagli strumenti OLAP, dai tool di reportistica e dashboarding, che costituiscono il front-end del sistema di BI, cioè il punto di contatto tra dati/informazioni e i loro utilizzatori.

ETL – Extract, Transform and Load

L’acronimo ETL (Extract, Transform and Load) è utilizzato per descrivere i processi con cui i dati sono estratti dai sistemi sorgente, sono poi trasformati attraverso operazioni di “pulizia”, uniformazione, formattazione e infine sono caricati all’interno del data warehouse.

Il Data Warehouse e i data mart

Il data warehouse è una base dati che contiene dati integrati, consistenti e certificati afferenti tutte i processi di business dell’azienda (o per lo meno alla maggior parte di essi) e che costituisce il punto di partenza per le attività analitiche che fanno parte della BI. Il data warehouse è formato dall’insieme dei dati provenienti dalle fonti operazionali, opportunamente trasformati , attraverso le procedure di ETL e controllati attraverso il sistema di data quality. Esso inoltre conserva la storia dei dati, fornendo l’evoluzione nel tempo di tutte le grandezze misurate. Accanto al data warehouse esiste un’altra forma di base dati orientata alle analisi: i data mart. Si tratta di database tematici, che riguardano un solo processo di business all’interno dell’azienda. Mentre esiste un unico data warehouse in azienda, i data mart sono molteplici. Le due teorie predominanti nel settore definiscono, l’una, il data mart come blocco di base per la costruzione del data warehouse, l’altra come una struttura derivata dal data warehouse.

OLAP

Le funzionalità di analisi multidimensionale messe a disposizione dai motori OLAP si collocano a metà tra il data warehouse e l’utente finale, fornendo a quest’ultimo una modalità intuitiva e performante per eseguire analisi sulla base dati. Le operazioni di navigazione che è possibile compiere su di un cubo OLAP sono raggruppabili nelle seguenti categorie:
  • Drill-down Le operazioni di drill-down consentono di passare da un livello di maggior aggregazione ad un livello di minor aggregazione: per esempio il drill down dei dati di vendita della regione Lombardia, mostrerebbe i dati a livello di provincia e, in seguito a livello di comune.

  • Roll-up. Il roll-up è l’operazione contraria al drill-down: con essa il grado di aggregazione aumenta.
  • Slicing e dicing. Con slicing si intende l’operazione di riduzione della dimensionalità (oppure del numero di elementi di una stessa dimensione) nel risultato di un’interrogazione multidimensionale. Nell’esempio della figura seguente il risultato è modificato togliendo i membri 2009 e 2010 della dimensione temporale.
Invece, con il termine dicing si intende il filtraggio dei dati tramite la definizione di un criterio: la figura che segue mostra un filtro sul mese e sulla categoria, che non cambia la forma del risultato, ma soltanto gli importi delle vendite.
  • Pivoting. Con il pivoting si scambiano le dimensioni presenti sulle righe con quelle sulle colonne, oppure si cambia l’ordine di visualizzazione, ottenendo una differente visualizzazione del risultato. L’operazione di pivoting aiuta l’analista a presentare il risultato in modi diversi, dando maggiore o minore enfasi alle dimensioni, oppure a sistemare i dati secondo una visualizzazione più consona allo scopo dell’analisi.
  • Drill-through. Il drill-through consente di ottenere il massimo dettaglio dei dati che hanno generato un certo aggregato. Nella figura seguente, osserviamo il drill-through delle vendite del 2011 per la regione Lombardia: come si nota il risultato dell’operazione consiste nell’elenco dei dati di dettaglio che hanno contribuito a formare la voce aggregata.

Gli strumenti di front-end

Con i termini front-end e back-end si intendono gli stadi iniziale e finale di un processo; nel mondo del software il front-end è la parte del sistema che gestisce l’interazione con l’utente, mentre il back-end elabora i dati generati dal front-end. Nel nostro caso, con front-end intendiamo la fase di presentazione dei dati all’utente finale e l’insieme degli strumenti informatici per realizzarla. Una volta che i dati sono stati raccolti, trasformati, integrati e salvati all’interno del data warehouse, occorre sfruttarli ai fini del processo decisionale. Lo scopo degli strumenti di front-end è proprio quello di garantire la fruizione dei dati e la loro evoluzione allo stato di informazione. Gli applicativi OLAP, con le loro componenti di navigazione dei cubi, fanno sicuramente parte degli strumenti di front-end; tuttavia, alcuni di essi, sono vere e proprie basi dati con formato multidimensionale e non soltanto una forma di presentazione. Gli strumenti di front-end sono classificabili nelle seguenti categorie, che si differenziano in base alle funzionalità, alla “user experience”, cioè alla percezione di usabilità, flessibilità, gradevolezza e al tipo di destinatari a cui si rivolgono:
  • Client OLAP
  • Report dinamici
  • Report statici
  • Ad-hoc reporting
  • KPI, Scorecard e Dashboard