Big Data Analytics

In letteratura sono stati dimostrati gli enormi vantaggi che la sanità può trarre dall’applicazione delle tecniche di Big Data Analytics. La crescente disponibilità di dati in ambito sanitario ha evidenziato la necessità anche in tale contesto di soluzioni preformanti, evolute e dedicate, che siano capaci di gestire l’eterogeneità dei dati, sia provenienti da fonti certificate che non, e l’esigenza di trasformare questi ultimi in conoscenza. Tra i numerosi strumenti presenti nel contesto Big Data, è emersa la necessità di individuare framework che potessero garantire elevate prestazioni, scalabilità e disponibilità di librerie. Sono stati effettuati test comparativi in termini di velocità di elaborazione, occupazione CPU, memoria e dischi, banda di rete richiesta e scalabilità. A valle delle analisi e dei test condotti, si è optato per la scelta dei framework Apache Spark, MongoDB, Apache Hadoop e Spark SQL.

Sono state definite tecniche avanzate per il pre-processing di dati sanitari eterogenei, allo scopo di favorire l’integrazione, la correttezza e la trasformazione in aggregati da cui poter derivare informazioni consistenti e prive di errori. I dati, una volta che sono stati acquisiti dalla piattaforma, necessitano di una fase preliminare di data aggregation e mash-up, permettendo di ottenere soluzioni rapide ed affidabili per la loro memorizzazione in forma strutturata ed il loro allineamento, favorendo l’elaborazione delle interrogazioni e l’estrazione di informazioni.

Sono state approfondite le tecniche per la generazione di statistiche avanzate ottenute da Big Data e per la realizzazione di report complessi, che consentono di rappresentare graficamente le informazioni desiderate fornendo differenti viste relative alle misure di interesse. In particolare, le tecniche hanno permesso di:

  • Analizzare la totalità delle informazioni in conformità a dimensioni differenti e le aggregazioni trasversali (slicing).
  • Focalizzare ed estrarre una sezione avente particolare interesse (dicing).
  • Scomporre i dati nelle sue determinanti all’interno della stessa gerarchia (drill-down).
  • Scomporre il problema nelle sue determinanti passando da una gerarchia ad un’altra (drill-across).
  • Aggregare i dati.
  • Rappresentare il problema attraverso differenti approcci, quali: Basic Analytics per Insights, analisi fattoriale, analisi delle corrispondenze binarie e multiple.

 

Grande rilevanza è stata data alle tecniche di Intelligenza Artificiale che, attraverso l’analisi di grosse quantità di informazioni, sono in grado di fornire previsioni e realizzare analisi predittive (predictive analytics). Ciò fornisce ulteriori informazioni come, ad esempio, abitudini dei soggetti, analisi per cluster o tipologia, sino alle classiche informazioni legate ad aree geografiche, periodicità, categorie di individui, andamenti stagionali e così via. Gli approcci usati sono stati sia di tipo Deep Learning (reti convoluzionali e ricorsive e auto-encoders) che di tipo Machine Learning (Support Vector Machines e Clustering).

Un cruscotto intelligente, realizzato in linguaggio Javascript e con il tool Highcharts, permette anche ad un utente meno esperto di riuscire ad interrogare in maniera semplice i dati, per ottenere informazioni e statistiche avanzate relative a dati in ambito sanitario e allo stile di vita.

Il cruscotto offre la possibilità di ottenere in maniera molto semplice e intuitiva:

  • statistiche relative a dati di tipo wellness;
  • grafici sull’andamento dei parametri vitali e di wellness;
  • suggerimenti riguardanti lo stile di vita, basati sui dati storici raccolti;
  • navigazione multidimensionale delle statistiche, che permettono all’utente di visualizzare i dati aggregandoli lungo differenti dimensioni, di tipo temporale (giorno, mese, anno, ecc.), spaziale (comune, provincia, regione, zona, ecc.) e specifiche della popolazione (sesso, età, provenienza, etnia, ecc.);
  • analisi su stili di vita e terapie in corso, per estrarre correlazioni e formulare possibili nessi di causalità atti a formulare suggerimenti automatici riguardanti modifiche allo stile di vita;
  • identificazione di gruppi di persone che mostrano tratti sintomatologici simili, al fine di creare delle community per mettere in contatto persone con disturbi simili, per la condivisione di esperienze terapeutiche e consultazioni mediche.

bda4phr