Data-Lake

Webinar: Implementare un'architettura Data Lake serverless con AWS

A febbraio ci sarà un altro webinar gratuito dello User Group Italiano di SQL Server, parleremo di come implementare un’architettura Data Lake serverless con AWS!

Chi parteciperà al webinar avrà modo di concentrarsi sui diversi aspetti della soluzione ovvero sulla parte di ETL implementata con AWS Glue, sulla configurazione del data lake eseguita attraverso AWS Lake Formation, su come eseguire query interattive con Amazon Athena e su Amazon QuickSight per la parte di business intelligence. Sarà una sessione introduttiva ma pratica, con diverse demo a supporto dei concetti teorici.

Webinars su Data Lake e U-SQL

Davide Mauri

L’argomento caldo del momento, il “Data Lake” è sempre più caldo e quindi Microsoft ha programmato una serie di webcast dedicati alla soluzione offerta da Azure rispetto all’esigenza di creare e sfruttare il concetto di “Data Lake”. Una buon riassunto per capire la differenza tra un Data Warehouse ed un Data Lake è questa, definita da SAS e direi che è piuttosto sensata:

edw-vs-data-lake-v2

Per aiutare sviluppatori, data scientists e “bi guys” a capire come utilizzare al meglio Azure Data Lake, sono stati programmati diversi webcast fatti direttamente dal team di sviluppo. Il primo, come annunciato, è già stato erogato, gli altri arriveranno prossimamente, a partire dal 2 Febbraio.

Microsoft Webcast "What is Azure Data Lake?"

Davide Mauri

data-lake-1

“Data Lake” è sicuramente una delle buzzword più in voga negli ultimi mesi, ed ora si aggiunge anche una tecnologia, su Azure, che ha proprio questo nome. Nel abbiamo già parlato qui, ma ora l’argomento diventa sempre più caldo quindi è bene rifrescarsi la memoria: per capire cosa offre Microsoft e come un Data Lake sia un oggetto fondamentale di un Modern Data Warehouse, potete participare (e ve lo consiglio caldamente) al webcast dedicato che si terrà il 19 Gennaio  2016:

Data: The Big, The Science and The Lake

Davide Mauri

Big Data. Data Science. Data Lake. Il 2015 ha visto il consolidamento di molti nuovi termini nel mondo degli Analytics. Ma come spiegare ad un profano (quindi una qualsiasi persona che non abbia necessariamente una estrazione informatica) cosa sono esattamente e perchè sono così importanti? E come si incastrano queste novità all’interno di un ecosistema già esistente, come quello della Business Intelligence e dei Data Warehouse?

Per spiegarlo e renderlo immediatamente comprensibile, ho creato questo slide-deck “visuale”, parlando dei dati attraverso qualcosa che è molto più concreto e compresibile: le arance. Non esistate ad usarlo, l’ho usato più e più volte e funziona molto bene:

Azure Data Lake e U-SQL

Davide Mauri

Grande novità in campo Big Data annunciata nei giorni scorsi durante l’AzureCon 2015. La novità è Azure Data Lake un servizio che mette insieme tutto quello che serve per creare una soluzione Big Data iper-scalabile nel cloud: HDInsight, Hadoop, Spark, Storm HBase e, novità assoluta, U-SQL un nuovo linguaggo per manipolare in modo distribuito i dati.

L’idea è quella di permettere ai Data Scientists di potersi focalizzare sui problemi da risolvere piuttosto che perdere tempo a mettere in piedi Hadoop & Co. che, per chi ha provato, è un lavoro tutt’altro che semplice e veloce. La cosa sembra in effetti in sovrapposizione con HDInsight e le varie VM con distribuzioni di Hadoop stesso, ma questo servizio ha qualcosa in più, come vedrete tra brevissimo.