Data-Science

SQL Saturday Parma 2019 - Agenda online!

Sergio Govoni

SQL Saturday Parma 2019

L’agenda del SQL Saturday Parma 2019 è online!

L’evento si terrà sabato 23 Novembre 2019 presso le aule del Dipartimento di Ingegneria dell’Informazione dell’Università degli Studi di Parma.

L’agenda offre 4 track che erogheranno sessioni in parallelo per un totale di 24 ore di formazione gratuita su SQL Server, Data Science, Analytics e Microsoft Azure, suddivise nei seguenti track:

  • DevOps
  • Analytics and Visualization
  • Cloud
  • Data Science
  • Database Admin
  • Development

L’agenda è disponibile qui!

Creare una dashboard con Apache Zeppelin

Davide Mauri

Ho da poco rilasciato l’aggiornamento per rendere Apache Zeppelin 0.7 compatibile con SQL Server, Azure SQL ed Azure DW, ed è quindi un buon momento anche per descrivere come creare una dashboard con questo bellissimo prodotto, e fare un piccolo indice degli articoli che ho pubblicato a riguardo.

In realtà, al posto che un articolo, dato che si tratta di un breve tutorial ho pensato di creare un video per mostrare come fare. Trovate il video qui:

Utilizzare Apache Zeppelin con SQL Server

Davide Mauri

zeppelin

Apache Zeppelin é un “web-based notebook” che permette di eseguire query verso le piú disparate sorgenti dati, anzi Big Data, manipolando il risultato ottenuto per visualizzare tabelle o grafici, mixando il tutto anche con la possibilità di scrivere del markdown e poter organizzare lo spazio del notebook ridimensionando i paragrafi e trascinandoli dove si vuole. Ottimo, insomma, per creare dashboard al volo Ma non solo: personalmente lo trovo fantastico per lavorare sui dati in modo interattivo. Utilissimo chiaramente per chi si occupa di Data Science, è un ottimo strumento anche per tutti coloro che hanno “solamente” a che fare con i dati tutti giorni. Lo scopo di Apache Zeppelin, infatti, é quello di rendere possibile le attivita di

5 eBook su Data Science e dintorni!

Sergio Govoni

Segnalo 5 eBook che trattano aspetti relativi all’analisi dei dati orientata alla “Data Science”. Il download può essere eseguito riconoscendo all’autore il prezzo consigliato oppure un prezzo inferiore. Per valutare se l’eBook è di interesse, c’è la formula “Free Minimum”.

R Programming for Data Science

R Programming for Data Science

This book brings the fundamentals of R programming to you, using the same material developed as part of the industry-leading Johns Hopkins Data Science Specialization. The skills taught in this book will lay the foundation for you to begin your journey learning data science. See the packages below to obtain datasets, R code files, and video lectures.

R Tools for Visual Studio

RTVS-1

E’ stato finalmente rilasciato anche per R l’estensione di Visual Studio che, come per Python, permette di utilizzare questo linguaggio nella comodità dell’amato Visual Studio. L’annuncio, direttamente dal team di sviluppo, è qui:

Announcing R Tools for Visual Studio

mentre qui c’è la pagina dedicata:

R Tools for Visual Studio

e come ormai da prassi, il codice sorgente è disponbile su GitHub:

https://github.com/Microsoft/RTVS

Non fatevelo mancare, come ormai detto e ridetto più volte, R e Python sono linguaggi con cui, volenti o nolenti, dovremo aver a che fare. Meglio farlo nel modo migliore allora, no?

RStudio v0.99.878

Visto che ormai R è parte della piattaforma Microsoft, sia come server a sè stante con R Server, sia come parte dell’engine di SQL Server, penso sia utile riportare anche qui le news di questo mondo, almeno le più salienti.

E la prima è che è stato recentemente aggiornate l’IDE, ad oggi, per eccellenza per R, ossia R Studio. Qui tutti i dettagli

New Release of RStudio (v0.99.878)

e qui il download:

Microsoft Data Science Virtual Machine Aggiornata

Microsoft ha aggiornato la sua “Data Science Virtual Machine” aggiungendo l’ultimo nato in casa Microsoft, ossia Microsoft R Server

Qui i vari blog post che hanno annunciato la cosa (che in effetti è avvenuta un pò in sordina):

La VM è disponibile su Azure a questa pagina

Data Science Virtual Machine

e viene preinstallata con i seguenti software:

Data Science Virtual Machine

Davide Mauri

Come avrete intuito, Microsoft sta prendendo molto seriamente il tema della Data Science e Data Culture (il rilascio di Microsft R Server ne è un esempio) e, come da sua tipica visione, si sta assicurando che questi temi raggiungano il maggior numero di persone possibili.

Per tutti coloro che volessero iniziare a prendere confidenza con il mondo della Data Science e per chi invece è già avviato in questo mondo è disponibile la Data Science Virtual Machine, che in un sol colpo fornisce un ambiente di sviluppo ideale:

Data: The Big, The Science and The Lake

Davide Mauri

Big Data. Data Science. Data Lake. Il 2015 ha visto il consolidamento di molti nuovi termini nel mondo degli Analytics. Ma come spiegare ad un profano (quindi una qualsiasi persona che non abbia necessariamente una estrazione informatica) cosa sono esattamente e perchè sono così importanti? E come si incastrano queste novità all’interno di un ecosistema già esistente, come quello della Business Intelligence e dei Data Warehouse?

Per spiegarlo e renderlo immediatamente comprensibile, ho creato questo slide-deck “visuale”, parlando dei dati attraverso qualcosa che è molto più concreto e compresibile: le arance. Non esistate ad usarlo, l’ho usato più e più volte e funziona molto bene:

SQL Server & R: Data Science End-to-End Walkthrough

Davide Mauri

Con l’integrazione di R in SQL Server, si apre un mondo di possibilità per tutti coloro che vogliono/devono analizzare i dati per capire come poterli usare al meglio. Microsoft, per aiutare a capire come sfruttare questo enorme potenziali, ha creato un tutorial dedicato:

Data Science End-to-End Walkthrough

Questi i singoli step:

Tutti gli script usati sono disponibili su GitHub qui: