Python

#DataWeekender 2022 CU5

DataWeekender è una conferenza online la cui prima edizione si è tenuta a Maggio 2020 durante il lockdown imposto a causa della situazione generale causata da Covid-19. L’intenzione originale era quella di organizzare una conferenza online sulla Microsoft Data Platform, per la community, per colmare il vuoto lasciato dall’annullamento degli eventi di persona a causa di Covid-19.

Focalizzata sull’intera Data Platform di Microsoft, quest’anno si terrà sabato 14 maggio 2022 con una vasta gamma di argomenti come Python, SQL Server, PowerShell, PowerBI, TempDB, Microsoft Azure e molto altro ancora, l’agenda completa è disponibile a questo link ed è suddivisa in 6 track che erogheranno sessioni in parallelo per un totale di 40 sessioni della durata di 1 ora e due serie di Lightning talks, 9 in totale, della durata di 10 minuti l’uno.

New book: Extending Power BI with Python and R

Sergio Govoni

Segnalo la pubblicazione del libro Extending Power BI with Python and R scritto dall’amico e collega MVP Luca Zavarella che sicuramente avete avuto il piacere di conoscere!

I temi trattati nel libro forniranno ai lettori le competenze per rispondere a questa domanda “Cosa è possibile fare in Power BI con Python e R che non è già possibile con le funzionalità standard di Power BI?”.

Come sapete, sono sempre le idee a far muovere le azioni e l’idea di Luca, per questo libro, è stata quella di scrivere un testo che andasse oltre il solito elenco di caratteristiche tecniche da aggiornare magari nella seconda edizione del testo.

Python Tools for Visual Studio

Davide Mauri

Python-LogoInformazione non freschissima ma comunque importante da sottolineare, visto anche il crescente interesse verso la Data Science in ambito Microsoft, come evidenziato anche all’evento del Technical Cloud Day in cui l’interesse per Machine Learning & Co. è stato veramente molto alto.

Come sottolineato anche durante l’evento suddetto, Python, insieme ad R, rappresenta uno dei linguaggi “must” della Data Science (ci starebbe, in effetti, un post dedicato…me lo appunto!) ed è quindi importante segnalare che a Dicembre 2015 Microsoft ha rilasciato un aggiornamento (2.2.31124.00) per Python Tools for Visual Studio (PTVS) che permette di usare Python con Visual Studio, l’IDE per eccellenza:

Data Science Virtual Machine

Davide Mauri

Come avrete intuito, Microsoft sta prendendo molto seriamente il tema della Data Science e Data Culture (il rilascio di Microsft R Server ne è un esempio) e, come da sua tipica visione, si sta assicurando che questi temi raggiungano il maggior numero di persone possibili.

Per tutti coloro che volessero iniziare a prendere confidenza con il mondo della Data Science e per chi invece è già avviato in questo mondo è disponibile la Data Science Virtual Machine, che in un sol colpo fornisce un ambiente di sviluppo ideale:

Che algoritmo è meglio usare?

Davide Mauri

Una delle domande più comuni nel mondo della Data Science riguarda la tipologia di algoritmo migliore, e quindi da usare, per risolvere un certo problema.

Qui viene riassunta, tramite una pratica matrice, una risposta molto completa a questa domanda:

Which Algorithm Family Can Answer My Question?

Molto utile per iniziare a capire come muoversi, in modo molto pratico e “business oriented” in questo grande mondo.

Un altro articolo simile, ma più semplice, quindi adatto a chi vuole avere una visione ancor più ad alto livello è questo:

SSIS Dashboard: Community Project!

Davide Mauri

L’anno scorso ho pubblicato su GitHub un progetto dedicato alla creazione di una Dashboard per SQL Server Integration Services (dalla versione 2012 in avanti). L’idea è quella di utilizzare tutti i dati che sono disponibili nel database SSISDB e renderli fruibili in modo più

  • bello
  • user friendly
  • utile
  • web
  • mobile

La dashboard permette di vedere lo stato di esecuzione dei Package SSIS, monitorare alcuni indicatori fondamentali (ad esempio se i package stanno avendo problemi di memoria oppure i lookup hanno trovato dei dati duplicati nei propri dataset), oltre che di vedere l’andamento delle performance nel tempo (e di fare una semplicissima previsione sul futuro, per ora calcolata tramite una banale media mobile). E’ inoltre possibile vedere il dettaglio di esecuzione del package e di ogni suo task, e, chiaramente, verificare se ci sono stati errori o warning.

Data Science: 60 (!!!) libri gratis

Davide Mauri

Ok, sembra uno dei quei post dal titolo esagerato usato solo per attrarre qualche click. Quando ho letto l’articolo ero *molto* scettico. Ed invece è vero. Ben 60 (sessanta!) libri completamente gratuiti dedicati ai temi della Data Science:

  • Big Data
  • Data Science
  • Data Mining
  • Machine Learning
  • Python
  • R
  • Hadoop

Qui il link:

http://www.kdnuggets.com/2015/09/free-data-science-books.html

PS

Non ho ancora provato tutti  link, ma un campione significativo….ed in effetti tutti mi hanno portato alla versione PDF free del libro.