Hadoop

Azure Data Lake e U-SQL

Davide Mauri

Grande novità in campo Big Data annunciata nei giorni scorsi durante l’AzureCon 2015. La novità è Azure Data Lake un servizio che mette insieme tutto quello che serve per creare una soluzione Big Data iper-scalabile nel cloud: HDInsight, Hadoop, Spark, Storm HBase e, novità assoluta, U-SQL un nuovo linguaggo per manipolare in modo distribuito i dati.

L’idea è quella di permettere ai Data Scientists di potersi focalizzare sui problemi da risolvere piuttosto che perdere tempo a mettere in piedi Hadoop & Co. che, per chi ha provato, è un lavoro tutt’altro che semplice e veloce. La cosa sembra in effetti in sovrapposizione con HDInsight e le varie VM con distribuzioni di Hadoop stesso, ma questo servizio ha qualcosa in più, come vedrete tra brevissimo.

Hortonworks HDP 2.3 Sandbox disponibile su Azure

Davide Mauri

Hortonworks ha reso disponibile su Azure la Sandbox utile per iniziare a prendere confidenza con l’enorme mondo di Hadoop. Se prima era necessario scaricarsi la VM ed eseguirla on-premises, ora è possibile fare tutto direttamente da Azure, ed avere la VM pronta in pochi minuti:

Hortonworks Sandbox with HDP 2.3 is now available on Microsoft Azure Gallery

E’ in questo modo veramente semplice iniziare a muovere i primi passi con Spark, ad esempio, e provare a creare una soluzione Big Data e/o un Modern Data Warehouse. Oppure, perchè no, provare l’integrazione di Hadoop con SQL Server tramite Polybase.

Data Science: 60 (!!!) libri gratis

Davide Mauri

Ok, sembra uno dei quei post dal titolo esagerato usato solo per attrarre qualche click. Quando ho letto l’articolo ero *molto* scettico. Ed invece è vero. Ben 60 (sessanta!) libri completamente gratuiti dedicati ai temi della Data Science:

  • Big Data
  • Data Science
  • Data Mining
  • Machine Learning
  • Python
  • R
  • Hadoop

Qui il link:

http://www.kdnuggets.com/2015/09/free-data-science-books.html

PS

Non ho ancora provato tutti  link, ma un campione significativo….ed in effetti tutti mi hanno portato alla versione PDF free del libro.

Introducing Microsoft Azure HDInsight

Sergio Govoni

Il blog di Microsoft Press ha annunciato la pubblicazione di un altro eBook gratuito: Introducing Microsoft Azure HDInsight.

Trovate tutti i dettagli in questo post.

Se volete sapere cosa significa realmente “Big Data” e quali sono i vantaggi che la vostra organizzazione può trarre usando questa fonte di informazioni, leggete questo eBook!

Buona lettura!