Che cos’è una pipeline di dati?

Il termine “pipeline di dati“, che in italiano significa letteralmente “conduttura per dati”, fa venire in mente appunto un grande tubo nel quale fluiscono i dati, e in effetti, a un livello base, è di questo che si tratta. L’integrazione dei dati è un must per l’azienda …

Guarda ora

Uso dell’apprendimento automatico per la qualità dei dati

Nel mio ultimo blog, ho evidenziato alcune delle problematiche della governance dei dati in relazione ai big data e come la qualità dei dati, Data Quality (DQ), ne sia una sua componente significativa. In questo blog voglio concentrarmi sul modo in cui i big data stanno cambiando …

Guarda ora

Guida per principianti all’elaborazione in batch

Che cos’è l’elaborazione in batch? L’elaborazione in batch è un sistema per eseguire elevati volumi di job sui dati di tipo ripetitivo. Il metodo in batch consente di elaborare i dati quando sono disponibili risorse di elaborazione sufficienti e con un’interazione minima o nulla da parte dell’utente. …

Guarda ora

Integrazione Big Data in Ogni Piattaforma Cloud

Non dovrai più scegliere quale piattaforma cloud utilizzare. La release Talend Summer ‘17 consente di utilizzare qualsiasi piattaforma cloud platforms. La tua architettura dati può lavorare su NoSQL, Big Data, cloud data warehousing, e storage. Da oggi potrai avere analitiche avanzate per I data scientists e gli …

Guarda ora

Talend Open Studio for Big Data per Principianti

Guarda questo webinar on-demand di 30 minuti per scoprire come puoi essere produttivo velocemente usando tool gratuiti, basati su Eclipse e open source.  Imparerai come: Scaricare e installare Talend Open Studio for Big Data Creare il tuo primo job per connettere Hadoop HDFSS A caricare i dati …

Guarda ora