Guida definitiva ai Data Warehouse e ai Data Lake in Cloud

Ormai tutto il mondo gira attorno ai dati. Le aziende che riescono a utilizzare i loro dati nel modo più efficace sono quelle destinate ad affermarsi nell’attuale contesto competitivo. I dati indicano quali prodotti realizzare, quali modelli di business perseguire, quali esperienze creare per il cliente in …

Scarica ora

Perché gli strumenti ELT stanno arrestando il mercato dell’ETL

Le ricerche indicano che circa il 50% dei dati di business risiede nel cloud, un dato che testimonia l’importanza rivestita dalle sorgenti esterne per le imprese moderne. Le organizzazioni necessitano di strumenti altrettanto moderni per elaborare e integrare questi dati rapidamente in un arco di tempo commisurato …

Guarda ora

Che cos’è una pipeline di dati?

Il termine “pipeline di dati“, che in italiano significa letteralmente “conduttura per dati”, fa venire in mente appunto un grande tubo nel quale fluiscono i dati, e in effetti, a un livello base, è di questo che si tratta. L’integrazione dei dati è un must per l’azienda …

Guarda ora

5 best practice per i data lake davvero efficaci

In passato le aziende sceglievano i data warehouse per gestire, archiviare ed elaborare i dati raccolti. Ma l’avvento dei big data ha messo sotto sforzo questi sistemi, spingendoli ai limiti della loro capacità e determinando un aumento dei costi di archiviazione. Perciò alcune aziende hanno iniziato a …

Guarda ora

Definizione di trasformazione dei dati

Il crescente volume di dati offre alle aziende opportunità illimitate per prendere decisioni informate e migliorare i risultati. Ma come è possibile rendere più accessibili a tutti nell’azienda le informazioni riguardanti il business, i clienti e la concorrenza? La risposta è la trasformazione dei dati. Definizione di …

Guarda ora

Uso dell’apprendimento automatico per la qualità dei dati

Nel mio ultimo blog, ho evidenziato alcune delle problematiche della governance dei dati in relazione ai big data e come la qualità dei dati, Data Quality (DQ), ne sia una sua componente significativa. In questo blog voglio concentrarmi sul modo in cui i big data stanno cambiando …

Guarda ora

Guida per principianti all’elaborazione in batch

Che cos’è l’elaborazione in batch? L’elaborazione in batch è un sistema per eseguire elevati volumi di job sui dati di tipo ripetitivo. Il metodo in batch consente di elaborare i dati quando sono disponibili risorse di elaborazione sufficienti e con un’interazione minima o nulla da parte dell’utente. …

Guarda ora

Qualità dei big data

Soluzione open source per la gestione della qualità dei big data. Con l’avvento dei big data, gestire la qualità dei dati è diventato sempre più importante e complicato. Fortunatamente, grazie alla combinazione delle tecnologie di elaborazione distribuite open source di Hadoop e delle soluzioni di gestione dei …

Guarda ora

Scrittura e lettura di dati su file HDFS

In questo tutorial, genereremo dati casuali per poi scriverli su file HDFS. Quindi, passeremo alla lettura dei dati da file HDFS, al loro ordinamento e alla successiva visualizzazione del risultato nella console. In questo tutorial viene utilizzato Talend Data Fabric Studio versione 6 e un cluster Hadoop: …

Guarda ora

ETL ed ELT: principali differenze

La differenza tra ETL ed ELT sta nel luogo in cui i dati vengono trasformati e nella quantità di informazioni conservate nei data warehouse. Extract/Transform/Load (ETL), ovvero estrazione/trasformazione/caricamento, è un tipo di processo di integrazione che estrae le informazioni da sorgenti remote, le trasforma utilizzando formati e …

Guarda ora

Il futuro dei big data

All’inizio di questo secolo, con la diffusione di database relazionali, accesso pubblico al Web, Wi-Fi e altre tecnologie, lo studio e la gestione di enormi set di dati sono diventati una sfida reale e presente che necessitava di un nome. Nel luglio del 2013, il termine “big …

Guarda ora

Data lake e data warehouse

Con data lake e data warehouse si definiscono due soluzioni ampiamente utilizzate per l’archiviazione dei big data, tuttavia non si tratta di termini intercambiabili. Un data lake è un enorme insieme di dati grezzi il cui scopo non è ancora definito. Un data warehouse è un repository …

Guarda ora

Cloud Data Warehouse Trends per il 2019

Quanto un Cloud Data Warehouse (CDW) può aiutare le organizzazioni a prepararsi per la Digital Transformation? TDWI e Talend hanno intervistato 200 aziende e hanno scoperto che l’adozione dei Cloud Data Warehouse è il primo importante passo da intraprendere verso la Digital Transformation. I CDW offrono prestazioni …

Scarica ora

Rapporto O’Reilly: Trasferire Hadoop nel Cloud

Estratto gratuito del libro L’implementazione di Hadoop nel cloud pubblico non si limita al semplice noleggio di macchine. La scelta e la configurazione corretta di un servizio cloud ti aiutano a sfruttarne al meglio le funzionalità e la flessibilità per ottimizzare i tuoi progetti Big Data. Questa …

Scarica ora

Creare un vero data lake con un data warehouse nel cloud

Un’unica fonte di verità sicura, gestita e veloce In collaborazione con:   Questo eBook ti aiuta a capire tutte le potenzialità di un autentico data lake e i quattro pilastri necessari per supportarlo. La piattaforma data lake ideale è più ampia e approfondita che mai per offrire livelli …

Scarica ora

Integrazione Big Data in Ogni Piattaforma Cloud

Non dovrai più scegliere quale piattaforma cloud utilizzare. La release Talend Summer ‘17 consente di utilizzare qualsiasi piattaforma cloud platforms. La tua architettura dati può lavorare su NoSQL, Big Data, cloud data warehousing, e storage. Da oggi potrai avere analitiche avanzate per I data scientists e gli …

Guarda ora

Data Lakes: obiettivi, pratiche, modelli e piattaforme

TDWI ha chiesto ai professionisti che si occupano della gestione dei dati quali sono le 12 priorità per implementare con successo un data lake. Questo rapporto TDWI a cura di Philip Russom analizza i risultati del sondaggio. Con i giusti strumenti, un data lake offre l’accesso self-service …

Scarica ora

Modernizzare gli Operational Data Store con Hadoop

Gli Operational data stores (ODS) oggi gestiscono un maggior volume di dati, e supportano dati di diversa tipologia e varietà come mai successo in passato, pertanto gli utilizzi pratici possono essere molteplici. La chiave del successo di questo tipo di innovazione è l’utilizzo della piattaforma di innovazione …

Guarda ora

6 Trend Principali per gli IT Decision-Makers nel 2017

Nel 2016 metà della popolazione mondiale si è connessa ad internet* e il numero delle macchine connesse ha superato i 6.4 miliardi**. Questo porta ad una proliferazione di dati eterogenei provenienti da fonti differenti. In questo white paper, Bernard Marr dell’Advanced Performance Institute indica le opportunità e …

Scarica ora

Talend Open Studio for Big Data per Principianti

Guarda questo webinar on-demand di 30 minuti per scoprire come puoi essere produttivo velocemente usando tool gratuiti, basati su Eclipse e open source.  Imparerai come: Scaricare e installare Talend Open Studio for Big Data Creare il tuo primo job per connettere Hadoop HDFSS A caricare i dati …

Guarda ora

Analisi a Self-Service

Come ottenere il massimo dall’accesso ai dati Oggi le aziende sono sommerse dai dati, ma la maggioranza riesce ad analizzare solo un’infima parte delle informazioni raccolte. In questo report di O’Reilly, l’autrice Sandra Swanson esamina le seguenti tematiche: l’accesso ai dati offerto a più persone in tutta …

Scarica ora

Ottimizzare la Data Preparation per Business Analytics

Report TDWI Best Practices Gli utenti business vogliono il potere delle analytics senza il fardello della preparazione dei dati. Questo Report illustra come dei software innovativi stanno migliorando i processi di preparazione dei dati per utenti IT e business per aiutarli ad avere delle business analytics affidabili. …

Scarica ora