¿En qué consiste una canalización de datos?

Realizar una integración de datos pasa por cuatro acciones críticas que tienen lugar en una canalización de datos. Se empieza con unos datos sin tratar para, en última instancia, producir información e ideas de utilidad práctica.

Ver ahora

Uso de machine learning para calidad de datos

Aprenda cómo están cambiando los big data la metodología CD. Los big data han convertido el machine learning (ML) en mayoritario y, del mismo modo que la CD ha condicionado el ML, el ML también está afectando la metodología de aplicación de la CD.

Ver ahora

Escribir y leer datos en HDFS

En este tutorial, genere datos aleatorios y escríbalos en HDFS. A continuación, lea los datos desde HDFS, ordénelos y muestre el resultado en la Consola.

Ver ahora

Diferencias entre ETL y ELT: Definir la diferencia

La diferencia entre ETL y ELT depende de dónde se transforman los datos en business intelligence y cuántos datos se retienen en almacenes de datos operativos. Descubra qué entrañan estas diferencias en materia de business intelligence, qué enfoque se adapta mejor a su organización y por qué cloud lo está cambiando todo.

Ver ahora

El futuro de big data

Big data es el término comodín que describe la recopilación, análisis y empleo de cantidades ingentes de información digital para mejorar las operaciones. Están cambiando rápidamente la forma en la que vivimos, compramos y enfocamos nuestra vida diaria. Descubra que es big data y cómo darle un uso en su beneficio.

Ver ahora

Data lakes frente a almacenes de datos

Tanto los data lakes como los almacenes de datos se utilizan de forma generalizada para almacenar big data, pero no son términos intercambiables. Un data lake es un enorme conjunto de datos en bruto cuya finalidad no se ha definido todavía. Un almacén de datos es un repositorio de datos filtrados y estructurados que ya han sido procesados para una finalidad concreta.

Ver ahora

¿En qué consiste un data lake?

Un data lake es un repositorio de almacenamiento centralizado que contiene big data de varias fuentes en un formato sin procesar. Las ventajas del formato data lake están tentando a muchas organizaciones a deshacerse de sus almacenes de datos. Descubra en qué aspectos destacan los data lakes, por qué están ganando tanta fama y cómo empezar a crear uno.

Ver ahora

¿En qué consiste el machine learning?

El machine learning es una técnica que utiliza las probabilidades estadísticas para otorgar a los ordenadores la capacidad de «aprender» con el tiempo gracias a la exposición a diversos aportes externos.

Ver ahora