Wie Talend den Umfang von Sqoop erweitert

Sqoop ist ein Hadoop-Tool, mit dem sich Daten aus relationalen Datenbanken in Hadoop-Speicherebenen wie HDFS, HBase oder Hive importieren lassen. Talend, der führende Anbieter von Open-Source-Lösungen für Datenintegration, integriert Sqoop-Funktionen in eine einheitliche, vielfältige und benutzerfreundliche Big-Data-Integrationslösung und steigert so den Nutzen von Sqoop.

Laden Sie O’Reilly Report: Moving Hadoop to the Cloud jetzt herunter.
Weitere Informationen

Sqoop – auf dem Tablett serviert

Mit Talend Open Studio for Big Data können Datenanalysten komplexe Big-Data-Integrationsjobs und -services ganz ohne Codierung entwerfen und implementieren. In der Eclipse-basierten grafischen Entwicklungsumgebung von Talend Open Studio for Big Data lassen sich Integrationsprozesse spielend leicht erstellen: einfach Komponenten aus einer Palette auswählen, in einem zentralen Arbeitsbereich anordnen und über grafische Oberflächen oder Assistenten konfigurieren.

Auf diese Weise können Data-Scientists blitzschnell Sqoop-Operationen definieren, wie etwa den Import von SQL-Daten in Dateien im Hadoop Distributed File System (HDFS) oder in einen nicht relationalen HBase-Datenspeicher oder eine Hive-Data-Warehousing-Ebene. Hinter der grafischen Oberfläche generiert Talend Open Studio for Big Data automatisch die entsprechenden Sqoop-Befehle und anderen erforderlichen Code. So wird ausführbarer Output erstellt, der sich als einmaliger Job oder wiederkehrender Service nutzen lässt.

Laden Sie Talend Open Studio for Big Data - User Guide 6.5 jetzt herunter.
Weitere Informationen

Sqoop und Big Data

Sqoop ist in Talend Open Studio for Big Data nur eine der vielen benutzerfreundlichen Hadoop-Big-Data-Technologien. Neben der Sqoop-Unterstützung bietet die grafische Entwicklungsumgebung von Talend auch die Möglichkeit, Big-Data-Prozesse mittels Drag-and-drop zu bearbeiten und zu konfigurieren. Hier ein paar Beispiele:

  • Durchführung von Hadoop Pig-basierten Datenanalysen auf der Grundlage von in HDFS gespeicherten Daten, ohne Hadoop Pig Latin-Code schreiben zu müssen
  • Implementierung von Datentransformationen in einem Hive-Data-Warehouse
  • Verschieben von Daten aus Hadoop in Zieldatenbanken oder Enterprise-Anwendungen, entweder als Batch-Jobs oder laufende Hadoop-Streaming-Prozesse

Nicht nur Big Data, sondern beliebige Daten

Talend Open Studio for Big Data bietet nicht nur erstklassige Unterstützung für Hadoop-Tools wie Sqoop, Hive, HBase und Pig, sondern auch die größte Konnektivität aller Datenintegrationslösungen auf dem Markt. So können Sie Daten flexibel zwischen beliebigen gängigen Formaten, Datenbanken, Enterprise-Anwendungspaketen und führenden Cloud-Datenspeichern wie Salesforce bewegen und diese verbinden.

Erfahren Sie mehr über die Big-Data-Lösungen von Talend oder laden Sie jetzt Talend Open Studio for Big Data herunter und profitieren Sie noch heute vom führenden Open-Source-Big-Data-Tool.