Datenkonvertierung: Optimierung der Datenbank-Genauigkeit

Durch Datenkonvertierung lösen Sie eine der großen Herausforderungen unserer Zeit. Denn dank ihr ist es möglich eine Vielzahl von Daten zu verwalten, die von verschiedenen Anwendungen, Geräten und Betriebssystemen stammen. Ohne diesen einfachen, aber essenziellen Prozess hätten Unternehmen nur eine Fülle nutzloser Daten. Sie würden die Chance verpassen, wertvolle Geschäftseinblicke in Kundenverhalten, Betriebsabläufe und Trends zu gewinnen.

In diesem Artikel definieren wir den Begriff „Datenkonvertierung“ und zeigen Ihnen, wie dieses wichtige Instrument Ihnen helfen kann, die Ziele der Datenintegration zu erreichen. 

Was ist Datenkonvertierung?

Datenkonvertierung beschreibt den Prozess, Daten von einem Format in ein anderes zu übersetzen. Auch wenn das Konzept an sich einfach erscheint, ist das Konvertieren von Dateien ein essenzieller Schritt im Verlauf der Datenintegration. Mithilfe dieser Maßnahme ist es möglich, Daten in einer anderen Anwendung oder Datenbank als ihrer ursprünglichen zu lesen, ändern oder auszuführen.

Datenkonvertierung kommt z. B. zum Einsatz, wenn ein Unternehmensnetzwerk unterschiedliche Techniken zum Speichern von Daten (insbesondere von numerischen Werten) verwendet. Der Prozess ist ebenfalls notwendig, wenn Unternehmen zwischen Netzwerken und Nutzern kommunizieren, die Daten in unterschiedlichen Zeichensätzen anzeigen.

Ein typisches Beispiel für eine Datenkonvertierung ist die Art und Weise, wie viele von uns Unterhaltungsmedien konsumieren.  Um eine Musik- oder Videodatei auf einem mobilen Gerät abspielen zu können, ist es nötig, die Dateien zu formatieren – von ihrem Quellformat (z. B. eine MKV-Datei) in ein Format, das vom Gerät gelesen werden kann (z. B. eine MP4-Datei).

Das Ziel der Datenkonvertierung ist es, einen Datenverlust oder eine Beschädigung der Daten zu verhindern, indem die Integrität der Daten und eingebetteten Strukturen erhalten bleibt. Dies lässt sich leicht bewerkstelligen, sofern das Zielformat die gleichen Funktionen und Datenstrukturen unterstützt wie die Quelldaten. Ist dies nicht der Fall, müssen Unternehmen das Format und die Struktur korrekt und umfassend konvertieren, um Daten lesen, ändern und analysieren zu können.

Was Datenkonvertierung nicht ist 

Das Konvertieren von Dateien wird oft mit Prozessen verwechselt, die als Datenmigration, Datentransformation und Datenbereinigung bekannt sind. Lassen Sie uns einen Blick auf diese Vorgänge werfen, um Klarheit zu schaffen.

  • Datenmigration: Die Datenkonvertierung übersetzt einzelne Computerobjekte und Datentypen von einem Format in ein anderes. Datenmigration hingegen, überträgt ganze Datenbanken oder Programme. Daten zu konvertieren, zu transformieren und zu bereinigen, bildet also nur einen Teil der Datenmigration.
  • Datentransformation: Die Datentransformation ändert die Darstellung der Daten und übersetzt diese nicht bloß. Ein üblicher Datentransformationsprozess ist die Verdichtung der Daten, wie in diesem Beispiel gezeigt. Hinweis: Das Format selbst ändert sich nicht Transformieren: foo ("string-A", 77, kCommon); bar (Obj-W, Obj-X); foo ("string-B", 23, kCommon); bar (Obj-Y, Obj-Z); Zu: foobar (“string-A”, 77, Obj-W, Obj-X); foobar ("string-B", 23, Obj-Y, Obj-Z);
  • Datenbereinigung: Die Datenbereinigung findet und korrigiert ungenaue, sich wiederholende und unvollständige Daten. Dieser Vorgang erfolgt häufig nach einer Datenkonvertierung, Datentransformation oder Datenmigration.

Welche Arten von Daten lassen sich konvertieren?

Der erste Schritt zur Datenkonvertierung besteht darin, die verschiedenen Datentypen zu verstehen, die Sie konvertieren können. Alle Programmiersprachen basieren auf Datentypen, die dem Compiler oder Interpreter mitteilen, wie die Daten zu verwenden sind. Ein Compiler, bzw. Interpreter ist die Implementierungsform einer Software und. Sie setzt einen Quelltext, der in einer höheren Programmiersprache geschrieben wurde, in Maschinenbefehle um. Der Datentyp bestimmt die durchführbaren Operationen und definiert die Struktur, in der die Daten gespeichert werden sollen. Die meisten Datentypen, sowohl primitive als auch zusammengesetzte, lassen sich konvertieren. Hier sind nur einige von vielen Beispielen:

  • Compilersprachen (z. B. C-Sprache versus Java)
  • Codepages (Zeichen- / Symbolsätze), die sprachspezifisch sind (z. B. Englisch vs. Spanisch)
  • Codepages, die betriebssystemspezifisch sind (z. B. ASCII vs. EBCDIC)
  • Dokumenttypen, einschließlich verschiedener Text-, Audio- und Videodateiformate

Fachleute sind auf eine genaue und vollständige Datenkonvertierung angewiesen. Denn sie benötigen alle verfügbaren Daten, um daraus die richtigen Schlüsse ziehen zu können. Um die verschiedenen zu konvertierenden Datentypen zu verstehen, sehen wir uns einige Anwendungsbeispiele aus der Praxis an.

  • Die Gesundheitsbranche erfordert ein hohes Maß an Qualität bei der historischen Datenkonvertierung, um genaue Gesundheitsdaten zu gewährleisten. Diese Branche nutzt die Datenkonvertierung häufig, da sie zwischen verschiedenen elektronischen Krankenakten-Systemen wechselt.
  • Telekommunikations- und Netzwerkunternehmen benötigen eine herstellerunabhängige Input- und Output-Qualität, die sich nur mit Datenkonvertierung erreichen lässt.
  • Wissenschaftler nutzen Datenkonvertierung für die Recherche und das Zusammenführen komplexer Studienergebnisse in verschiedenen Formaten.
  • Versicherungsunternehmen machen häufig Gebrauch von Datenkonvertierungen, insbesondere zum Lesen und Verwalten von Dokumentenunterschiedlicher Formate. Die Daten müssen kompatibel sein, damit sie sich innerhalb der Branche problemlos austauschen lassen, sodass der Prozess im Schadensfall so effizient wie möglich abläuft.

So funktioniert die Datenkonvertierung

Datenkonvertierung kann, muss jedoch kein komplexer Prozess sein. Werkzeuge zur Automatisierung können sowohl die Genauigkeit als auch die Vollständigkeit der konvertierten Daten verbessern und gleichzeitig die Entwicklungszeit reduzieren. Die grundlegenden Schritte, die die meisten Datenkonvertierungen beinhalten, sind folgende: 

  1. Entwicklung eines umfassenden Plans auf Grundlage der Benutzeranforderungen.
  2. Extrahieren des Zeichen- oder Symbolsatzes aus seiner Quelle.
  3. Konvertierung dieser Quelldaten in das Zielformat.
  4. Überprüfung der Daten und Laden in das Zielsystem. 

Diese grundlegenden Schritte variieren in Abhängigkeit von mehreren verschiedenen Faktoren. Ein wichtiger Teil der Datenkonvertierung ist, ob sich der Quelldatentyp in einen anderen konvertieren oder sich nur uminterpretieren lässt.

Ein weiterer Aspekt ist, ob es sich um eine implizite oder explizite Konvertierung handelt. Bei der impliziten Konvertierung führt ein Compiler die Konvertierung automatisch durch. Dies geschieht, indem er einen Datentyp mit einem anderen vergleicht, und dann den Quelldatentyp dem richtigen Zieldatentyp zuordnet. Die explizite Konvertierung übersetzt Objekte und Datentypen auf drei Arten:

  • Eine Laufzeitprüfung vor der Konvertierung stellt fest, ob der Zieldatentyp den Quellwert aufnehmen kann. Wenn dies nicht der Fall ist, tritt ein Fehler auf.
  • Es werden keine Prüfungen durchgeführt. Wenn der Zieldatentyp den Quellwert nicht aufnehmen kann, tritt kein Fehler auf. Vielmehr bleibt der resultierende Datentyp undefiniert.
  • Es findet ein Kopieren des rohen Bitmusters statt, ohne dass die Daten interpretiert werden.

Jede Programmiersprache verwendet einen speziellen Satz von Anweisungen, um die Datentypen zu konvertieren. Stark typisierende Sprachen, die zur Kompilierzeit strengere Regeln haben, verwenden typischerweise die explizite Methodik zur Konvertierung der Datentypen. Schwach typisierende Sprachen, die lockerere Regeln haben und unvorhersehbare Ergebnisse produzieren können, interpretieren einen Datentyp eher willkürlich als unterschiedliche Repräsentationen.

Datenkonvertierung in einer Cloud-nativen Welt

Talend Cloud Eine fehlerhafte Konvertierung von Dateien kann zu einer ungenauen, unvollständigen Datenbank führen, deren Behebung Monate dauern kann. Noch schlimmer ist jedoch, dass Sie möglicherweise Geschäftsentscheidungen auf der Grundlage von ungenauen Daten treffen – Entscheidungen, die erhebliche Konsequenzen für Ihr Geschäft bedeuten. Mit einer Datenmanagement-Plattform automatisieren Sie Ihren Konvertierungsprozess und stellen stets korrekt konvertierte Daten sicher.

bietet eine vollständige, skalierbare und sichere Datenmanagementlösung, die die Datenkonvertierung vereinfacht. Die Plattform beinhaltet eine ganze Reihe von Werkzeugen, mit denen Sie Ihre Daten von A bis Z verwalten können. So sind Ihre Daten für die Integration bereit, wenn Sie es auch sind. Laden Sie eine kostenlose Testversion herunter und finden Sie heraus, wie Talend Cloud Ihre Anforderungen an die Datenkonvertierung erfüllen kann.

Sind Sie bereit, mit Talend durchzustarten?