Was ist ein Datenmodell? Als Entwickler bei Talend haben wir täglich mit Datenmodellen zu tun und denken daher zu wissen, was sich hinter dem Begriff verbirgt: Eine strukturelle Definition der Daten in einer Unternehmenslösung Eine grafische Darstellung von Geschäftsdaten Eine Datengrundlage für die Entwicklung von Unternehmenslösungen Diese …
Read Article
Es scheint, als wären meine vorherigen Blogbeiträge zu diesem Thema auf großes Interesse gestoßen. Dafür möchte ich mich nochmals bei meinen Lesern bedanken. Falls Sie neu hier sind und meine vorherigen Einträge nicht gelesen haben, fangen Sie bitte zuerst damit an (Talend „Job Design Patterns“ und …
Read Article
Migration in die Cloud 2018 war das Jahr der Cloud. Immer mehr Unternehmen nutzen Cloud-Technologien. Wenn auch Sie dazugehören, brauchen Sie eine klare Vorstellung davon, wie Sie die Cloud am besten einsetzen. Oft ist eines der größten Probleme der Umzug lokaler Datenbestände in den neuen Cloud-Speicher. Ohne …
Read Article
Die Resilient Distributed Datasets (RDD) von Apache Spark sind Sammlungen verschiedenartiger Daten, die so groß sind, dass sie nicht auf einen einzelnen Node passen und deshalb am besten durch Partitionierung auf mehrere Nodes verteilt werden. Apache Spark nimmt die Partitionierung von RDDs und ihre Verteilung auf Nodes automatisch …
Read Article
Bevor ich ins Customer Success Architect Team wechselte, hatte ich bei Talend schon mehrere Jahre als Support Engineer gearbeitet. Damals fragten mich Kunden immer wieder zur gemeinsamen Nutzung von Talend und Apache Spark. Wenn man an Spark denkt, fällt einem als erstes der Befehl Spark Submit ein, …
Read Article
Ich habe kürzlich als Customer Success Architect bei Talend angefangen. Es ist meine Aufgabe, die Datenstrategien unserer Kunden bei der Nutzung von Talend mit Architekturleitlinien und Best Practices zu unterstützen. Bevor ich zu Talend stieß, war ich an mehreren Data Warehouse-Implementierungen beteiligt, bei denen Informatica PowerCenter das …
Read Article
Geschäftsanwendungen, Datenintegration, Masterdaten-Management, Data Warehousing, Big Data, Data Lakes und Machine Learning – sie alle haben (oder sollten) einen gemeinsamen und wesentlichen Bestandteil: ein Datenmodell. Diese Tatsache wird oft vergessen oder schlichtweg ignoriert, was ich schon häufiger erlebt habe! Fast jede kritische Geschäftslösung basiert auf einem Datenmodell …
Read Article
If you’ve ever started working with new software, you know it can be challenging to start taking full advantage of features and functionality right away. At Talend, we want you to get up and running quickly with our data integration software. Therefore, we’ve introduced a new …
Read Article
The previous post [on Colm’s blog] covered how to install the Apache Ranger Admin service. The Apache Ranger Admin UI supports creating authorization policies for various Big Data components, by giving users and/or groups permissions on resources. This means that we need to import users/groups into …
Read Article
As Talend has released its newest version of Talend Data Fabric 6.2.1 for GA, I thought this would be a good time to talk about software upgrades within the Enterprise. Software maintenance is a big part of IT budgets. As more companies offer software for all …
Read Article