Predictive Analytics sind aus dem Alltag von Data Scientists nicht mehr wegzudenken. Wie wichtig Sie für den Bereich, aber auch Unternehmen generell sind, verdeutlicht ein kurzes Szenario zur Einführung:

In ein paar Minuten sollen Sie den C-Level-Executives Ihres Unternehmens das neueste Datenanalyseprojekt präsentieren. Sie sind stolz auf Ihre Analyse und zuversichtlich, denn die Datensätze haben das Potenzial, neue Marketing-Kampagnen zu beeinflussen, als Grundlage für Ausschreibungsmaterial zu dienen und die Verkäufe anzukurbeln. Die Daten liegen in der Cloud und sind damit leicht zugänglich und interpretierbar. Sie haben sogar ein Dashboard mit Visualisierungen, die die immense Stärke des Datensatzes perfekt darstellen. Die Präsentation kann nur ein Erfolg werden.

Nach fünf Minuten unterbricht Sie einer der C-Level-Executives und fragt: „Wie werden sich diese Daten in Zukunft verändern?“ Bevor Sie antworten können, kommt eine weitere Frage: „Woher wissen wir, dass uns dieses Dashboard wirklich alles verrät?“

Verdutzt halten Sie inne und denken nach. Die Daten, die Sie der Führungsebene präsentiert haben, sind korrekt – ihre Test-Abteilung hat sie monatelang ausgiebig überprüft. Aber können Sie wirklich sagen, ob und wie sich diese Daten künftig verändern werden? Der Datensatz und das Dashboard sind nur Momentaufnahmen. Niemand kann die Zukunft voraussagen.

Sie haben zwar keine Glaskugel, aber was wäre, wenn Sie ganz nah an valide Zukunftsprognosen herankommen würden? Moderne Unternehmen benötigen mehr als eine punktuelle Berichterstattung. Sie müssen zukünftige Risiken minimieren, den Umsatz und die Kundenzufriedenheit steigern und ihre Prozesse optimieren. Um das zu erreichen, nutzen Unternehmen branchenübergreifend prädiktive Analysen. Um Predictive Analytics in vollem Umfang anzuwenden, müssen Unternehmen die derzeitigen Anwendungen, die Schnittstellen mit der Cloud und die Wissenschaft dahinter verstehen.

Was ist Predictive Analytics?

Die prädiktive Analyse beschreibt das Sammeln und Analysieren historischer Daten, um zukünftige Entwicklungen vorauszusehen. Das Sammeln mehrerer Datensätze stellt die Verbindung zwischen verschiedenen Abteilungen, Unternehmensprozessen und Datentypen (strukturiert vs. unstrukturiert) her.

Allerdings lässt das einfache Zusammentragen mehrerer Datenpunkte nicht zwingend auf zukünftiges Verhalten schließen. Prädiktive Analyse setzt statistische Techniken, wie Datenmodellierung, maschinelles Lernen und sogar künstliche Intelligenz wirksam ein, um Muster in Big Data aufzudecken.

Während diese Muster nicht exakt vorhersagen können, was in der Zukunft geschehen wird, können prädiktive Analysen aber Trends identifizieren, disruptive Branchenveränderungen ankündigen und stärker datengetriebene Entscheidungsfindungen ermöglichen.

Ansehen Fundamentals of Machine Learning jetzt herunter.
Jetzt ansehen

Typische Anwendungsgebiete von Predictive Analytics

Jeder Bereich, in dem Daten erfasst werden, eignet sich für die prädiktive Analyse. Von der Verbesserung der Cybersecurity und Datensicherheit, über die Entwicklung eines zielgerichteteren Marketings bis hin zur Stärkung der versicherungsmathematischen Performance ist alles denkbar.

Prädiktive Analyse im Gesundheitswesen

Vor allem im Gesundheitswesen wird mit prädiktiver Analyse gearbeitet. Ein wesentliches Problem im Gesundheitswesen besteht darin, Patientenrisikos vorherzusagen. Versicherungsmathematische Teams müssen optimale Versicherungstarife und behördliche Anfragen für Kostenerstattungen für Mitglieder mit verschiedenen gesundheitlichen Problemen festlegen.

Aufgrund dieses internen Bedarfs waren Krankenversicherungen an vorderster Front vertreten, als es darum ging, Big-Data-Verfahren einzuführen. Versicherungsmathematiker nutzen prädiktive Analysen, um Folgendes festzulegen:

  • Wahrscheinlichkeit, dass sich der Gesundheitszustand eines Patienten verschlechtert
  • Wahrscheinlichkeit, dass ein Patient an geförderten Wellness-Aktivitäten teilnimmt oder Kuren in Anspruch nimmt

Prädiktive Analysen ermöglichen es Krankenversicherungen, Risikomuster bei Patienten mit folgenden ähnlichen Eigenschaften zu untersuchen:

  • Alter
  • Gesundheitszustand
  • soziale Gesundheitsfaktoren

Mithilfe dieser Informationen können Krankenversicherungen fundiertere finanzielle und ethische Entscheidungen treffen.

Prädiktive Analyse im Finanzwesen

Auch die Kreditvergabe, ein wesentlicher Bestandteil des Finanzdienstleistungsbereiches, wurde durch prädiktive Analysen revolutioniert. Bevor eine Bank einen Kredit vergibt, will sie sicherstellen, dass der Kunde vertrauenswürdig ist. Schließlich wollen sie ihr Geld zurückbekommen. Aber wie messen Versicherer dieses Vertrauen?

Bis vor einigen Jahren beurteilten Versicherer einen Antragsteller noch nach bisherigen Erfahrungen und persönlicher Intuition. Der Überprüfungsprozess beinhaltete den Check der Vorgeschichte und den Schulden-Einkommensquotienten des Bewerbers, um einen komplizierten Zinssatz zu ermitteln. Mit dem Aufkommen neuer Finanzgesetzgebungen, mussten die Kreditgeber jedoch eine statistisch relevantere Methode für das Versicherungsgeschäft entwickeln.

Die Kreditwirtschaft durchlief eine Revolution, als prädiktive Analysemodelle wie VantageScore und FICO Score verfügbar wurden. Diese Modelle erlaubten es den Kreditgebern, genaue, risikobasierte Zinssätze zu berechnen und schränkten subjektive Elemente ein. Anstatt Zinssätze auf ein paar veraltete Metriken zu stützen, basieren die Modelle von VantageScore und FICO Score auf den Daten von Millionen von Kreditnehmern mit vergleichbaren Ausgabetendenzen.

Predictive Analytics: Drei Praxis-Beispiele

Nach den hypothetischen Anwendungsgebieten von prädiktiver Analyse, schauen wir uns ein paar echte Anwendungsfälle an.

1. Patientenversorgung verbessern

CenterLight ist eine Managed-Care-Organisation mit 13 Standorten in New York, die Dienstleistungen für behinderte, ältere und chronisch kranke Menschen anbietet. Jahrelang nutzte CenterLight ein hauseigenes System für die Verwaltung seiner Daten. Dieses System hielt jedoch nicht mit den Anforderungen der ständig wechselnden Compliance-Richtlinien und den verschiedenen Möglichkeiten der Patientenbehandlung Schritt. Es wurde zunehmend unmöglich, die Fortschritte der Patienten zu verfolgen und die Patientenversorgung zu verwalten. 

Aus diesem Grund setzte CenterLight die prädiktive Analyse wirksam in ihrem Data-Warehouse ein, das erfolgreich Datenintegrationen aus dem CRM-System (Salesforce), dem hauseigenen System eCHAMP sowie aus anderen Leistungs- und Anbieterdatenbanken umsetzte. Daraus konnte das Business-Intelligence-Team Muster im Verhalten der Pflegekräfte erkennen, die die Mitgliederbindung erhöhten und die Patienten besser auf ihre Untersuchungen vorbereitete.

Die prädiktive Analyse half CenterLight, gleichzeitig sowohl Zeit und Geld zu sparen als auch die Pflege ihrer Mitglieder effektiv zu verwalten.

Laden Sie Der ultimative Leitfaden zur Datenintegration jetzt herunter.
Weitere Informationen

2. Benutzeransprache mit den richtigen Empfehlungen

Lenovo ist ein Technologieunternehmen mit Kunden in über 160 Ländern, das Computer und Smartphones herstellt. Lenovo erkannte, dass innovative Produkte nicht ausreichen, um in einer hart umkämpften Branche herauszustechen. Das Unternehmen musste neue Produktkategorien entwickeln, um das Customer Experience zu verbessern. 

Um besonders effektiv zu sein, setzte sich Lenovo das Ziel, die Bedürfnisse der Kunden mithilfe von Datensätzen zu verstehen. Damit ist das Technologieunternehmen in der Lage, die Erwartungen, Verhaltensweisen und Vorlieben der Kunden zu umreißen. Dafür entwickelte Lenovo ein kanalunabhängiges und prädiktives Analyse-Verfahren, das die Datengewinnung aus einer Vielzahl an Touchpoints in Echtzeit ermöglicht. Dieses Predictive-Analytics-Modell half Lenovo, die Customer Experience zu verbessern und den Umsatz pro Verkaufseinheit um elf Prozent zu steigern.

3. Einen 360-Grad-Blick auf den Kunden werfen

Air France-KLM ist ein weltweit tätiges Unternehmen, das in seinen drei Hauptgeschäftsbereichen – Passagier- und Güterbeförderung und Flugzeugwartung – marktführend ist. Mit 90 Millionen Kunden pro Jahr und 2,5 Millionen monatlichen Website-Besuchern zählt das Datenmanagement für Air France-KLM zur höchsten Priorität, um die Kundenzufriedenheit zu gewährleisten.

Air France-KLM entwickelte auf Grundlage ihrer Daten einen 360-Grad-Kundenansatz, der auf prädiktiven Analysen basiert. Von der Bereitstellung der kompletten Kundenhistorie für alle Call-Center-Mitarbeiter über das Versenden von gezielten Werbeangeboten bis zur Einführung von Chatbots im Kundenservice – das Unternehmen schuf eine herausragende Curstomer Experience, indem das Unternehmen potenzielle Kundenbedürfnisse vorausschauend antizipierte. Air France-KLM ging sogar noch einen Schritt weiter und identifizierte zusätzlich die hauptsächlichen Stressfaktoren der Kunden. Auf Grundlage dieses Wissens ließ sich ein proaktiver Handlungsplan entwickeln, um eine Vielzahl potenzieller Probleme auf Kundenseite zu nivellieren.

So funktioniert Predictive Analytics

Prädiktive Analysen sind keine Zauberei, sondern kochen auch nur mit Wasser. Sie basieren auf Statistik und es geht bei der prädiktiven Modellierung darum, vorhandenen Variablen in einem großen Datenset eine bestimmte Gewichtung oder einen Wert zuzuordnen. Diesen Wert können Data Scientists nutzen, um zu berechnen, wie wahrscheinlich es ist, dass ein bestimmtes Ereignis in der Zukunft eintritt.

Es gibt zwei Hauptansätze der statistischen Modellierung, die bei der prädiktiven Analyse benutzt werden: Klassifizierungsmodelle und Regressionsmodelle.

Klassifizierungsmodelle in Predictive Analytics

Klassifizierungsmodelle sind typischerweise binär. Ein Beispiel: Sie sind an der Mitgliederregistrierung bei CenterLight interessiert. Ein Klassifizierungsmodell sagt voraus, ob ein Mitglied innerhalb eines bestimmten Zeitraums und auf Grundlage bestimmter Kriterien bei CenterLight bleiben oder sich abmelden wird.

Regressionsmodelle in Predictive Analytics

Regressionsmodelle differenzieren stärker. Anstelle einer 0 oder einer 1 sagen Regressionsmodelle eine tatsächliche Zahl voraus. Bleiben wir bei dem CenterLight-Beispiel: Nehmen wir an, ein Mitglied hat einen BMI von 29. Ein Regressionsmodell könnte vorhersagen, dass der BMI mit einer konsequenten und gesunden Diät im nächsten Jahr um drei Punkte heruntergehen könnte.

Drei Methoden prädiktiver Analysen: Entscheidungsbäume, Regressionsanalysen und neuronale Netze

Es gibt verschiedene Methoden, die Data Scientists nutzen, um Klassifikations- und Regressionsmodelle zu konstruieren.

Entscheidungsbäume

Jede Abzweigung bzw. Verästelung an dem Entscheidungsbaum ist gleichzusetzen mit einer Entscheidung. Jeder Zweig des Entscheidungsbaums stellt eine mögliche Wahl zwischen zwei oder mehr Optionen dar, während jedes Blatt eine Klassifizierung (ein Ja oder Nein) symbolisiert. Entscheidungsbäume sind eine beliebte Methode für die Modellierung, da sie auch mit fehlenden Werten umgehen können und leicht zu verstehen sind.

Regressionsanalysen

Regressionsanalysen sind ein weiteres beliebtes Modellierungswerkzeug. Sie kommen zum Einsatz, wenn die Daten nicht binär sind, sondern kontinuierlich sind. Unterschiedliche Datenanfragen erfordern unterschiedliche Anwendungen von Regression. Lineare Regression wird beispielsweise genutzt, wenn nur eine unabhängige Variabel einem Ergebnis zugeschrieben werden kann. Falls mehr als eine Variable das Ergebnis beeinflussen könnte, ist die multiple Regression am genauesten. Logistische Regression ist eine noch komplexere Form, die weder denselben Richtlinien wie lineare noch multiple Regression folgt. Im Gegensatz zu den beiden anderen Modellen ist die logistische Regression ideal geeignet, wenn die abhängige Variable binär ist. Schauen wir uns wieder das CenterLight-Beispiel an: Eine logistische Regression könnte die Frage danach beantworten, wie sich die Wahrscheinlichkeit mit jedem zusätzlichen BMI-Wert (kontinuierliche Variable) verändert, dass ein Mitglied einen Herzinfarkt bekommt (binäre Variable).

Neuronale Netze

Neuronale Netze gelten als die komplizierteste Technik. Die Nachfrage nach dieser Methode nimmt immer mehr zu, denn perfekt lineare Beziehungen sind selten. Bei neuronalen Netzen wird künstliche Intelligenz angewendet, weswegen mit ihnen eine anspruchsvollere Mustererkennung möglich ist.

Auch wenn diese statistischen Methoden nicht neu sind, steigt ihre Akzeptanz und Nutzung immer mehr an. Dies lässt sich auf die steigende Popularität der Cloud zurückführen.

Big Data, die Cloud und die Zukunft von Predictive Analytics

Bevor es die Cloud gab, erschienen prädiktive Analysen unmöglich. Computer hatten nicht die Kapazität, um Petabytes an Daten zu speichern, geschweige denn genug Rechenleistung, um labyrinthische Datenmodelle auszuführen. Die Cloud bietet Unternehmen eine Möglichkeit, mehrere, große Datensätze zu erstellen und miteinander zu kombinieren sowie ihre Modelle einfach zu skalieren.

Es gibt viele aufstrebende, cloudbasierte Predictive-Analytics-Tools. In Zukunft werden Unternehmen dank der Cloud, ihre eigenen Machine-Learning-Modelle zu entwickeln. Vorteile der Cloud: Computer, die in der Lage sind, Muster in Daten zu finden, machen manuelle Arbeit überflüssig und ermöglichen weitreichendere und genauere Interpretationen und Hochrechnungen.

Die Cloud bringt auch bessere Indivisualisierungsmöglichkeiten und mehr Flexibilität mit sich. Mit dem Aufstieg des Internets der Dinge in der Cloud, könnten Predictive-Analytics-Tools noch granularer in ihrer Bewertung der alltäglichen Gewohnheiten von Menschen werden.

Laden Sie O’Reilly-Bericht: The Internet of Things Market jetzt herunter.
Weitere Informationen

Moderne Predictive-Analytics-Software und Tools

Da Unternehmen jederzeit große Datensätze aus der Cloud abrufen können, gibt es einen sehr hohen Bedarf an Big-Data-Analysen. Der Markt für cloudbasierte Predictive-Analytics-Tools wächst mehr und mehr. Obwohl es unerlässlich ist, ein Team von Experten für die Interpretation der Datenmodelle zu haben, ist Software grundlegend notwendig, um die aufgewendete Zeit für das Sammeln, Bereinigen und Analysieren der Daten zu verringern. Predictive-Analytics-Tools können sowohl gespeicherte als auch Echtzeit-Daten verarbeiten und zudem bei der geeigneten Formatierung helfen.

Darüber hinaus lassen sich die meisten Predictive-Analytics-Tools problemlos in die ERP-Systeme, Digital-Analytics-Software und Business-Intelligence-Plattformen integrieren, die die meisten Unternehmen bereits nutzen. Business Intelligence Teams können Software für Predictive Analytics außerdem nutzen, um den Wert prädiktiver Analyse visuell mittels Dashboards darzustellen.

Talend bietet eine Big-Data-Software an, die universell einsetzbar ist. Da es sich bei Talend um eine Open-Source-Integrationsplattform handelt, ist sie vielseitig genug, um bei der Datenaufbereitung, beim Datenmanagement und der Cloud-Integration zu unterstützen. Die erste Aufgabe für Unternehmen, sobald sie einen bestimmten Reifegrad erreicht und ihr eigenes Predictive-Analytics-Verfahren entwickelt haben, wird die Migration ihrer Daten in die Cloud sein.

Sind Sie bereit dafür, mit prädiktiven Analysen loszulegen? Probieren Sie Talend Data Fabric noch heute aus und transformieren Sie Ihre Unternehmensdaten.