Die große Kunst im E-Mail-Marketing ist es, zur richtigen Zeit die richtige Botschaft zu senden. Das gelingt jedoch nur wenigen, denn Segmentierung und Personalisierung benötigt eine fundierte Entscheidungsgrundlage. Wirklich schlagkräftige Segmente zu entwickeln ist komplex. Wer erfolgreich sein will, muss sich früher oder später mit diesem Thema beschäftigen: Predictive Modeling.
Angesichts der zunehmenden Informationsflut und sinkender Aufmerksamkeitsspanne funktioniert herkömmliche Werbung kaum noch. In der Folge schrauben Werbetreibende die Reizintensität hoch, um von potenziellen Kunden überhaupt wahrgenommen zu werden. Aber auch das geht nach hinten los, wenn die Werbung nicht nutzerorientiert und zielgruppenspezifisch ist. Marketing bedeutet in der Zukunft, dem Kunden zur richtigen Zeit ein passendes Angebot zu unterbreiten. Die große Herausforderung ist es, Vorhersagen (“Predictions”) treffen zu können.
Was ist Predictive Analytics?
Im Rahmen von Predictive Analytics (prädiktive bzw. vorausschauender Analytik bzw. Vorhersageanalysen) werden historische Daten verwendet, um zukünftige Ereignisse vorherzusagen. Zum Einsatz kommt das Konzept nicht nur im Marketing. Auch in den Bereichen Finanzen, Meteorologie, Sicherheit, Versicherungen, Logistik und Mobilität wird versucht, die Zukunft vorherzusagen. Der Unterschied zu traditioneller Analytics (“Business Intelligence”) ist, dass der Blick in die Zukunft gerichtet ist.
Der Prozess nutzt Datenanalyse, maschinelles Lernen, künstliche Intelligenz und statistische Modelle, um Muster zu finden, die das zukünftige Verhalten prognostizieren könnten. Unternehmen können anhand von historischen und aktuellen Daten Trends und Verhaltensweisen mit großer Präzision, Sekunden, Tage oder Jahre in die Zukunft prognostizieren.
Was ist Predictive Marketing?
Im Marketingkontext werden die Begriffe Predictive Analytics und Predictive Marketing oft synonym verwendet. Entsprechende Verfahren spielen vor allem bei der Realisierung von Next Best Action (NBA) & Next Best Offer NBO) eine wichtige Rolle.
- Welcher Kunde neigt zum Kauf?
- Welches Produkt passt am besten?
- Wann muss die Kampagne versenden werden, damit ein Kauf stattfindet?
- Wo in der Customer Journey befindet sich ein Kunde?
- Welcher Buyer Persona entspricht ein Kunde?
- Wie wertvoll ist ein Kunde (CLTV)?
- Welcher Kunde neigt zum Absprung (Churn)?
Ein Vorhersagemodell erstellen in sieben Schritten
Wie Sie sehen, spielt Predictive Marketing im E-Mail-Marketing und erst recht im Customer Relationship Management eine immer wichtigere Rolle. Zur Bereitstellung (möglichst im Rahmen einer Datenstrategie) sind mehrere Schritte notwendig:
- Problem definieren: Use Cases oder User Storys beschreiben
- Daten erfassen und organisieren
- Aufbereiten und Bereinigen von Daten
- Einteilung der Daten in zwei Datasets: Trainingsdaten und Testdaten
- Vorhersagemodelle entwickeln (Predictive Modelling)
- Modell evaluieren
- Daten-Dashboard bereitstellen
- Modell bereitstellen und fortlaufend optimieren
Was ist Predictive Modeling?
Besonders herausfordernd ist die Modellierung eines Vorhersagemodells (Predictive Modelling). Zum Einsatz kommen hier verschiedene statistische Verfahren, mit denen sich die Beziehungen zwischen den relevanten Variablen ermitteln lassen. Das Ergebnis kann prinzipiell eine mathematische Funktion wie z.B. f(x) = x² sein. Aber in der Praxis sind Modelle meistens viel komplexer. Welches Verfahren sich letztlich am besten eignet, hängt von verschiedenen Fragestellungen ab:
- Wie viele (essentielle) abhängige und unabhängige Variablen gibt es?
- Handelt es sich um stetige oder diskrete Variablen?
- Was für Daten liegen zum Trainieren des Modells vor?
Exkurs: Prädiktoren
Beim Predictive Modelling muss man im Vorwege bestimmen, welche Faktoren überhaupt in einem kausalen Zusammenhang mit dem Ereignis stehen, welches vorhergesagt werden soll. Diese Faktoren werden auch Prädiktoren genannt. Beispiel: Die vorhergesagte Tageshöchsttemperatur ist ein guter Prädiktor zur Kalkulation des Speiseis-Umsatzes.
Was sind die gängigen Verfahren zur Vorhersageanalyse?
Im Allgemeinen werden zwei Arten von Vorhersagemodellen unterschieden:
- Klassifizierungsmodelle
- Regressionsmodelle
Klassifizierungsmodelle haben die Funktion, Datenobjekte wie z.B. Kunden jeweils einer Kategorie zuzuordnen. Wenn ein Händler beispielsweise viele Daten zu verschiedenen Arten von Kunden hat, kann er vorhersagen, welche Kundentypen empfänglich für bestimmte Promotion-E-Mails sind.
Regressionsmodelle haben hingegen die Aufgabe, kontinuierliche Daten vorherzusagen, z. B. wie viel Umsatz der Kunde während seiner Beziehung zum Unternehmen generieren wird.
Für Predictive Marketing kommen vor allem die folgenden Verfahren zum Einsatz:
Regressionsanalyse
Die Regression ist ein statistisches Analyseverfahren, das Beziehungen zwischen Variablen schätzt. Die Regression ist hilfreich, um Muster in großen Datasets zu ermitteln und die Korrelation zwischen Eingaben zu ermitteln. Sie eignet sich am besten für kontinuierliche Daten, die einer bekannten Verteilung folgen. Regression wird häufig verwendet, um zu bestimmen, wie sich eine oder mehrere unabhängige Variablen auf eine andere auswirken, z. B. wie sich eine Preiserhöhung auf den Verkauf eines Produkts auswirkt. Unterschieden werden
- Einfache lineare Regression
- Multiple lineare Regression
- Logistische Regression
- Ridge-Regression
Entscheidungsbäume
Entscheidungsbäume sind Klassifizierungsmodelle, die Daten anhand unterschiedlicher Variablen in verschiedene Kategorien einordnen. Die Methode eignet sich am besten, um die Entscheidungen einer Person zu verstehen. Das Modell sieht aus wie ein Baum, wobei jeder Zweig eine potenzielle Wahl darstellt, wobei das Blatt des Zweigs das Ergebnis der Entscheidung darstellt. Entscheidungsbäume sind normalerweise leicht verständlich und funktionieren gut, wenn ein Datensatz mehrere Variablen enthält.
Neuronale Netzwerke
Neuronale Netzwerke sind Methoden des maschinellen Lernens, die bei der Vorhersage sehr komplexer Beziehungen bei der Vorhersageanalyse nützlich sind. Sie sind im Grunde Motoren für die Mustererkennung. Neuronale Netzwerke werden am besten zum Ermitteln nichtlinearer Beziehungen in Datasets verwendet, insbesondere wenn keine bekannte mathematische Formel zur Analyse der Daten vorhanden ist. Mit neuronalen Netzwerken können die Ergebnisse von Entscheidungsbäumen und Regressionsmodellen validiert werden.
Herausforderungen des überwachten Lernens
Obwohl das überwachte Lernen einige Vorteile bieten kann, wie z. B. Automation, gibt es einige Herausforderungen beim Aufbau:
- Modelle des überwachten Lernens können ein gewisses Maß an Fachwissen erfordern, um korrekt zu strukturieren.
- Das Training von Modellen des überwachten Lernens kann sehr zeitintensiv sein.
- Datensätze können eine höhere Wahrscheinlichkeit für menschliche Fehler aufweisen, was dazu führt, dass Algorithmen falsch lernen.
Beispiel Predictive Modelling für Conversion-Optimierung
Im folgenden Beispiel erstellen wir ein logistisches Regressionsmodell zur Vorhersage der Conversion. Dazu wird in historischen Daten der Indikator 1 oder 0 verwendet (konvertiert, nicht konvertiert).
Anders als bei der linearen Regression, welche mit Hilfe der unabhängigen Variablen (z.B. Alter, Einkommen und Geschlecht) den konkreten Wert der abhängigen Variable (z.B. Umsatz) schätzt, ist der Output einer logistischen Regression dichotom.
Es kann folglich die Wahrscheinlichkeit geschätzt werden, dass ein bestimmtes Ereignis eintritt.
Üblicherweise wird ein Segmentierungsschema in einer Baumstruktur entwickelt und dann für jeden Endknoten ein separates Modell mit geeigneten Prädiktoren entwickelt.
Steht das Modell, lässt sich jeder Kontakt einem Knoten bzw. Segment zuordnen. Das zielgenauere Kampagnen. Wichtig ist jedoch, dass die Modelle mit der Zeit immer wieder überprüft und optimiert werden.