Methodik · Marketing-Wirkungsmessung

Wie hat die Marketingkampagne wirklich gewirkt?

Wenn ein Verkehrsunternehmen mehrere Vertriebskanäle betreibt und gleichzeitig eine Kampagne läuft, reicht ein reiner Vergleich der Verkaufszahlen nicht aus. Eine trendbereinigte Analyse trennt den zusätzlichen Effekt der Maßnahme vom ohnehin erwartbaren Wachstum. So wird sichtbar, ob Marketing nur gut aussieht oder tatsächlich messbar wirkt.

mobility-pricing.de Lesezeit · 10 Min · mit R-Code

Management Summary

Marketing wird im Alltag oft zu schnell bewertet. Eine Aktion läuft, die Abschlüsse steigen, und schon steht die Erfolgsmeldung im Raum. Genau an dieser Stelle wird es statistisch interessant. Denn ein Teil des Wachstums wäre möglicherweise auch ohne Kampagne entstanden. Ich trenne deshalb den natürlichen Trend von dem zusätzlichen Effekt der Maßnahme. Dazu schätze ich zuerst eine Trendfunktion auf den Monaten vor der Kampagne. Diese Funktion beschreibt den erwarteten Verlauf ohne Marketing. Danach vergleiche ich diesen erwarteten Verlauf mit den tatsächlichen Werten während der Kampagne. Die Differenz ist der trendbereinigte Effekt. Zusätzlich schätze ich eine zweite Trendfunktion über die gesamte Zeitreihe, um zu zeigen, wie stark die Kampagne die sichtbare Dynamik verändert. Der naive Vorher-Nachher-Vergleich ist dafür nicht ausreichend, weil er Trend und Wirkung vermischt. Ein t-Test auf den Marketing-Koeffizienten prüft, ob der zusätzliche Effekt statistisch von null verschieden ist. Der Chow-Test ergänzt diese Sicht, weil er fragt, ob sich die Regressionsstruktur am Kampagnenstart verändert hat. Eine Changepoint-Analyse geht noch einen Schritt weiter und sucht datengetrieben nach dem wahrscheinlichsten Bruchzeitpunkt. Am Ende entsteht keine perfekte Kausalstudie, aber eine belastbare, transparente und nachbaubare Wirkungsmessung.

§ 01 · Das Problem

Warum steigende Verkäufe noch kein Wirkungsnachweis sind

Eine Marketingkampagne läuft an, die Abschlusszahlen steigen, der Bericht ans Management ist schnell geschrieben: plus 1.200 Verträge gegenüber dem Vorjahr. Genau hier beginnt aber das methodische Problem. Ein Teil dieses Zuwachses kann auch ohne Kampagne entstanden sein: durch den bereits vorhandenen Trend, Preiseffekte, Saisonalität, organische Bekanntheit oder externe Nachfrageimpulse. Wer das nicht trennt, bewertet die Kampagne zu positiv und zieht möglicherweise falsche Schlüsse für die nächste Maßnahme.

Eine naive Vorher-Nachher-Betrachtung ohne Trendkorrektur hätte denselben Datensatz deutlich positiver dargestellt. Nicht weil die Kampagne schlecht war, sondern weil der natürliche Trend fälschlich dem Marketing zugerechnet worden wäre.

„Der Trend zeigt, wohin sich die Verkäufe ohnehin bewegt hätten. Erst die Abweichung davon ist der Teil, den wir dem Marketing zurechnen dürfen."

§ 02 · Spielwiese

Drehen Sie an den Stellschrauben

Die Grafik unten simuliert eine monatliche Zeitreihe von Abschlüssen. Die gestrichelte graue Linie ist das Counterfactual – also der erwartete Verlauf ohne Kampagne. Die schwarze Linie zeigt die tatsächlichen Werte inklusive Maßnahme. Die rote Fläche dazwischen ist der trendbereinigte zusätzliche Effekt.

Verschieben Sie die Regler, um Basistrend, Effektstärke, Streuung und Sockelwert zu verändern. Diagramm, Tests und Tabelle aktualisieren sich live.

Trendbereinigte Wirkungsanalyse

// 24 Monate · Intervention ab Monat 13

Tatsächlich mit Marketing Counterfactual ohne Marketing Trend über gesamte Reihe

Basistrend pro Monat (β) 3.0

Marketing-Effekt pro Monat 15

Streuung (σ) 5

Sockelwert (α) 80

Trendbereinigter Effekt — Σ (Ist − Counterfactual) während der Kampagne

Naive Schätzung — Σ (Ist − Pre-Mittelwert) während der Kampagne

Überschätzung — naive Schätzung minus trendbereinigter Effekt

Zeitreihe als Tabelle anzeigen

Monat	Ist-Wert	Counterfactual	Differenz

§ 03 · Methodik

Fünf Schritte zur sauberen Wirkungsmessung

Die Vorgehensweise ist nicht kompliziert, aber sie muss konsequent durchgeführt werden. Zuerst wird der Verlauf vor der Kampagne geschätzt. Danach wird berechnet, wie sich die Abschlüsse ohne Kampagne wahrscheinlich entwickelt hätten. Erst anschließend werden Ist-Werte, Trendfunktionen und Tests miteinander verglichen. Ein Klick auf das i-Symbol zeigt jeweils Ziel und zugrundeliegende Annahmen.

Erste Trendfunktion: Pre-Periode
Schätzung der linearen Regression auf den Monatsdaten vor der Maßnahme. Diese Funktion ist die Basis für das Counterfactual.

y_t = α + β · Monat_t + ε_t
Counterfactual berechnen
Mit den Parametern der ersten Trendfunktion wird die Zeitreihe in die Kampagnenmonate extrapoliert. Diese Prognose beschreibt, was ohne Marketing wahrscheinlich passiert wäre.

ŷ_t(ohne Marketing) = α̂_pre + β̂_pre · Monat_t
Zweite Trendfunktion: gesamte Zeitreihe
Zusätzlich wird eine Regression über alle Monate geschätzt. Diese zweite Trendfunktion enthält bereits den Kampagneneffekt und dient deshalb nicht als Counterfactual, sondern als Vergleich: Sie zeigt, wie stark sich die sichtbare Dynamik der Reihe verändert.
Differenz und Steigungsänderung interpretieren
Die Lücke zwischen Counterfactual und Ist-Werten in den Kampagnenmonaten ist der trendbereinigte Effekt. Der Vergleich der beiden Trendfunktionen zeigt zusätzlich, ob die Kampagne nur einen Niveausprung erzeugt oder auch die Steigung der Zeitreihe verändert hat.
Statistische Tests
Tests entscheiden nicht, ob Marketing „gut" war. Sie prüfen nur, ob der gemessene Effekt unter den Modellannahmen plausibel vom Zufall zu unterscheiden ist. Drei Verfahren liefern dazu unterschiedliche Perspektiven.

§ 04 · Tests

Drei Verfahren, die unterschiedliche Fragen beantworten

Ein sichtbarer Sprung in der Zeitreihe reicht nicht aus. Der t-Test auf den Marketing-Koeffizienten prüft einen Niveaueffekt. Der Chow-Test prüft einen Strukturbruch an einem vorab definierten Zeitpunkt. Die Changepoint-Analyse sucht datengetrieben, wo der wahrscheinlichste Bruch liegt. Gemeinsam liefern diese Verfahren kein perfektes Kausalurteil, aber eine deutlich bessere Grundlage als ein einfacher Vorher-Nachher-Vergleich.

t-Test auf den Marketing-Koeffizienten

γ̂ (Marketing-Koeffizient) —

Standardfehler von γ̂ —

t-Wert für γ̂ —

—

Chow-Test auf Strukturbruch

SSR ohne Strukturbruch —

SSR mit getrennten Trends —

F-Wert —

—

Changepoint-Analyse

Für jeden möglichen Bruchzeitpunkt τ wird die Summe der Residuenquadrate zweier separater Regressionen berechnet. Das Minimum markiert den Bruch, der statistisch am besten zur Datenstruktur passt. Entscheidend ist danach die fachliche Prüfung: Passt dieser Zeitpunkt zur Kampagne oder gab es parallel andere Ereignisse?

Geschätzter Bruchzeitpunkt —

Tatsächlicher (simuliert) 12

Treffergenauigkeit —

§ 05 · R-Code

Reproduzierbar mit R

Die komplette Analyse lässt sich in einem kurzen R-Skript reproduzieren. Die erste Trendfunktion wird auf den Monaten vor der Kampagne geschätzt. Die zweite Trendfunktion nutzt die gesamte Reihe. Für Strukturbruchtests eignet sich in R vor allem strucchange; für datengetriebene Bruchpunktsuche können je nach Fragestellung strucchange, changepoint oder verwandte Pakete genutzt werden.

R · Trendfunktionen, Interventionsmodell, Chow-Test & Changepoint

§ 06 · Fazit

Was bleibt

Marketing wird oft sehr schnell bewertet: Die Zahlen steigen, also war die Aktion erfolgreich. Für eine belastbare Bewertung reicht das nicht. Erst wenn der vorhandene Trend abgezogen wird, sieht man, welcher Teil der Entwicklung tatsächlich zusätzlich entstanden ist. Genau dafür ist Statistik im Marketing nützlich: nicht als akademische Übung, sondern als Schutz vor falschen Entscheidungen.

Im konkreten Beispiel sind das nicht 1.200 zusätzliche Abschlüsse, sondern rund 687. Die Differenz ist kein Misserfolg des Marketings. Sie zeigt nur sauber, welcher Teil des Wachstums dem Marketing gehört – und welcher Teil ohnehin zu erwarten gewesen wäre.