Sie haben das Gefühl, dass mit steigender Anzahl von Blogposts Ihre Besucherzahlen steigen? Doch in welcher Abhängigkeit stehen die beiden Kennzahlen zueinander? Und wie hoch muss der Output auf Ihrem Blog sein, damit Sie die gewünschte Anzahl von Besucherinnen und Besuchern generieren?

Die Regressionsanalyse hilft Ihnen bei der Berechnung. Hier erfahren Sie, welche Arten der Regressionsanalyse es gibt, warum Sie im Onlinemarketing auf das Verfahren setzen sollten und wie Sie die Gleichung interpretieren.

→ Vorlage für Ihre Wettbewerbsanalyse [Kostenloser Download]

Typische Anwendungen der Regressionsanalyse

Eine Regressionsanalyse ist in folgenden drei Fällen besonders nützlich:

  • Beziehung zwischen Variablen beschreiben: Hierbei wird untersucht, inwiefern ein Zusammenhang zwischen beiden Variablen besteht. Es kann beispielsweise betrachtet werden, welchen Einfluss das Wetter auf die Anzahl der Besucher und Besucherinnen einer Veranstaltung hat.
  • Prognose über eine Veränderung treffen: Die Regressionsanalyse ist außerdem dazu geeignet, Erwartungen für zukünftige Ereignisse zu berechnen, wenn sich die unabhängige Variable verändert. So lässt sich beispielsweise bestimmen, wie sich die Besucheranzahl für eine Veranstaltung bei steigendem Ticketpreis verändern wird.
  • Wert zu einem bestimmten Zeitpunkt vorhersagen: Der dritte Anwendungsfall wird genutzt, um einen Wert vorherzusagen. Die Regressionsanalyse wird dabei beispielsweise eingesetzt, um zu berechnen, welchen Wert ein Produkt nach einer Nutzung von fünf Jahren haben wird.

Wann ist eine Regressionsanalyse sinnvoll?

Eine Regressionsanalyse eignet sich für die Beschreibung von Zusammenhängen zwischen mindestens zwei Sachverhalten. Nutzen Sie eine Regressionsanalyse, um die Beziehung zwischen Variablen zu beschreiben, eine Prognose über eine Veränderung zu treffen oder einen Wert zu einem bestimmten Zeitpunkt vorherzusagen.

Regressionsanalyse: Die Voraussetzungen

Die Voraussetzungen der Regressionsanalyse werden als Gauss-Markov-Annahmen bezeichnet. Sie sichern, dass die Analyse ein valides Ergebnis hat. Die Annahmen lauten wie folgt:

  • Der Zusammenhang zwischen der abhängigen und der unabhängigen Variablen ist linear.
  • Die Daten entstammen einer Zufallsstichprobe.
  • Gibt es mehrere unabhängige Variablen, sind diese nicht linear.
  • Der Fehlerwert jeder unabhängigen Variablen hat den Erwartungswert 0 (bedingter Erwartungswert).
  • Die Varianz des Fehlerwertes ist für alle unabhängigen Variablen gleich (Homoskedastizität).

Die Voraussetzungen hängen zudem von der Art der Regressionsanalyse ab. Je nach Ausgangslage und Ziel der Auswertung existieren diese verschiedenen Möglichkeiten:

  • Lineare Regressionsanalyse
  • Multiple Regressionsanalyse
  • Logistische Regressionsanalyse
  • Multivariate Regressionsanalyse

Lineare Regressionsanalyse

Die einfachste Art der Regressionsanalyse ist die lineare Regression. Dabei besteht eine lineare Abhängigkeit zwischen den Variablen. Verändert sich der Wert der unabhängigen Variablen, so ändert sich auch der Wert der zweiten, abhängigen Variablen.

Die Formel lautet:

Lineare Regressionsanalyse Gleichung

y ist dabei die abhängige Variable (Kriterium) und x die unabhängige Variable (Prädikator); b gibt das Regressionsgewicht an. Der Koeffizient bestimmt also, wie stark oder schwach der Wert des Kriteriums y steigt oder fällt, wenn sich die unabhängige Variable x verändert. a beschreibt die Regressionskonstante. Sie bestimmt, welchen Wert die abhängige Variable y annimmt, wenn der Prädikator x gleich 0 ist.

Multiple Regressionsanalyse

Die multiple Regressionsanalyse ist eine Weiterführung der einfachen Regression. Hierbei werden statt einer mehrere unabhängige Variablen betrachtet. Der Zusammenhang zwischen der abhängigen Variablen und den unabhängigen Variablen wird jedoch weiterhin als linear angenommen.

Die Gleichung lautet:

Multiple Regressionsanalyse Gleichung

Die Regressionskonstante a bleibt für die gesamte Berechnung gleich. Die Regressionsgewichte werden pro unabhängige Variable (b1, b2) berechnet und in die Formel eingesetzt.

Multivariate Regressionsanalyse

Die multivariate Regression untersucht im Gegensatz zur multiplen Regressionsanalyse mehrere abhängige Variablen gleichzeitig. Dieser Ansatz eignet sich daher zur Analyse verschiedener Ergebnisse, um Muster innerhalb der Datensätze zu erkennen.

Auch hier lautet die Gleichung, in Abhängigkeit von den abhängigen Variablen:

Multivariate Regressionsanalyse Gleichung

Je mehr Variablen untersucht werden, desto komplexer ist die Gleichung. Sinnvoll ist die multivariate Regressionsanalyse zudem nur, wenn eine Vielzahl von Daten vorliegt. Existieren nur wenige Stichproben, dann lohnt sich die Berechnung in der Regel nicht.

Logistische Regressionsanalyse

Die logistische Regressionsanalyse wird immer dann angewendet, wenn das Kriterium nominalskaliert und nicht mehr metrisch ist. Das bedeutet, dass die abhängige Variable verschiedene Ausprägungen haben kann. Als Beispiel kann ein Examen betrachtet werden, das die Ausprägungen „bestanden“ oder „durchgefallen“ aufweist.

Beträgt das Kriterium der logistischen Regression zwei Ausprägungen, wird von der binären logistischen Regression gesprochen. Treten jedoch mehr als zwei Kriterien auf, dann ist von der multinominalen logistischen Regression die Rede.

Mit der logistischen Regressionsanalyse wird eine Prognose über die Wahrscheinlichkeit eines Ereignisses getroffen. Sie können beispielsweise bestimmen, wie wahrscheinlich es ist, dass eine Person, die sieben Tage für eine Abschlussprüfung gelernt hat, die Prüfung bestehen wird. Prädiktor ist in diesem Fall das Lernverhalten. Die Kriterien „bestanden“ und „abgelehnt“ werden jeweils mit 0 und 1 definiert.

Die Gleichung lautet:

Logistische Regressionsanalyse Gleichung

e bezeichnet hierbei die Eulersche Zahl, die einen ungefähren Wert von 2,7 hat. Die Koeffizienten ß werden mit der Maximum-Likelihood-Methode berechnet; x bezeichnet den Prädikator. Die Berechnung findet aufgrund ihrer Komplexität mit einem Computer statt.

Beispiel für eine Regressionsanalyse: Anwendung im Onlinemarketing

Die Regressionsanalyse findet abseits des BWL-Studiums vielfältige Anwendung. So lässt sich die einfache Regression im Onlinemarketing an einem Beispiel leicht wiederfinden:

Ein Onlineshop möchte herausfinden, welchen Einfluss die Größe des Sortiments in der Kategorie „Neu“ auf die durchschnittliche Verweildauer der Besucher hat. Die abhängige Variable ist folglich die Anzahl der Besucher. Die unabhängige, sich verändernde Variable ist die durchschnittliche Verweildauer. Nachdem Stichproben gesammelt und in eine Tabelle eingetragen wurden, können die Werte in ein Diagramm übertragen werden. Das Diagramm zeigt einen linearen Zusammenhang.

Möchten Sie nun herausfinden, wie groß die Besucherzahl bei einem Sortiment von 1.000 Produkten ist, können Sie dies ganz einfach über die Formel der linearen Regressionsanalyse herausfinden.

Regressionsanalyse interpretieren: Was bedeuten die Koeffizienten?

Setzen Sie die Zahlen aus dem oben beschriebenen Beispiel in Ihre Formel ein, dann sieht die Gleichung wie folgt aus: y = b*1000 + a.

Sie müssen nun nur noch die Regressionskoeffizienten b und a berechnen. Dazu benötigen Sie Mittelwerte, Standardabweichungen, Kovarianz und Korrelation.

Ist das Vorzeichen des Regressionsgewichtes b negativ, dann besteht ein negativer Zusammenhang zwischen den Variablen. In diesem Fall führt eine höhere Verweildauer zu weniger Besucher und Besucherinnen. Ist das Vorzeichen positiv, besteht ein positiver Zusammenhang.

Die Regressionskonstante a zeigt den Wert, den das Kriterium annimmt, wenn die unabhängige Variable – also in diesem Fall die Verweildauer – 0 beträgt.

Analysieren Sie die Abhängigkeiten Ihrer Kennzahlen

Die Regressionsanalyse sieht auf den ersten Blick kompliziert aus. Mit dem statistischen Verfahren lassen sich jedoch wichtige Zusammenhänge zwischen verschiedenen Daten ausfindig machen, was unter anderem in der Marktforschung nützlich ist.

Im Onlinemarketing wird die einfache, lineare Regression beispielsweise eingesetzt, um Voraussagen über Kennzahlen zu treffen. Umfassende Datenanalysen können darüber hinaus mit einer multiplen oder logistischen Regression durchgeführt werden.

New call-to-action

 New call-to-action

Titelbild: VectorMine / iStock / Getty Images Plus

Ursprünglich veröffentlicht am 22. Februar 2022, aktualisiert am Januar 20 2023

Themen:

Marktforschung