Die Faktorenanalyse dient der Variablenreduktion und Strukturaufdeckung in einer Stichprobe. Ursprünglich wurde das Verfahren zur Auswertung von Intelligenztests entwickelt und kommt heute bevorzugt bei empirischen Marktstudien zum Einsatz.
Erfahren Sie in diesem Beitrag, wie eine Faktorenanalyse funktioniert, welche Methoden sie verwendet und was bei ihrer Interpretation zu beachten ist.
Was ist eine Faktorenanalyse?
Eine Faktorenanalyse ist eine statistische Methode zur Datenstrukturierung und ein wichtiges Instrument für Markt- und Positionierungsanalysen. Sie fasst ähnliche Variablen zu wenigen Faktoren zusammen (explorative Faktorenanalyse) und kann erwartete Faktorenstrukturen auf deren Konsistenz überprüfen (konfirmatorische Faktorenanalyse).
Wozu dient die Faktorenanalyse?
Eine Faktorenanalyse, auch Faktoranalyse genannt, ist ein Verfahren der multivariaten Statistik mit drei wesentlichen Zielsetzungen:
- Reduktion der Variablenzahl: Messdaten aus einer Vielzahl von Variablen (Merkmalen) lassen sich nur schwer analysieren und interpretieren. Die Faktorenanalyse erkennt Variablen mit ähnlichen Informationen und fasst diese zu homogenen Gruppen beziehungsweise Faktoren zusammen.
- Datenstrukturierung: Die Reduktion auf wenige, bestenfalls voneinander unabhängige Faktoren sorgt für eine übersichtlichere Datengrundlage, welche für weiterführende Analysen genutzt werden kann.
- Prüfung erwarteter Zusammenhänge: Liegen bereits Theorien vor, wie die untersuchten Daten miteinander in Beziehung stehen, so kann die Faktorenanalyse diese Zusammenhänge nachprüfen.
Welche Ziele dabei jeweils verfolgt werden, hängt von der Art des Verfahrens ab. Generell wird zwischen einer konfirmatorischen (KFA) und einer explorativen Faktorenanalyse (EFA) unterschieden.
Hinweis: In der Literatur wird oft auch von „manifesten Variablen“ und „latenten Variablen“ (Faktoren) gesprochen.
Konfirmatorische Faktorenanalyse
Bei dieser Form handelt es sich um ein hypothesenprüfendes Verfahren. Voraussetzung ist ein vordefiniertes Modell an möglichen Faktoren, das im Hinblick auf die vorliegenden Daten validiert werden soll. Oder anders formuliert: Sie vermuten bereits diverse Zusammenhänge und möchten diese nachprüfen. Dementsprechend geht eine KFA nach folgendem Schema vor:
- Modelldefinition
- Parameterschätzung
- Modellauswertung
- Modellmodifikation (falls abweichend)
Explorative Faktorenanalyse
Die EFA sucht explorativ nach Korrelationen zwischen den Variablen, um diese zu aussagekräftigen Faktoren zusammenzufassen. Gibt es also Variablen mit ähnlichen Informationen („anregend“, „aromatisch“ und „frisch“), wird ihnen ein gemeinsamer Faktor zugeteilt („Geschmack“).
Im Mittelpunkt einer EFA steht demnach die Variablenreduktion, was zu der kritischen Frage führt, wie viele Faktoren aus den Daten extrahiert werden sollen, da dies vorab nicht bekannt ist. Berücksichtigen Sie hierzu folgende Überlegungen:
- Niedrige Faktorenzahl: Je weniger Faktoren Sie extrahieren, desto höher sind die Variablenreduktion und der Analysenutzen. Allerdings ist damit auch ein hoher Informationsverlust verbunden.
- Hohe Faktorenzahl: Vorteil dieser Variante ist, dass der Informationsverlust geringer ausfällt. Dafür bleiben mehr Variablen übrig, wodurch sich auch der Analysenutzen verringert.
Es gibt weder feste Richtlinien noch ein Richtig oder Falsch, was die Faktorenanzahl betrifft. Weiter unten werden wir Ihnen jedoch ein paar Kriterien vorstellen, die diese Frage vereinfachen.
Hinweis: Eine Faktorenanalyse ist allgemein nur dann möglich, wenn die verwendeten Variablen normalverteilt und intervallskaliert sind. Außerdem sollten ausreichend Variablen pro Faktor (mindestens vier) und ausreichend Daten pro Variable (mindestens zehn) gegeben sein, um die Informationen sinnvoll zu verdichten.
Begriffsdefinitionen: Faktorladung, Kommunalität, Eigenwert
Zum besseren Verständnis eines EFA-Ablaufs sollten Sie drei wichtige Begriffe kennen: Faktorladung, Kommunalität und Eigenwert.
Faktorladung: Sie drückt die Stärke des Zusammenhangs zwischen einer Variablen und einem Faktor aus. Ihr Wert liegt zwischen -1 und 1, wobei ein positiver Wert auf eine starke Korrelation hindeutet. Ein intuitives Beispiel: Das Merkmal „lecker“ lädt stärker auf dem Faktor „Geschmack“ als das Merkmal „bunt“.
Kommunalität: Wie schon erwähnt, gehen im Zuge der Faktorenextraktion gewisse Informationen verloren. Diese Abweichung wird als Varianz bezeichnet und kann für einzelne Variablen ermittelt werden, indem man die jeweiligen Faktorladungen über alle Faktoren quadriert und aufaddiert. Das Ergebnis ist die sogenannte Kommunalität: Sie gibt an, wie viel Varianz eine Variable an allen Faktoren erklärt.
Eigenwert: In Abgrenzung zur Kommunalität definiert der Eigenwert, wie viel Varianz ein Faktor (statt einer Variable) erklärt. Er berechnet sich aus der Summe der quadrierten Faktorladungen eines Faktors über alle Variablen. Ein Eigenwert von 1 heißt, dass ein Faktor genauso viel Varianz wie eine Variable erklärt.
Beispiel einer Faktorenanalyse: Ablauf und Interpretation
Eine EFA wird grundsätzlich in vier Hauptschritten durchgeführt, auf die wir im Folgenden detaillierter eingehen:
1. Erstellung der Korrelationsmatrix
Ausgangspunkt jeder EFA ist die Auswahl der für die Analyse geeigneten Variablen und die damit verbundene Erstellung der Korrelationsmatrix. Variablen, die zu den anderen weitgehend isoliert stehen, können ausgeschlossen werden.
2. Faktorenextraktion
Im zweiten Schritt müssen die Faktoren extrahiert werden, damit die ausgewählten Variablen auf diese verteilt werden können. Wie viele dieser Faktoren am Ende beibehalten werden, entscheidet allerdings erst der nächste Schritt. Die Herausforderung besteht darin, möglichst wenige Faktoren zu finden (hohe Informationsreduktion), gleichzeitig aber auch möglichst wenige Informationen zu verlieren. Dazu gibt es zwei grundlegende Extraktionsmethoden:
- Hauptachsenanalyse: Diese geht davon aus, dass ein Teil der Varianz nicht durch die Faktoren erklärt werden kann. Es wird daher zwischen Einzelrestvarianz und Kommunalität unterschieden. Ziel der Methode ist, Faktoren zu extrahieren, die die Varianzen der Variablen in der Höhe der Kommunalitäten erklären. Die Höhe der Kommunalitäten muss zuvor geschätzt werden.
- Hauptkomponentenanalyse: Diese nimmt an, dass die gesamte Varianz durch die Faktoren erklärt werden kann und die Summe der Kommunalitäten daher 1 ist. Im Vordergrund der Methode steht die Datenreduktion.
3. Festlegen der Faktorenzahl
Nach der Faktorenextraktion muss entschieden werden, wie viele der Faktoren letztlich bestehen bleiben. Dazu gibt es eine Reihe von Kriterien und Vorgehensweisen, die Sie zu Hilfe nehmen können:
- Die Zahl der Faktoren ist weniger als die Hälfte der Variablen.
- Es wird so lange extrahiert, bis eine willkürlich definierte Prozentzahl der Gesamtvarianz erklärt ist. Die entsprechende Zahl an Faktoren wird hieraus abgeleitet.
- Es werden diejenigen Faktoren übernommen, die sich inhaltlich interpretieren lassen.
- Kaiser-Kriterium: Es werden diejenigen Faktoren beibehalten, die einen Eigenwert über 1 haben.
- Eigenwertdiagramm/Scree-Plot: Es werden diejenigen Faktoren beibehalten, deren Eigenwerte über den Zufallseigenwerten liegen („links von der Knickstelle“, auch: Ellenbogenkriterium).
4. Interpretation der Faktoren
Da die Faktorenanalyse im Grunde nur Faktoren liefert, liegt es an der durchführenden Person, diese inhaltlich zu interpretieren. Um deren Interpretierbarkeit zu erleichtern, wird eine sogenannte Faktorenrotation durchgeführt — die Faktoren werden dabei transformiert.
Hinweis: Das Rotieren von Faktoren ist nur bei einer Hauptachsenanalyse notwendig.
Je nach Annahme, ob die Faktoren untereinander korrelieren oder nicht, gibt es zwei Rotationsmethoden: die orthogonale (rechtwinklige) Rotation und die oblique (schiefwinklige) Rotation. Das angestrebte Ziel ist, dass jede Variable nur auf einem Faktor und nicht auf mehreren Faktoren lädt, was als Einfachstruktur bezeichnet wird. Diese ist zwar kein Muss, macht das Interpretieren aber sehr viel leichter.
Fazit: Faktorenanalyse — Mehrwert durch Datenreduktion
Durch eine Faktorenanalyse lassen sich Beziehungsstrukturen in Stichproben aufdecken oder überprüfen, wodurch sich einfachere Interpretationen oder auch weiterführende Analysen ergeben. Die Reduktion vieler Variablen auf wenige Faktoren erleichtert es Marketern und Marketerinnen, sich auf die wichtigsten Datencluster zu konzentrieren.
In der Marktforschung ist die Faktorenanalyse daher ein unerlässliches Mittel, um Datenmengen effizient zu analysieren und Fragestellungen gezielter zu beantworten.
Titelbild: courtneyk / iStock / Getty Images Plus