Paneldaten
Bei Paneldaten handelt es sich um zweidimensionale Daten, die im Rahmen einer Panelstudie erhoben werden. Bei einer Panelstudie wird dieselbe Stichprobe zu mehreren Zeitpunkten untersucht, es handelt sich also um eine Kombination von:
- Querschnittsdaten, in denen die Einheiten zu einem einzigen Zeitpunkt erfasst werden, und
- Zeitreihendaten, in denen eine einzige Einheit über mehrere Zeitperioden beobachtet wird.
Neben den immer selben Untersuchungseinheiten (z. B. Personen, Haushalte oder Unternehmen) im Panel und der mehrfachen Durchführung der Erhebung (z. B. monatlich, jährlich oder zweijährlich) wird als drittes Merkmal genannt, dass dieselben oder zumindest die gleichen Inhalte erfragt oder erhoben werden.
Die Paneldatenanalyse ist die statistische Analyse von Paneldaten im Rahmen der Panelforschung. Obwohl es sich bei einem Panel weiterhin um Beobachtungsstudien handelt (es findet keine Intervention statt), besteht ein wesentliches Ziel darin, der Kausalanalyse so nah wie möglich zu kommen.
Paneldaten werden in Tabellen organisiert, die aus Zeilen und Spalten bestehen. Dabei gibt es zwei wesentliche Formate (vgl. Wide-Format und Long-Format):
- beim Wide-Format entspricht eine Zeile einem Untersuchungsobjekt, und die Messwerte der Zeitpunkte werden als Spalten angehängt.
- beim Long-Format wird für jede durchgeführte Beobachtung eine Zeile hinzugefügt, dasselbe Objekt taucht also in mehreren Zeilen auf.
Wird jede Person-Jahr-Kombination als einzelne Beobachtung betrachtet, spricht man von gepoolten Daten.
- ↑ Baur, N., & Blasius, J. (Eds.). (2014). Handbuch Methoden der empirischen Sozialforschung. Wiesbaden, Germany: Springer VS. S. 925