Auszug
Wenn Sie Datensätze analysieren, sollten Sie als erstes die eindimensionalen Häufigkeitsverteilungen untersuchen, d. h. Sie sollten jede Variable zunächst für sich analysieren. Insbesondere die Verteilung, Lage, Streuung und Schiefe jeder Variablen müssen untersucht werden. Die Ziele hierbei sind:
-
1)
Man bekommt ein Gefühl für die Daten. Dadurch kann man später leichter abschätzen, ob bestimmte Ergebnisse überhaupt richtig sein können. Wenn man z. B. den Datensatz einer Untersuchung analysiert, in der Jugendliche befragt wurden, kann es nachher nicht sein, dass eine Person bei der Variable „Alter“ den Wert „89 Jahre“ aufweist oder dass der Mittelwert der Variable „Alter“ bei „40 Jahren“ liegt. Solche Ergebnisse sind Hinweise auf Fehler im Datensatz oder falsche Syntaxen.
-
2)
Die Untersuchung der eindimensionalen Häufigkeitsverteilungen ergibt erste Hinweise, ob die Fragebögen richtig ausgefüllt wurden oder ob bei der Eingabe in den PC Fehler gemacht wurden. Ein typischer Fehler ist z. B., dass fehlende Werte nicht als solche definiert wurden. Auch kann es z. B. nicht sein, dass jemand ein negatives Alter hat usw. (siehe auch Kapitel 3 in diesem Band).
-
3)
Wenn Variablen zu schief verteilt sind, sind sie oft für die weitere Analyse wertlos. Beispiel: Man möchte den Unterschied zwischen Männern und Frauen untersuchen. Man hat einen Datensatz mit 100 Fällen. Von diesen 100 Befragten waren 98 männlich, 2 weiblich. Die Verteilung ist also extrem schief. Durch diese Schiefe kann man die Unterschiede zwischen Männern und Frauen nicht sinnvoll untersuchen. Es macht beispielsweise nicht viel Sinn, bei zwei Frauen das durchschnittliche Alter zu untersuchen.
-
4)
Man prüft die Voraussetzungen (sofern diese existieren) für die Verfahren, die man später anwenden will. Z. B. verlangen viele Verfahren zur Verarbeitung metrischer Variablen eine (approximative) Normalverteilung (vgl. hierzu Behnke und Behnke (2006), Benninghaus (2005), Jann (2002) oder Vogel (2000)). Wenn diese Voraussetzungen nicht erfüllt sind, darf man das entsprechende Verfahren nicht anwenden. Tut man es doch, besteht die Gefahr, dass man Datenartefakte produziert. Man kann sich nun überlegen, wie man damit umgeht: Entweder man wendet ein anderes Verfahren an, oder man transformiert die Daten (vgl. hierzu Vogel (2000)). In manchen Fällen ist die Anwendung eines Verfahrens unter Einschränkungen auch dann möglich, wenn bestimmte Voraussetzungen nicht erfüllt sind. Dies erfordert dann aber eine vorsichtige Interpretation. Näheres hierzu finden Sie — am Beispiel der Ordinalskalen-in Kapitel 12.
-
5)
Schließlich kann man alle absolut interpretierbaren Variablen mit Hilfe der eindimensionalen Häufigkeitsverteilungen interpretieren und so erste wertvolle Informationen erhalten.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Similar content being viewed by others
Weiterführende Literatur
Baur, Nina / Lamnek, Siegfried (2007): Variables. In: Ritzer, George (Hg.): The Blackwell Encyclopedia of Sociology. Blackwell Publishing Ltd. S. 3120–3123
Behnke, Joachim / Behnke, Nathalie / Baur, Nina (2006): Empirische Methoden der Politikwissenschaft. Paderborn: Ferdinand Schöningh
Behnke, Joachim / Behnke, Nathalie (2006): Grundlagen der statistischen Datenanalyse. Eine Einführung für Politikwissenschaftler. Wiesbaden: VS-Verlag
Benninghaus, Hans (2005): Deskriptive Statistik. Eine Einführung für Sozialwissenschaftler. Wiesbaden: VS-Verlag. S. 29–65
Gigerenzer, Gerd (1999): Über den mechanischen Umgang mit statistischen Methoden. In: Roth, Erwin / Holling, Heinz (Hg.) (1999): Sozialwissenschaftliche Methoden. Lehr-und Handbuch für Forschung und Praxis. 5.Auflage. München / Wien: R. Oldenbourg. S. 607–618
Haaland, Jan-Aage/ Jorner, Ulf/ Persson, Rolf/ Wallgren, Anders/ Wallgren, Anders (1996): Graphing Statistics & Data. Creating Better Charts. Thousand Oaks / London / New Delhi: Sage
Krämer, Walter (2001): Statistik verstehen. Eine Gebrauchsanweisung. München / Zürich: Piper
Jacoby, William G. (1998): Statistical Graphics fpr Visualizing Univariate and Bivariate Data. Thousand Oaks / London / New Delhi: Sage
Jann, Ben (2002): Einführung in die Statistik. München / Wien: Oldenbourg 19–58
Schulze, Gerhard (2002a): Einführung in die Methoden der empirischen Sozialforschung. Reihe: Bamberger Beiträge zur empirischen Sozialforschung. Band 1. Kapitel „Univariate Verteilungen“
Tufte, Edward R. (1990): Envisioning Information. Cheshire (CT): Graphics Press
Tufte, Edward R. (2001): The Visual Display of Quantitative Information. Cheshire (CT): Graphics Press
Wittenberg / Cramer (2003): Datenanalyse mit SPSS für Windows. Stuttgart: Lucius & Lucius. (Insbesondere folgende Kapitel: Datenprüfung und Datenbereinigung: DESCRIPTIVES, FREQUENCIES, LIST; Univariate deskriptive und konfirmatorische Datenanalyse: FREQUENCIES, DESCRIPTIVES)
Author information
Authors and Affiliations
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 2008 VS Verlag für Sozialwissenschaften | GWV Fachverlage GmbH, Wiesbaden
About this chapter
Cite this chapter
Baur, N. (2008). Univariate Statistik. In: Baur, N., Fromm, S. (eds) Datenanalyse mit SPSS für Fortgeschrittene. VS Verlag für Sozialwissenschaften. https://doi.org/10.1007/978-3-531-91034-5_11
Download citation
DOI: https://doi.org/10.1007/978-3-531-91034-5_11
Publisher Name: VS Verlag für Sozialwissenschaften
Print ISBN: 978-3-531-34163-7
Online ISBN: 978-3-531-91034-5
eBook Packages: Humanities, Social Science (German Language)