Der Dateneingabe kommt bei jeder statistischen Auswertung eine zentrale Rolle zu, da hier die Grundlagen für alle weiteren Auswertungen gelegt werden. Sowohl bei SPSS als auch bei R können die Daten direkt in das Programm eingegeben werden. Jedoch ist bei beiden Programmen die Eingabe mühselig und fehleranfällig, da Tippfehler nicht sofort erkannt werden. Eine Alternative hierzu ist Microsoft Excel. Dort existiert die Möglichkeit die Daten unmittelbar beim Eingeben zu prüfen und sofort auf ungültige oder fehlerhafte Eingaben hinzuweisen. Im nächsten Schritt kann dann die erstellte Excel-Datei in das gewünschte Statistikprogramm eingelesen werden, so dass die Daten dort ausgewertet werden können.
Tipp: Auch wenn Excel grundlegende statistische Auswertungsverfahren wie Korrelationen, T-Test oder Häufigkeiten unterstützt, ist die statistische Auswertung mit diesem Programm doch stark eingeschränkt. Es lohnt sich daher fast immer der Einsatz eines dedizierten Statistikprogramms, auch wenn der Umgang erst noch erlernt werden muß.
Vorbereitung der Dateneingabe mit Excel
Das Erstellen einer Excel-Tabelle zur Dateneingabe soll an diesem Beispielfragebogen erklärt werden. Dieser Fragebogen besteht aus einem kurzen Demographie-Teil.
- Um diesen Fragebogen zu erfassen, starten sie bitte zuerst Excel und öffnen eine leere Arbeitsmappe. Das Fenster sollte nun so aussehen:
- Im ersten Schritt ist es nötig, die Variablen zu benennen. Dafür müssen die Namen der Variablen in die erste Zeile eingetragen werden. Bei Excel selber gibt es keine Beschränkungen für die Variablennamen, jedoch ist es sinnvoll bei der Wahl von Namen schon die weitere Auswertung im Hinterkopf zu haben. Daher sollten die folgenden Regeln beachtet werden.
- Niemals mit einem Sonderzeichen wie
$
oder_
beginnen. - Möglichst kurze Variablennamen wählen. Es gibt immer noch SPSS-Funktionen, die nicht mehr als 8 Zeichen anzeigen.
- Auch Umlaute sollten vermieden werden, da diese manchmal zu Problemen beim Wechseln zwischen unterschiedlichen Systemen oder Versionen des Auswertungsprogramms führen können.
In dem Beispielfragebogen ist die Nummer der Versuchsperson vermerkt und es wird nach dem Geschlecht, dem Alter und ob die Person studiert hat, gefragt. Um diese Variablen anzlegen, tragen sie bitte in die erste Zeile als Variablennamen
vp_num
,sex
,age
undstudium
ein. Das Excel-Fenster sollte nun so aussehen: - Niemals mit einem Sonderzeichen wie
- Im nächsten Schritt können dann die zulässigen Antworten definiert werden. Anders als SPSS oder R prüft Excel gleich, ob die Eingaben zulässig sind. Dafür klicken Sie bitte zuerst auf den Spaltenkopf
A
, so dass die gesamte Spalte markiert ist. - Nun wählen Sie im Ribbon
Daten
die OptionDatenüberprüfung
aus: - Nun sollte ein Dialogfeld erscheinen, in dem Sie die zulässigen Werte definieren können. Versuchspersonennummern sind in vielen Studien immer ganze, positive Zahlen. Um nur solche Zahlen zuzulassen, wählen Sie bitte im in dem Dialogfeld im ersten Dropdownmenü, das mit
Zulassen:
überschrieben ist, die Optionganze Zahl
aus. Nun können Sie darunter im DropdownmenüDaten
, die Optiongrößer als
auswählen und in das erscheinende FeldMinimum
den Wert 0 eintragen. Das Diaglofeld sollte nun so aussehen.
Wenn Sie dies alles durchgeführt haben, können Sie nun auf
OK
drücken und das Dialogfeld schließt sich. - Sie können nun die Einstellung mal testen. Wenn Sie nun eine ungültige Versuchspersonennummer wie beispielsweise
-1
eingeben, erscheint diese Fehlermeldung und fordert sie zur Korrektur der Eingabe auf. - Um die Variable zur Eingabe der Antworten auf die Frage nach dem Geschlecht des/der TeilnehmerIn einzugeben ist, etwas Vorbereitung nötig. Zuerst legen sie dafür ein neues Tabellenblatt an, in dem Sie auf das
+
unten, neben dem KarteikartenreiterTabelle 1
. - In dem nun leeren Tabellenblatt tragen sie bitte die möglichen Antwortoptionen ein. In unserem Beispiel wäre dies,
männlich
, bzw.weiblich
. Sie müssen dabei nicht auf eine bestimmte Positionierung achten.
Tipp: Auch wenn eine Überschrift für die korrekte Definition der Antwortoptionen nicht nötig ist, empfiehlt es sich diese zu verwenden, um auch bei komplexeren Fragebögen die Übersicht zu behalten. - Nun wechseln Sie bitte wieder in
Tabelle 1
und markieren die Spalte B, die mitsex
überschrieben ist. Dann klicken Sie wieder auf das FeldDatenüberprüfung
in dem RibbonDaten
und bereits bekannte Dialogfeld erscheint wieder. Diesmal wählen sie bitteListe
aus. Das FeldDaten:
bleibt weiterhin ausgegraut und es erschein ein Textfeld, welches mitQuelle:
beschriftet ist. Drücken Sie hier das Tabellensymbol am rechten Rand. - Nun erscheint ein kleines Dialogfeld, indem Sie einen Bezug auf eine andere Zelle eintragen können und das mit
Datenüberprüfung
überschrieben ist. Wechseln sie nun in dieTabelle 2
und wählen sie den Zellenbereich aus, in demMännlich
undweiblich
steht.
Diese bestätigen Sie bitte noch mit der Taste Enter. Das bereits bekannte Dialogfeld zum Eintragen der Variableneigenschaften erscheint, und Sie können dieses auch durch das Drücken des mitOK
beschrifteten Buttons schließen.
Tipp: Lassen sie den Hacken neben der OptionZellendropdown
gesetzt. Hierdurch können Sie neben der Tastatur auch die Maus zur Dateneingabe nutzen. - Sie können auch hier wieder den Erfolg, testen in dem Sie andere Werte als
männlich
oderweiblich
eintragen. - Nun kommen wir zur letzten Variable, der Frage nach dem Alter. Grundsätzlich sind hier nur Werte zwischen 5 Jahren und 120 Jahren realistisch. Allerdings gibt es bei dieser Frage immer TeilnehmerInnen, die diese falsch verstehen und ihr Geburtsdatum oder eine beliebige Zahl eintragen. Daher ist es sinnvoll, dass bei ungültigen Eingaben zwar gewarnt wird, diese aber trotzdem zugelassen werden, so dass auch falsche Angaben eingegeben werden können. Der Beginn ist hier identisch zu den vorhergehenden Schritten. Markieren Sie hierfür die Spalte C und klicken Sie auf das Symbol
Datenüberprüfung
im RibbonDaten
. Im nun erscheinenden Dialog wählen Sie wieder im DialogfeldZulassen:
die Optionganze Zahl
aus und hinterlegen als Minimum5
und als Maximum120
. Dann klicken Sie auf den KarteikartenreiterFehlermeldung
. - In diesem Teil des Dialogfeldes können Sie dann den Hinweis, den sie bei der fehlerhaften Eingabe erhalten und ob es möglich ist, diesen zu ignorieren, festlegen. Damit sie eine Meldung ignorieren können, müssen Sie im Feld
Typ:
die OptionWarnung
statt der bereits ausgewählten OptionFehler
wählen. In dem FeldTitel:
können Sie den Fensternamen des Hinweises einstellen, während in dem FeldFehlermeldung
der Text des Fehlerhinweises eingestellt wird. In diesem Beispiel soll als der Titel Eingabefehler sein und die Fehlermeldung Ungültiges Alter eingegeben!, sein, daher sind diese beiden Texte in den entsprechenden Dialogfelder einzutragen. Das Dialogfeld sollte nun so aussehen und sie können dies mitOK
bestätigen: - Nun sollten Sie auch diese Option testen. Wenn Sie nun eine fehlerhaften Wert im Alter, wie beispielsweise 1962 eingeben, erscheint der folgende Hinweis:
Wenn sie nun auf
Ja
können Sie den ungültigen Wert eintragen, während beim Drücken vonNein
der ungültige Wert bestätigt wird.
Tipp: Auch wenn es naheliegt bei einer Jahreszahl statt der Jahreszahl das Alter direkt zu berechnen und einzutragen, ist trotzdem sinnvoll, die Eingabe der Daten von der Korrektur der Daten zu trennen, da nur so sichergestellt werden, dass die Korrektur regelgeleitet erfolgt und keine Verzerrungen in den Daten entstehen. Die fertige Excel-Datei kann hier heruntergeladen werden.
Import der Daten nach R
Um die nun in Excel eingegebenen Daten direkt nach R zu importieren, benötigen sie das Paket xlsx
, welches Sie mit dem Befehl install.packages(„xlsx“)
installieren können. Die eigentlichen Befehle um dann die Excel-Datei in einen Dataframe, der data
heißt zu laden sind dann:
library(xlsx) data <- read.xlsx(FILENAME,1)
Sie müssen nur FILENAME
durch den korrekten Dateipfad ersetzen.
Tipp: Falls Sie mit Windows arbeiten, ist es nötig die Backslashs (\
) im Dateipfad durch normale Slashs zu ersetzen.
Import der Daten nach SPSS
Falls Sie mit SPSS arbeiten, ist es möglich die Daten nach SPSS zu importieren. Dafür kann der normale Dialog zum Öffnen von Daten verwendet werden, der sich im Menü Datei → Öffnen → Daten… befindet.
In dem nun erscheinenden Dialogfeld müssen Sie dann im Dropdown-Feld den Typ Excel (*.xls, *.xlsx, *.xlsm)
auswählen.
Als letzter Schritt muss dann noch das Blatt der Excel-Tabelle ausgewählt werden. SPSS versucht standardmäßig alle in diesem Blatt enthaltenen Daten dann zu importieren und die Variablentypen korrekt zu setzen.
So nun sollten die Daten korrekt in SPSS überführt sein und die statistische Auswertung kann beginnen.