Dateneingabe mit Excel für SPSS oder R

Der Dateneingabe kommt bei jeder statistischen Auswertung eine zentrale Rolle zu, da hier die Grundlagen für alle weiteren Auswertungen gelegt werden. Sowohl bei SPSS als auch bei R können die Daten direkt in das Programm eingegeben werden. Jedoch ist bei beiden Programmen die Eingabe mühselig und fehleranfällig, da Tippfehler nicht sofort erkannt werden. Eine Alternative hierzu ist Microsoft Excel. Dort existiert die Möglichkeit die Daten unmittelbar beim Eingeben zu prüfen und sofort auf ungültige oder fehlerhafte Eingaben hinzuweisen. Im nächsten Schritt kann dann die erstellte Excel-Datei in das gewünschte Statistikprogramm eingelesen werden, so dass die Daten dort ausgewertet werden können.

Tipp: Auch wenn Excel grundlegende statistische Auswertungsverfahren wie Korrelationen, T-Test oder Häufigkeiten unterstützt, ist die statistische Auswertung mit diesem Programm doch stark eingeschränkt. Es lohnt sich daher fast immer der Einsatz eines dedizierten Statistikprogramms, auch wenn der Umgang erst noch erlernt werden muß.

Vorbereitung der Dateneingabe mit Excel

Das Erstellen einer Excel-Tabelle zur Dateneingabe soll an diesem Beispielfragebogen erklärt werden. Dieser Fragebogen besteht aus einem kurzen Demographie-Teil.

  1. Um diesen Fragebogen zu erfassen, starten sie bitte zuerst Excel und öffnen eine leere Arbeitsmappe. Das Fenster sollte nun so aussehen:
    Dateneingabe mit Excel - Ausgangssituation
  2. Im ersten Schritt ist es nötig, die Variablen zu benennen. Dafür müssen die Namen der Variablen in die erste Zeile eingetragen werden. Bei Excel selber gibt es keine Beschränkungen für die Variablennamen, jedoch ist es sinnvoll bei der Wahl von Namen schon die weitere Auswertung im Hinterkopf zu haben. Daher sollten die folgenden Regeln beachtet werden.
    • Niemals mit einem Sonderzeichen wie $ oder _ beginnen.
    • Möglichst kurze Variablennamen wählen. Es gibt immer noch SPSS-Funktionen, die nicht mehr als 8 Zeichen anzeigen.
    • Auch Umlaute sollten vermieden werden, da diese manchmal zu Problemen beim Wechseln zwischen unterschiedlichen Systemen oder Versionen des Auswertungsprogramms führen können.

    In dem Beispielfragebogen ist die Nummer der Versuchsperson vermerkt und es wird nach dem Geschlecht, dem Alter und ob die Person studiert hat, gefragt. Um diese Variablen anzlegen, tragen sie bitte in die erste Zeile als Variablennamen vp_num, sex, age und studium ein. Das Excel-Fenster sollte nun so aussehen:
    Dateneingabe mit Excel - Spaltenüberschrift

  3. Im nächsten Schritt können dann die zulässigen Antworten definiert werden. Anders als SPSS oder R prüft Excel gleich, ob die Eingaben zulässig sind. Dafür klicken Sie bitte zuerst auf den Spaltenkopf A, so dass die gesamte Spalte markiert ist.
    Dateneingabe mit Excel - Markieren der Spalte
  4. Nun wählen Sie im Ribbon Daten die Option Datenüberprüfung aus:
    Dateneingabe mit Excel - Auswahl der Option Datenüberprüfung
  5. Nun sollte ein Dialogfeld erscheinen, in dem Sie die zulässigen Werte definieren können. Versuchspersonennummern sind in vielen Studien immer ganze, positive Zahlen. Um nur solche Zahlen zuzulassen, wählen Sie bitte im in dem Dialogfeld im ersten Dropdownmenü, das mit Zulassen: überschrieben ist, die Option ganze Zahl aus. Nun können Sie darunter im Dropdownmenü Daten, die Option größer als auswählen und in das erscheinende Feld Minimum den Wert 0 eintragen. Das Diaglofeld sollte nun so aussehen.
    Dateneingabe mit Excel - Optionen für Versuchspersonennummer Wenn Sie dies alles durchgeführt haben, können Sie nun auf OK drücken und das Dialogfeld schließt sich.
  6. Sie können nun die Einstellung mal testen. Wenn Sie nun eine ungültige Versuchspersonennummer wie beispielsweise -1 eingeben, erscheint diese Fehlermeldung und fordert sie zur Korrektur der Eingabe auf.
    Fehlermeldung - Ungültige Versuchspersonennummer
  7. Um die Variable zur Eingabe der Antworten auf die Frage nach dem Geschlecht des/der TeilnehmerIn einzugeben ist, etwas Vorbereitung nötig. Zuerst legen sie dafür ein neues Tabellenblatt an, in dem Sie auf das + unten, neben dem Karteikartenreiter Tabelle 1.
    Dateneingabe mit Excel - Neues Datenblatt
  8. In dem nun leeren Tabellenblatt tragen sie bitte die möglichen Antwortoptionen ein. In unserem Beispiel wäre dies, männlich, bzw. weiblich. Sie müssen dabei nicht auf eine bestimmte Positionierung achten.
    Tipp: Auch wenn eine Überschrift für die korrekte Definition der Antwortoptionen nicht nötig ist, empfiehlt es sich diese zu verwenden, um auch bei komplexeren Fragebögen die Übersicht zu behalten.
    Dateneingabe mit Excel - Definition von Variablenlabels
  9. Nun wechseln Sie bitte wieder in Tabelle 1 und markieren die Spalte B, die mit sex überschrieben ist. Dann klicken Sie wieder auf das Feld Datenüberprüfung in dem Ribbon Daten und bereits bekannte Dialogfeld erscheint wieder. Diesmal wählen sie bitte Liste aus. Das Feld Daten: bleibt weiterhin ausgegraut und es erschein ein Textfeld, welches mit Quelle: beschriftet ist. Drücken Sie hier das Tabellensymbol am rechten Rand.
    Dateneingabe mit Excel - Definition von gültigen Labeln
  10. Nun erscheint ein kleines Dialogfeld, indem Sie einen Bezug auf eine andere Zelle eintragen können und das mit Datenüberprüfung überschrieben ist. Wechseln sie nun in die Tabelle 2 und wählen sie den Zellenbereich aus, in dem Männlich und weiblich steht.
    Dateneingabe mit Excel - Zuordnung von Variablenlabeln
    Diese bestätigen Sie bitte noch mit der Taste Enter. Das bereits bekannte Dialogfeld zum Eintragen der Variableneigenschaften erscheint, und Sie können dieses auch durch das Drücken des mit OK beschrifteten Buttons schließen.
    Tipp: Lassen sie den Hacken neben der Option Zellendropdown gesetzt. Hierdurch können Sie neben der Tastatur auch die Maus zur Dateneingabe nutzen.
  11. Sie können auch hier wieder den Erfolg, testen in dem Sie andere Werte als männlich oder weiblich eintragen.
  12. Nun kommen wir zur letzten Variable, der Frage nach dem Alter. Grundsätzlich sind hier nur Werte zwischen 5 Jahren und 120 Jahren realistisch. Allerdings gibt es bei dieser Frage immer TeilnehmerInnen, die diese falsch verstehen und ihr Geburtsdatum oder eine beliebige Zahl eintragen. Daher ist es sinnvoll, dass bei ungültigen Eingaben zwar gewarnt wird, diese aber trotzdem zugelassen werden, so dass auch falsche Angaben eingegeben werden können. Der Beginn ist hier identisch zu den vorhergehenden Schritten. Markieren Sie hierfür die Spalte C und klicken Sie auf das Symbol Datenüberprüfung im Ribbon Daten. Im nun erscheinenden Dialog wählen Sie wieder im Dialogfeld Zulassen: die Option ganze Zahl aus und hinterlegen als Minimum 5 und als Maximum 120. Dann klicken Sie auf den Karteikartenreiter Fehlermeldung.
    Dateneingabe mit Excel - Auswahl der Option Fehlermeldung
  13. In diesem Teil des Dialogfeldes können Sie dann den Hinweis, den sie bei der fehlerhaften Eingabe erhalten und ob es möglich ist, diesen zu ignorieren, festlegen. Damit sie eine Meldung ignorieren können, müssen Sie im Feld Typ: die Option Warnung statt der bereits ausgewählten Option Fehler wählen. In dem Feld Titel: können Sie den Fensternamen des Hinweises einstellen, während in dem Feld Fehlermeldung der Text des Fehlerhinweises eingestellt wird. In diesem Beispiel soll als der Titel Eingabefehler sein und die Fehlermeldung Ungültiges Alter eingegeben!, sein, daher sind diese beiden Texte in den entsprechenden Dialogfelder einzutragen. Das Dialogfeld sollte nun so aussehen und sie können dies mit OK bestätigen:
    Dateneingabe mit Excel - Festlegen einer spezifischen Fehlermeldung
  14. Nun sollten Sie auch diese Option testen. Wenn Sie nun eine fehlerhaften Wert im Alter, wie beispielsweise 1962 eingeben, erscheint der folgende Hinweis:
    Fehlermeldung bei ungültigem AlterWenn sie nun auf Ja können Sie den ungültigen Wert eintragen, während beim Drücken von Nein der ungültige Wert bestätigt wird.
    Tipp: Auch wenn es naheliegt bei einer Jahreszahl statt der Jahreszahl das Alter direkt zu berechnen und einzutragen, ist trotzdem sinnvoll, die Eingabe der Daten von der Korrektur der Daten zu trennen, da nur so sichergestellt werden, dass die Korrektur regelgeleitet erfolgt und keine Verzerrungen in den Daten entstehen. Die fertige Excel-Datei kann hier heruntergeladen werden.

Import der Daten nach R

Um die nun in Excel eingegebenen Daten direkt nach R zu importieren, benötigen sie das Paket xlsx, welches Sie mit dem Befehl install.packages(„xlsx“) installieren können. Die eigentlichen Befehle um dann die Excel-Datei in einen Dataframe, der data heißt zu laden sind dann:

library(xlsx)
data <- read.xlsx(FILENAME,1)

Sie müssen nur FILENAMEdurch den korrekten Dateipfad ersetzen.
Tipp: Falls Sie mit Windows arbeiten, ist es nötig die Backslashs (\) im Dateipfad durch normale Slashs zu ersetzen.

Import der Daten nach SPSS

Falls Sie mit SPSS arbeiten, ist es möglich die Daten nach SPSS zu importieren. Dafür kann der normale Dialog zum Öffnen von Daten verwendet werden, der sich im Menü Datei → Öffnen → Daten… befindet.
SPSS - Datei öffnen Dialog
In dem nun erscheinenden Dialogfeld müssen Sie dann im Dropdown-Feld den Typ Excel (*.xls, *.xlsx, *.xlsm) auswählen.
SPSS Öffnen einer Excel-Datei
Als letzter Schritt muss dann noch das Blatt der Excel-Tabelle ausgewählt werden. SPSS versucht standardmäßig alle in diesem Blatt enthaltenen Daten dann zu importieren und die Variablentypen korrekt zu setzen.
SPSS Auswahl des Tabellenblattes

So nun sollten die Daten korrekt in SPSS überführt sein und die statistische Auswertung kann beginnen.

It's only fair to share...Share on Facebook
Facebook
Tweet about this on Twitter
Twitter
Share on LinkedIn
Linkedin
Email this to someone
email

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.