Mittelwertsvergleiche mit einem T-Test und SPSS

T-Test mit SPSS – die Grundlagen

Der T-Test ist der am häufigsten verwendete Test um Mittelwerte zu untersuchen. Dabei können sowohl zwei Mittelwerte untereinander als auch ein Mittelwert mit einem vorher festgelegten Wert verglichen werden. Dieser Artikel soll sowohl die Auswahl des korrekten T-Tests für Mittelwertsvergleiche als auch die Durchführung mit SPSS vorstellen. Anders als die vorherigen Blogbeiträge zu Mplus soll dieser Beitrag sich an Einsteiger richten. Das heißt, wenn Sie noch Fragen haben, weil Sie einzelne Teile des Textes nicht verstanden haben, nutzen Sie bitte die Kommentarfunktion oder senden Sie mir eine kurze Mail.

Auswahl des korrekten T-Tests

Mit dem Begriff T-Test wird eine Gruppe an unterschiedlichen statistischen Verfahren bezeichnet. Um den korrekten T-Test auszuwählen, ist nötig zu prüfen, womit ein Mittelwert verglichen wird:

  • Wenn der Mittelwert einer Stichprobe mit einem vorher bekannten Wert verglichen wird, dann wird der T-Test für eine Stichprobe benötigt.
  • Wenn zwei Mittelwerte untereinander verglichen werden sollen, gibt es zwei mögliche T-Tests:
    • den T-Test für abhängige Stichproben
    • den T-Test für unabhängige Stichproben

    Welcher der beiden T-Tests der richtige ist, hängt davon ab, ob die Daten als abhängig oder unabhängig anzusehen sind. Daten werden als abhängig bezeichnet, wenn immer exakt zwei Datenpunkte eine Verbindung oder eine Beziehung haben. Eine mögliche Verbindung wäre beispielsweise, dass jede Person zweimal befragt wurde und die Antworten zwischen den beiden Befragungen verglichen werden sollen. Die Verbindung wären dann die Eigenschaften und Merkmale der Personen. Auch wenn zwei Datenpunkte von Geschwistern erhoben werden, sind die Daten als abhängig zu betrachteten, da die beide Geschwister sowohl eine ähnliche DNA haben, als auch in einem ähnlichen Kontext sozialisiert wurden.
    Wenn die Daten abhängig sind, dann ist der T-Test für abhängige Stichproben zu verwenden, sonst ist der T-Test für unabhängige Stichprobe zu verwenden.

  • Falls es Ihnen weiterhin unklar ist, welchen T-Test Sie benötigen, versuchen Sie einfach die folgenden Fragen zu beantworten. Am Ende wird Ihnen der korrekte T-Test gezeigt.

    Beschreibung des Beispieldatensatzes

    Diesmal kommt das Beispiel aus den Ernährungswissenschaften. Dafür habe ich einen SPSS-Beispieldatensatz erstellt, der die Ergebnisse einer Veränderung der Ernährung bei Übergewichtigen enthält (auch Diät genannt :-)). In dem Datensatz ist der BMI vor dem Beginn der Veränderung der Ernährung (Variablenname BMI_t1) sowie der BMI zwei Monate danach enthalten (Variablenname BMI_t2). Weiterhin ist für jeden Teilnehmer, bzw. jede Teilnehmerin das Geschlecht in dem Datensatz vermerkt (Variablenname geschlecht). In der Variable Geschlecht wurden allen Männer der Wert 1 zugewiesen und allen Frauen der Wert 2.

    Beispieldatensatz T-Test SPSS

    T-Test für eine Stichprobe mit SPSS

    Dieser T-Test, auch als One Sample T-Test bezeichnet, prüft ob sich die Stichprobe von einem vorher definierten Wert unterscheidet. In unserem Beispiel soll geprüft werden, ob der BMI der Stichprobe nach dem Training größer als 25 ist, dem von der WHO veröffentlichten Grenzwert für Übergewichtige. Wenn dieser Wert signifikant unter 25 liegt, würde man diese Gruppe als Ganzes nicht mehr als Übergewichtig bezeichnen.
    Um diesen T-Test durchzuführen, sind folgenden Schritte nötig:

    1. Zuerst wählt man im Menü Analysieren → Mittelwerte vergleichen die Option T-Test bei einer Stichprobe aus.
      SPSS-Menü T-Test one sample
    2. Im nun erscheinenden Dialogfeld fügt man die Variablen, welche man untersuchen will, in das Feld Testvariable(n): ein. In dem Beispiel soll untersucht werden, ob der BMI zum zweiten Zeitpunkt sich von 25 unterscheidet und daher wird diese Variable in das Feld Testvariablen eingefügt. Dann muss der Wert 25 in das Feld Testwert: eingetragen werden, da dies der Wert ist, bei dem geprüft werden soll, ob sich der Mittelwert der Variable BMI_t2 signifikant von 25 unterscheidet. Das Dialogfeld sollte nun folgendermaßen aussehen:
      SPSS T-Test One Sample Dialogfeld
    3. Nachdem das Dialogfeld mit OK bestätigt wurde, sollte das folgende Ergebnis im SPSS-Output angezeigt werden:
      Output One-Sample  T-Test
      In der ersten Tabelle werden die deskriptiven Statistiken dargestellt, wie beispielsweise der Mittelwert und dessen Standardabweichung als Maß für die Streuung. Die Ergebnisse des eigentlichen T-Tests sind in der zweiten Tabelle, die mit Test bei einer Stichprobe überschrieben ist, dargestellt. Für die Interpretation ist die Zahl in der Zelle Sig. (2-Seitig) entscheidend. In vielen Forschungszweigen betrachtet man einen Unterschied als zufallskritisch abgesichert, wenn der p-Wert kleiner als .05 ist. Dies ist in diesem Beispiel der Fall, so dass man den Mittelwert des BMIs der Stichprobe als signifikant kleiner als 25 bezeichnen würde.
      In den beiden ersten Zellen sind der T-Wert und die Freiheitsgrade berichtet. Beide Werte sind nötig, um den p-Wert zu berechnen. Daher ist es erforderlich diese zu berichten, so dass die LeserInnen die Rechnung nachvollziehen können, jedoch müssen sie nicht gesondert interpretiert werden.
      In den letzten beiden Zellen sind die Grenzen des Konfidenzintervalls für die Differenz zwischen dem Mittelwert der Stichprobe und dem Testwert von 25 angegeben. Als Konfidenzintervall bezeichnet man den Wertebereich, in dem in 95% aller Ergebnisse lägen, wenn man die Studie unendlich oft wiederholen würden. Je geringer der Abstand zwischen den beiden Grenzen des Konfidenzintervalls ist, als desto präziser können die Ergebnisse angesehen werden. Daher ist es sinnvoll, diesen Wert ebenfalls anzugeben.

      T-Test bei unabhängigen Stichproben mit SPSS

      Der T-Test bei unabhängigen Stichproben, auch Independent sample t-test genannt, wird durchgeführt um die Mittelwerte zweier Gruppen zu vergleichen. In dem Beispiel soll geprüft werden, ob die Männer oder die Frauen einen höheren BMI zu T2 haben.

      1. Um diesen T-Test durchzuführen wählen Sie im Menü Analysieren → Mittelwerte vergleichen die Option T-Test bei unabhängigen Stichproben.
        SPSS Menü T-Test Independent Samples
      2. Im nun erscheinenden Dialogfeld verschieben Sie die Variable, bei der Sie prüfen wollen, ob sich die Gruppen unterscheiden, in das Feld Testvariable(n). In dem Beispiel ist dies die Variable BMI_T2. Die Variable, aufgrund derer die Gruppen gebildet werden, verschieben Sie bitte in das Feld Gruppierungsvariable, hier die Variable Geschlecht.

        Dialog SPSS Independent sample t-test

      3. SPSS muss noch wissen, welchen Zahlenwert die Gruppen bei dieser Variable haben. Dafür ist es nötig, auf das im Screenshoot rot markierte Feld Gruppen def. … zu klicken. Dann erscheint das folgende Dialogfeld:

        SPSS Definition Gruppen Independent sample t-test

        In dem Beispiel ist den Männern der Wert 1 in der Variable geschlecht zugewiesen worden, während die Frauen durch den numerischen Wert 2 repräsentiert werden. Daher wird für die Gruppe 1 der Wert 1 eingetragen, während für die Gruppe 2 der Wert 2 in dem Dialogfeld eingetragen wird. Die in dieses Dialogfeld einzutragende Werte hängen von dem spezifischen Datensatz ist und können im Dialogfeld Extras → Variablen… nachgeschlagen werden. Wenn Sie hierzu Fragen haben, können Sie mir eine Mail schreiben, oder die Kommentarfunktion nutzen.
        Wenn Sie die Gruppen definiert haben, können Sie nun beide Dialogfelder mit OK bestätigen.

      4. Nun sollten Sie den folgenden Output sehen:
        T-Test_independent_sample_screenshoot_4
        Auch hier sehen Sie wie beim T-Test für eine Stichprobe, zuerst eine Tabelle in der die deskriptiven Statistiken dargestellt sind. Diesmal sind diese jedoch getrennt für beide Gruppen aufgeschlüsselt. Aus dieser Tabelle wird ersichtlich dass sowohl 40 Männer als auch 40 Frauen an dieser Studie teilgenommen haben. Beide Mittelwerte sind fast identisch, allerdings ist die Standardabweichung bei den Männern etwas größer als bei den Frauen. D.h. die Männer scheinen sich untereinander etwas stärker in ihrem Gewicht zu unterscheiden als die Frauen.
        Die eigentlichen Ergebnisse des T-Testes für unabhängige Stichproben finden sich in der zweiten Tabelle.
        Bei der Interpretation ist zuerst das Ergebnis des Levene-Test auf Varianzgleicheit zu beachten, das in den ersten beiden Spalten ausgegeben wird. Bei diesem Test wird geprüft, ob sich die Streuung zwischen den beiden Gruppen unterscheidet. Wenn der Wert in der Spalte Signfikanz kleiner als .05 ist, dann ist nicht von der Gleichheit der Varianz zwischen den beiden Gruppen auszugehen. In diesem Fall sind die Werte in der unteren der beiden Zeilen maßgeblich, während sonst, wie in diesem Beispiel (p = .127), die obere der beiden Zeilen die Ergebnisse des T-Test für unabhängige Stichproben enthält.
        Hier ist wieder die Zelle Sig. (2-seitig) zentral. Wenn der Wert in dieser Zelle kleiner als .05 ist, kann man davon ausgehen, dass der Unterschied in den Mittelwerten zufallskritisch abgesichert ist und interpretiert wird. Auch wie bereits oben beschrieben, enthalten die Spalten T und df die nötigen Informationen für die Berechnung des Signifikanzniveaus. D.h. die Werte sollten berichtet werden, jedoch müssen sie nicht selber interpretiert werden. Der Wert in der Spalte Mittlere Differenz gibt die Differenz der Mittelwerte zwischen beiden Gruppen an (in diesem Beispiel: 24,3205 – 24,2795 = 0,04107).
        In den letzten beiden Spalten ist das 95% Konfidenzintervall der Differenz ausgegeben. Dieses Konfidenzintervall beschreibt, welche Mittelwertsdifferenzen zwischen den beiden Gruppen erwartet würden, wenn diese Studie unendlich oft wiederholt werden würde. Je kleiner die Abstände zwischen den beiden Werten ist, desto genauer kann der Unterschied zwischen den Mittelwerten der beiden Gruppen auf Basis der bereits gesammelten Daten vorhergesagt werden.

      T-Test bei abhängigen Stichproben mit SPSS

      Der dritte T-Test ist der T-Test bei abhängigen Stichproben, oder auch Dependent Sample T-Test genannt.
      Um diesen T-Test einzusetzen ist es nötig, dass die Werte der beiden Gruppen jeweils getrennt in einer Variablen stehen. In dem Beispiel sind dies die beiden Variablen BMI_t1 und BMI_t2. Die beiden Werte eines Paares müssen dabei immer in einer Datenzeile stehen. In dem aktuellen Beispiel gehören die beiden BMI-Werte immer zu einer Person vor und nach dem Training zur Veränderung der Ernährung. Um diese Struktur zu erreichen, ist es manchmal nötig die SPSS-Datei neu zu strukturieren. Falls Sie zur Umstrukturierung eine Frage haben, können Sie die gerne entweder im Kommentarfeld oder mir per Mail stellen.

      1. Um den T-Test für abhängige Stichprobe durchzuführen, wählen Sie bitte im Menü Analysieren → Mittelwerte vergleichen die Option T-Test bei verbundenen Stichproben.
        SPSS Menü Dependent Sample T-Test
      2. In dem nun erscheinenden Dialogfeld müssen Sie die Variablen in das Feld Paarige Variablen: einfügen. Hier müssen Sie darauf achten, dass die Variablen, durch die Gruppen definiert werden, immer in einer Zeile stehen. In dem Beispiel soll der Mittelwert des ersten mit dem Mittelwert des zweiten Zeitpunktes verglichen werden. Daher wird die Variable, welche den ersten Messzeitpunkt darstellt, in die erste Zelle in der ersten Zeile eingefügt. Die andere Variable, in der die Werte des zweiten Messzeitpunkts stehen, gehört in die zweite Zelle in der ersten Zeile. Falls mehr als ein Mittelwertsvergleich durchgeführt werden soll, können in weitere Zeilen andere Variablenpaare gezogen werden.
        SPSS DIalog Dependent Sample T-Test
      3. Wenn Sie dann auf OK drücken sollten, Sie den folgenden Ausdruck sehen:
        SPSS Output Dependent Sample T-Test
        Anders als bei den beiden T-Tests werden diesmal drei Tabellen von SPSS ausgegeben. In der ersten Tabelle werden wieder die Deskriptiva wie Mittelwert und Standardabweichung ausgegeben. In der zweiten Tabelle wird die Korrelation zwischen den beiden Variablen angezeigt, die die Stärke des Zusammenhanges zwischen den beiden Werten beschreibt. Je höher der Wert in der Zelle Korrelation ist, desto wahrscheinlicher ist es, dass eine Person, die beispielsweise zum ersten Messzeitpunkt einen hohen Wert hat, verglichen mit den anderen Gruppenmitgliedern auch zum zweiten Messzeitpunkt einen hohen Wert hat.
        Die Ergebnisse des eigentlichen T-Tests sind in der letzten Tabelle, die mit Test bei gepaarten Stichproben bezeichnet ist, zu finden. Sie enthält ähnliche Informationen wie die Ergebnisse der beiden anderen Testverfahren, SPSS ordnet diese allerdings anders an.
        Für den T-Test bei abhängigen Daten ist die Differenz zwischen den beiden Mittelwerten zentral. Wenn die beiden Mittelwerte vor und nach dem Training sich nicht unterscheiden, dann sollte ihre Differenz 0 sein, dagegen sollte, wenn die Mittelwerte der TeilnehmerInnen sich verändern, die Differenz von 0 abweichen, da nun einer der beiden Mittelwerte größer als der andere ist. In dem Beispiel hier ist die Mittelwertsdifferenz 27.2 (T1-Wert) – 24.3 (T2-Wert) = 2.9. Dieser Wert wird von SPSS in der ersten mit Gepaarte Differenzen überschriebenen Bereiches ausgegeben. Danach wird die Standardabweichung der Mittelwertsdifferenz ausgegeben. Je höher dieser Wert ist, desto stärker streut die Differenz der beiden Mittelwerte untereinander. Die nächsten drei Zellen beschreiben die Genauigkeit, mit der Aussagen zur Mittelwertsdifferenz gemacht werden können. Dazu gehören zum einen der Standardfehler und zum anderen das Konfidenzintervall, welches auf Basis des Standardfehlers berechnet wurde. Es gilt wieder wie bereits bei den beiden anderen T-Tests, dass je näher die obere und die untere Grenze des Konfidenzintervalls zusammenliegen, desto genauere Aussagen aufgrund der Daten gemacht werden können.
        In den letzten drei Zellen befinden sich dann die Ergebnisse des eigentlichen T-Tests für abhängige Stichproben. Hier ist wieder wie oben die Zelle Sig. (2-seitig) entscheidend. Wenn dieser Wert kleiner als 0.05 ist, werden die Ergebnisse als zufallskritisch abgesichert betrachtet und die Mittelwerte zwischen dem 1. Messzeitpunkt und dem 2. Messzeitpunkt als signifikant unterschiedlich interpretiert. In dem Beispiel hier ist es der Fall, so dass die Aussage, dass der Mittelwert des BMIs im Lauf der Zeit geringer wird, von den Daten gestützt worden wäre.
        Die Werte in den Spalte T und df sind wieder nötig, wenn man den Wert in der Spalte Sig. (2-seitig) von Hand berechnen würde. Es ist guter Stil, diese Werte in den Ergebnissen auch zu berichten.
      4. It's only fair to share...Share on Facebook
        Facebook
        Tweet about this on Twitter
        Twitter
        Share on LinkedIn
        Linkedin
        Email this to someone
        email

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.