Wenn Sie SPSS-Variablentypen und -formate verstehen, können Sie schnell und zuverlässig arbeiten. Es ist nicht schwer, Typen und Formate in den Griff zu bekommen, wenn Sie die sehr verwirrenden Informationen in der Variablenansicht ignorieren. Dieses Tutorial bringt Sie auf den richtigen Weg.
Wir empfehlen Ihnen, diesem Tutorial zu folgen, indem Sie computer_parts herunterladen und öffnen.sav, teilweise unten gezeigt.
- SPSS-Variablentypen
- Also, was ist besser: String oder numerisch?
- SPSS-Variablentypen bestimmen
- SPSS Variable Formats – Einführung
- Ermitteln von SPSS-Variablenformaten
- SPSS Common Variable Formats
- Festlegen von Variablenformaten in SPSS
- Variablentypen und -formate – Warum sich die Mühe machen?
- Abschließende Anmerkungen
SPSS-Variablentypen
SPSS verfügt über 2 Variablentypen:
- Numerische Variablen enthalten nur Zahlen und eignen sich für numerische Berechnungen wie Addition und Multiplikation.
- String-Variablen können Buchstaben, Zahlen und andere Zeichen enthalten. Sie können keine Berechnungen für Zeichenfolgenvariablen durchführen – auch wenn diese nur Zahlen enthalten.
Es gibt in SPSS keine anderen Variablentypen als string und numeric. Numerische Variablen haben jedoch verschiedene Formate, die häufig mit Variablentypen verwechselt werden. Wir werden in einer Minute sehen, wie variable View Benutzer hier auf die falsche Spur bringt.
Die einzige Möglichkeit, eine Zeichenfolgenvariable in numerisch oder umgekehrt zu ändern, ist ALTER TYPE . Es gibt jedoch mehrere Möglichkeiten, eine numerische Kopie einer Zeichenfolgenvariablen oder umgekehrt zu erstellen. Wir kommen gleich zu denen.
Also, was ist besser: String oder numerisch?
Die einfachste Faustregel ist, dassNur nominale Variablen mit vielen Kategorien
sollten in SPSS Zeichenfolgenvariablen sein.Beispiele sind Namen von Personen, E-Mail-Adressen, Passnummern und so weiter. Obwohl solche Variablen nützlich sein können, analysieren wir sie normalerweise nicht.
Manchmal analysieren wir nominale Variablen mit wenigen Kategorien – wie Nationalität, Blutgruppe oder Beruf. Wenn es sich um Zeichenfolgenvariablen handelt, können sie Probleme verursachen oder nicht. Beispielsweise kann die unabhängige Variable für ANOVA eine Zeichenfolgenvariable sein oder nicht, abhängig von dem genauen Befehl, den Sie dafür verwenden.Genau genommen akzeptiert UNIANOVA und ONEWAY keine Zeichenfolgenvariablen als Faktoren.
Sie können davonkommen, indem Sie solche Variablen als Zeichenfolgen belassen. Wenn Sie sie jedoch in numerische Variablen kopieren, vermeiden Sie alle Probleme. Ein anständiger Weg, dies zu tun, ist AUTORECODE. Informationen zum Konvertieren von metrischen Zeichenfolgenvariablen – die nur Zahlen enthalten – in numerische Variablen finden Sie unter SPSS Convert String to Numeric Variable.
SPSS-Variablentypen bestimmen
Woher wissen wir also, ob eine Variable eine Zeichenfolge oder eine Zahl ist? In SPSS-Versionen 24 und höher zeigen winzige Symbole vor Variablennamen den Variablentyp, das Format und sogar die Messebene an. Das Symbol für „nominal“ kann ein winziges „a“ enthalten, das angibt, dass es sich um eine Zeichenfolgenvariable handelt.
Für SPSS-Versionen 23 und früher überprüfen wir unsere Variablenansicht und verwenden die folgende Regel:
- wenn Type „String“ sagt, haben Sie es mit einer String-Variablen zu tun;
- Wenn Type nicht „String“ sagt, haben Sie es mit einer numerischen Variablen zu tun.
SPSS schlägt vor, dass „Date“ und „Dollar“ auch Variablentypen sind. Dies sind jedoch Formate, keine Typen. Die Art und Weise, wie sie hier unter den tatsächlichen Variablentypen (string und numeric) angezeigt werden, ist eine der verwirrendsten Funktionen von SPSS.
SPSS Variable Formats – Einführung
Schauen wir uns nun die Daten in der Datenansicht an, wie im folgenden Screenshot gezeigt. Wir werden kurz die Arten von Variablen beschreiben, die wir sehen.
In Bezug auf diese Daten haben wir bereits erwähnt, dass
eine Zeichenfolgenvariable ist und
bis numerische Variablen sind und nur Zahlen enthalten.
Werte wie „26-jan-2015“ sehen jedoch nicht wie Zahlen aus, oder? Dies liegt daran, dass SPSS Zahlen auf sehr unterschiedliche Weise anzeigen kann. Diese Arten der Anzeige von Datenwerten werden als variable Formate bezeichnet.
Ermitteln von SPSS-Variablenformaten
Wie wir bereits gesehen haben, zeigt „Typ“ unter Variablenansicht eine verwirrende Mischung aus Variablentypen und -formaten. Wir werden die tatsächlichen Formate durch Ausführen sehendisplay dictionary.Ein Teil des Ergebnisses wird durch den Screenshot unten gezeigt.
SPSS unterscheidet Druck- und Schreibformate, aber wir kümmern uns nicht um diese Unterscheidung. SPSS Variable Formate bestehen aus zwei Teilen. Ein oder mehrere Buchstaben kennzeichnen die Formatfamilie. Die meisten von ihnen sprechen mit sich selbst, mit Ausnahme der ersten beiden Variablen:
- A („Alphanumerisch“) ist das übliche Format für Zeichenfolgenvariablen;
- F, („Fortran“) gibt eine numerische Standardvariable an.
Formate enden mit Zahlen und geben die Anzahl der anzuzeigenden Zeichen an. Wenn ein Punkt vorhanden ist, gibt die Zahl nach dem Punkt die Anzahl der anzuzeigenden Dezimalstellen an. Die folgende Abbildung veranschaulicht diese Punkte.
SPSS Common Variable Formats
Die folgende Abbildung fasst nun einige gängige Variablentypen und -formate zusammen, die in SPSS vorkommen.
Festlegen von Variablenformaten in SPSS
Mit dem Befehl FORMATS können Sie Variablenformate für numerische Variablen festlegen. Zum Beispiel das Gewicht (f4.3).zeigt das Gewicht mit 3 Dezimalstellen an. Dies wirkt sich auf die von Ihnen erstellte Ausgabe aus: Die meisten Tabellen fügen auch eine zusätzliche Dezimalstelle für das Gewicht hinzu. Wenn Sie dies selbst sehen möchten, führen Sie die folgende Syntax aus und vergleichen Sie die 2 resultierenden Tabellen.
formatiert Gewicht (f3.2).
beschreibendes Gewicht.
*3 Dezimalstellen für Gewichts- und Laufbeschreibungen anzeigen.
formatiert Gewicht (f4.3).
beschreibendes Gewicht.
*Beachten Sie, dass die zweite Ausgabetabelle mehr Dezimalstellen anzeigt.
Denken Sie daran, dassDas Ändern variabler Formate ändert Ihre Daten in keiner Weise. Die tatsächlichen Werte sind immer noch genau die gleichen Zahlen. Sie werden lediglich anders dargestellt.
Variablentypen und -formate – Warum sich die Mühe machen?
Grundsätzlich gilt: „Was Sie sehen, ist nicht das, was Sie erhalten“ in der Datenansicht. Zum Beispiel sehen wir $ 20.37, aber der tatsächliche Wert ist nur 20.37. So können wir Produkte identifizieren, die $ 20,- oder mehr kosten, indem wir die folgende Syntax ausführen:compute expensive = (price >= 20).Wir nehmen das Dollarzeichen nicht in unsere Syntax auf. Obwohl SPSS in der Datenansicht ein Dollarzeichen anzeigt, sind die tatsächlichen Werte nur Zahlen, auf die die Syntax einwirkt.
Oder nehmen wir an, wir möchten unserer Datumsvariablen 30 Tage hinzufügen. Wir könnten dies tun, indem wir runningcompute newdate = datesum(date,30,’days‘) .Die resultierenden Werte sind 13644236937.72. Dies sind die richtigen Zahlen, aber sie werden erst nach dem Ausführen von etwas wie formats newdate (date11) als lesbare Daten angezeigt.Ein weiterer Grund, sich um variable Formate zu kümmern, ist das Festlegen von Dezimalstellen für Ausgabetabellen. Für SPSS ab Version 22 führt OUTPUT MODIFY den Trick aus, wie unten gezeigt.
beschreibendes Gewicht.
*2 Dezimalstellen setzen (format = f3.2) für Mittelwert und SD (Spalten 4 und 5).
Ausgabe ändern
/select tables
/tablecells select = selectdimension = columns format = ‚f3.2‘.
In ähnlicher Weise ermöglicht CTABLES die Auswahl verschiedener Formate für verschiedene Statistiken in Ihrer Ausgabe.
ctables
/Tabelle Kommission .
Abschließende Anmerkungen
Dieses Tutorial war etwas theoretisch, hat aber viele praktische Konsequenzen. Ich hoffe, Sie fanden es hilfreich.
Danke fürs Lesen!