het begrijpen van SPSS variabele types en formaten stelt u in staat om dingen snel en betrouwbaar gedaan te krijgen. Het krijgen van grip op types en formaten is niet moeilijk als je de zeer verwarrende informatie onder variabele weergave negeren. Deze tutorial brengt je op het juiste spoor.
we raden u aan om deze handleiding te volgen door computer_parts te downloaden en te openen.sav, gedeeltelijk hieronder weergegeven.
SPSS variabele Types
SPSS heeft 2 variabele types:Numerieke variabelen bevatten alleen getallen en zijn geschikt voor numerieke berekeningen zoals optellen en vermenigvuldigen.
er zijn geen andere variabele types in SPSS dan string en numeric. Echter, numerieke variabelen hebben verschillende formaten die vaak worden verward met variabele types. We zullen zien in een minuut hoe variabele weergave zet gebruikers op het verkeerde spoor hier.
de enige manier om een String variabele naar numeriek of omgekeerd te veranderen is het ALTER TYPE. Er zijn echter verschillende manieren om een numerieke kopie van een String variabele of omgekeerd te maken. Daar komen we zo op terug.
dus wat is beter: tekenreeks of numeriek?
de eenvoudigste vuistregel is dat alleen nominale variabelen met veel categorieën
stringvariabelen in SPSS moeten zijn.Voorbeelden zijn namen van mensen, e-mailadressen, paspoortnummers enzovoort. Hoewel dergelijke variabelen nuttig kunnen zijn, analyseren we ze meestal niet.
soms analyseren we nominale variabelen met weinig categorieën -zoals nationaliteit, bloedgroep of beroep. Als dit string variabelen zijn, kunnen ze al dan niet problemen veroorzaken. Bijvoorbeeld, de onafhankelijke variabele voor ANOVA kan al dan niet een string variabele zijn, afhankelijk van het exacte commando dat je er voor gebruikt.Precies, UNIANOVA doet en ONEWAY accepteert string variabelen niet als factoren.
u kunt wegkomen door dergelijke variabelen als tekenreeksen te laten. Echter, het kopiëren van hen in numerieke variabelen zorgt ervoor dat je alle problemen te vermijden. Een fatsoenlijke manier om dit te doen is AUTORECODE. Voor het converteren van metrische string variabelen-met alleen getallen – naar numerieke variabelen, zie SPSS tekenreeks converteren naar numerieke variabele.
Determining SPSS Variable Types
dus hoe weten we of een variabele string of numeriek is? In SPSS versies 24 en hoger, kleine pictogrammen voor variabele namen vertellen ons de variabele type, formaat en zelfs meetniveau. Het pictogram voor ” nominaal “kan een kleine” a ” bevatten die aangeeft dat het een String variabele is.
voor SPSS versies 23 en eerder, inspecteren we onze variabele weergave en gebruiken we de volgende regel:
- als Type “String” zegt, Heb je te maken met een String variabele;
- als Type niet “String” zegt, Heb je te maken met een numerieke variabele.
SPSS suggereert dat” Date” en “Dollar” ook variabele types zijn. Dit zijn echter formaten, geen typen. De manier waarop ze hier worden weergegeven tussen de werkelijke variabele types (string en numeriek) is een van de meest verwarrende functies van SPSS.
SPSS variabele formaten-Inleiding
laten we nu eens kijken naar de gegevens in data view zoals getoond in de screenshot hieronder. We zullen kort beschrijven welke variabelen we zien.
met betrekking tot deze gegevens hebben we eerder gezegd dat
een string variabele is en
tot en met numerieke variabelen zijn en alleen getallen bevatten.
echter, waarden zoals “26-jan-2015” zien er zeker niet uit als getallen, of wel? Dit komt omdat SPSS nummers op zeer verschillende manieren kan weergeven. Deze manieren om gegevenswaarden weer te geven worden aangeduid als variabele formaten.
bepalen van SPSS variabele formaten
zoals we eerder zagen, toont” Type ” onder variabele weergave een verwarrende mix van variabele types en formaten. We zullen de werkelijke formaten zien door het woordenboek runningdisplay.Een deel van het resultaat wordt weergegeven door de screenshot hieronder.
SPSS onderscheidt print – en schrijfformaten, maar we maken ons geen zorgen over dit onderscheid. SPSS variabele formaten bestaan uit twee delen. Een of meer letters geven het formaat familie. De meesten spreken met zichzelf, behalve de eerste twee variabelen.:
- A (“alfanumeriek”) is het gebruikelijke formaat voor stringvariabelen;
- F, (“Fortran”) geeft een standaard numerieke variabele aan.
formaten eindigen met getallen, die het aantal te tonen tekens aangeven. Indien een periode aanwezig is, geeft het nummer na de periode het aantal decimalen aan dat moet worden weergegeven. Onderstaande figuur illustreert deze punten.
SPSS Common Variable Formats
de figuur hieronder geeft nu een samenvatting van enkele veelvoorkomende variable types en formats die we zullen tegenkomen in SPSS.
variabele formaten instellen in SPSS
u kunt variabele formaten instellen voor numerieke variabelen met het commando formaten. Bijvoorbeeld, formatteert gewicht (f4. 3).toont gewicht met 3 decimalen. Dit heeft invloed op de output die u maakt: de meeste tabellen zullen ook een extra decimale plaats toevoegen voor gewicht. Als je dit zelf wilt zien, voer dan onderstaande syntaxis uit en vergelijk de 2 resulterende tabellen.
formaten gewicht(f3.2).
descriptief gewicht.
* toon 3 decimalen voor gewicht en voer descriptieven uit.
formaten gewicht(f4.3).
descriptief gewicht.
* merk op dat de tweede uitvoertabel meer decimalen toont.
Houd er rekening mee dat het veranderen van variabele formaten uw datain op geen enkele manier verandert. De werkelijke waarden zijn nog steeds exact dezelfde getallen. Ze worden alleen anders weergegeven.
variabele Types en formaten-waarom moeite doen?
in principe, “wat je ziet is niet wat je krijgt” in data view. Bijvoorbeeld, we zien $20.37 maar de werkelijke waarde is slechts 20.37. Dus we kunnen producten identificeren die $20,- of meer kosten door onderstaande syntaxis uit te voeren:compute expensive = (price >= 20).We nemen het dollarteken niet op in onze syntaxis. Hoewel SPSS een dollarteken toont in de gegevensweergave, zijn de werkelijke waarden slechts getallen en dit zijn waar de syntaxis op inwerkt.
of laten we zeggen dat we 30 dagen willen toevoegen aan onze datumvariabele. We kunnen dit doen door runningcompute newdate = datesum(datum,30,’dagen’).De resulterende waarden zijn 13644236937.72. Dit zijn de juiste nummers, maar ze zullen alleen als leesbare datums worden weergegeven na het uitvoeren van iets als formats newdate (date11).Een andere reden voor de moeite over variabele formaten is het instellen van decimalen plaatsen voor output tabellen. Voor SPSS versie 22 verder, OUTPUT MODIFY doet de truc zoals hieronder getoond.
descriptief gewicht.
* 2 decimalen instellen (formaat = f3.2) Voor gemiddelde en SD (kolommen 4 en 5).
output modify
/ Select tables
/ tablecells select = selectdimension = columns format = “f3.2”.
in dezelfde geest maakt CTABLES het mogelijk om verschillende formaten te kiezen voor verschillende statistieken in uw uitvoer.
ctables
/ tabelcommissie .
eindnoten
deze handleiding was enigszins theoretisch, maar heeft veel praktische gevolgen. Ik hoop dat je het nuttig vond.
Bedankt voor het lezen!