Typy i formaty zmiennych SPSS

zrozumienie typów i formatów zmiennych SPSS pozwala na szybkie i niezawodne wykonywanie zadań. Opanowanie typów i formatów nie jest trudne, jeśli zignorujesz bardzo mylące informacje w widoku zmiennych. Ten samouczek wprowadzi Cię na właściwą drogę.
zachęcamy do zapoznania się z tym samouczkiem, pobierając i otwierając computer_parts .sav, częściowo pokazany poniżej.

typy i formaty zmiennych SPSS w widoku danych

typy zmiennych SPSS

SPSS ma 2 typy zmiennych:

  • zmienne Numeryczne zawierają tylko liczby i nadają się do obliczeń numerycznych, takich jak dodawanie i mnożenie.
  • zmienne łańcuchowe mogą zawierać litery, cyfry i inne znaki. Nie można wykonywać obliczeń na zmiennych łańcuchowych – nawet jeśli zawierają tylko liczby.

w SPSS nie ma innych typów zmiennych niż string i numeric. Jednak zmienne numeryczne mają kilka różnych formatów, które są często mylone z typami zmiennych. Za chwilę zobaczymy, jak variable view stawia użytkowników na niewłaściwym torze.
jedynym sposobem zmiany zmiennej łańcuchowej na numeryczną lub odwrotną jest zmiana typu. Istnieje jednak kilka sposobów tworzenia numerycznej kopii zmiennej łańcuchowej lub odwrotnie. Zaraz do nich dojdziemy.

co jest lepsze: ciąg czy cyfra?

najprostszą zasadą jest to, żetylko zmienne nominalne z wieloma kategoriami
powinny być zmiennymi łańcuchowymi w SPSS.Przykładami są nazwiska osób, adresy e-mail, numery paszportów i tak dalej. Chociaż takie zmienne mogą być użyteczne, Zwykle ich nie analizujemy.
czasami analizujemy zmienne nominalne z kilkoma kategoriami-takimi jak narodowość, grupa krwi czy zawód. Jeśli są to zmienne typu string, mogą powodować problemy. Na przykład, zmienna niezależna dla ANOVA może, ale nie musi, być zmienną łańcuchową w zależności od dokładnego polecenia, którego dla niej użyjesz.Dokładnie, UNIANOVA tak, a ONEWAY nie akceptuje zmiennych łańcuchowych jako czynników.
możesz uciec zostawiając takie zmienne jak ciągi znaków. Jednak kopiowanie ich do zmiennych numerycznych zapewnia uniknięcie wszelkich problemów. Przyzwoitym sposobem na to jest AUTOREKODOWANIE. Aby przekonwertować metryczne zmienne łańcuchowe-zawierające tylko liczby-na zmienne numeryczne, zobacz SPSS konwertowanie łańcucha na zmienną numeryczną.

określanie typów zmiennych SPSS

więc skąd wiemy, czy zmienna jest łańcuchowa czy numeryczna? W wersji SPSS 24 i wyższej małe ikony przed nazwami zmiennych informują nas o typie, formacie, a nawet poziomie pomiaru. Ikona” nominal „może zawierać małe” a”, które wskazuje, że jest to zmienna łańcuchowa.

 typy i formaty zmiennych SPSS jako ikony w nagłówkach zmiennych

w przypadku SPSS w wersji 23 i wcześniejszych sprawdzimy nasz widok zmiennych i użyjemy następującej reguły:

  • jeśli Typ mówi „String”, masz do czynienia ze zmienną łańcuchową;
  • jeśli Typ nie mówi „String”, masz do czynienia ze zmienną numeryczną.

typy i formaty zmiennych SPSS

SPSS sugeruje, że „Data” i „Dolar” są również typami zmiennych. Są to jednak formaty, a nie typy. Sposób, w jaki są one pokazywane wśród rzeczywistych typów zmiennych (łańcuchowych i liczbowych) jest jedną z najbardziej mylących cech SPSS.

formaty zmiennych SPSS-wprowadzenie

spójrzmy teraz na dane w widoku danych, jak pokazano na zrzucie ekranu poniżej. Pokrótce opiszemy rodzaje zmiennych, które widzimy.

typy i formaty zmiennych SPSS

w odniesieniu do tych danych stwierdziliśmy wcześniej, że
jest zmienną łańcuchową, a
do są zmiennymi numerycznymi i zawierają tylko liczby.
jednak wartości takie jak „26-jan-2015” na pewno nie wyglądają jak liczby, prawda? Dzieje się tak dlatego, że SPSS może wyświetlać liczby na bardzo różne sposoby. Te sposoby wyświetlania wartości danych nazywane są zmiennymi formatami.

określanie formatów zmiennych SPSS

jak widzieliśmy wcześniej, ” typ ” w widoku zmiennych pokazuje mylącą mieszankę typów i formatów zmiennych. Zobaczymy rzeczywiste formaty przez runningdisplay dictionary.Część wyniku jest pokazana na zrzucie ekranu poniżej.

zmienne formaty SPSS

SPSS rozróżnia formaty drukowania i zapisu, ale nie przejmujemy się tym rozróżnieniem. Formaty zmiennych SPSS składają się z dwóch części. Jedna lub więcej liter wskazuje rodzinę formatów. Większość z nich mówi do siebie, z wyjątkiem dwóch pierwszych zmiennych:

  • A („alfanumeryczny”) jest zwykłym formatem zmiennych ciągowych;
  • F, („Fortran”) oznacza standardową zmienną numeryczną.

formaty kończą się cyframi, wskazującymi liczbę znaków, które mają być wyświetlane. Jeśli występuje kropka, Liczba po kropce wskazuje liczbę miejsc po przecinku, które mają być wyświetlone. Poniższy rysunek ilustruje te punkty.

typ zmiennej SPSS kontra formaty

SPSS wspólne formaty zmiennych

poniższy rysunek podsumowuje teraz niektóre typowe typy zmiennych i formaty, które napotkamy w SPSS.

typ zmiennej SPSS kontra formaty

Ustawianie formatów zmiennych w SPSS

możesz ustawić formaty zmiennych dla zmiennych numerycznych za pomocą polecenia formaty. Na przykład waga formatów (f4. 3).pokazuje wagę z 3 miejscami po przecinku. Wpływa to na wynik, który tworzysz: większość tabel doda dodatkowe miejsce dziesiętne dla wagi. Jeśli chcesz zobaczyć to na własne oczy, uruchom poniższą składnię i porównaj 2 wynikowe tabele.

*Pokaż 2 miejsca po przecinku dla wagi i opisów przebiegu.
waga formatów (f3.2).
opisowa waga.
*Pokaż 3 miejsca po przecinku dla wagi i opisów przebiegu.
waga formatów (f4. 3).
opisowa waga.
*zauważ, że druga tabela wyników pokazuje więcej miejsc po przecinku.

pamiętaj, że zmiana formatów zmiennych nie zmienia w żaden sposób danych. Rzeczywiste wartości są nadal dokładnie takie same liczby. Są one jedynie wyświetlane inaczej.

typy i formaty zmiennych-po co się męczyć?

zasadniczo „to, co widzisz, nie jest tym, co dostajesz” w widoku danych. Na przykład widzimy $20.37, ale rzeczywista wartość to tylko 20.37. Możemy więc zidentyfikować produkty kosztujące $20,- lub więcej, uruchamiając poniższą składnię: compute expensive = (price >= 20).Nie uwzględniamy znaku dolara w naszej składni. Chociaż SPSS pokazuje znak dolara w widoku danych, rzeczywistymi wartościami są tylko liczby i to jest to, na co działa składnia.
lub powiedzmy, że chcielibyśmy dodać 30 dni do naszej zmiennej daty. Możemy to zrobić uruchamiając polecenie newdate = datesum(date,30,’days’).Uzyskane wartości to 13644236937.72. Są to poprawne liczby, ale będą wyświetlane jako czytelne daty dopiero po uruchomieniu czegoś takiego jak formats newdate (date11).Innym powodem zawracania sobie głowy zmiennymi formatami jest ustawianie miejsc dziesiętnych dla tabel wyjściowych. Dla wersji SPSS 22, OUTPUT MODIFY robi sztuczkę, jak pokazano poniżej.

*Utwórz podstawową tabelę opisów.
opisowa waga.
*Ustaw 2 miejsca po przecinku (format = f3.2) dla średniej i SD (Kolumny 4 i 5).
output modify
/select tables
/ tablecells select = selectdimension = columns format = 'f3.2′.

w podobnym duchu, CTABLES pozwala na wybór różnych formatów dla różnych statystyk na wyjściu.

*Tworzenie tabeli opisów z różnymi miejscami dziesiętnymi dla różnych statystyk.
ctables
/tabela prowizji .

Uwagi końcowe

ten poradnik był nieco teoretyczny, ale ma wiele praktycznych konsekwencji. Mam nadzieję, że to pomogło.
dzięki za przeczytanie!



+