Comprendre les types et formats de variables SPSS vous permet de faire les choses rapidement et de manière fiable. Il n’est pas difficile de maîtriser les types et les formats si vous ignorez les informations très confuses sous la vue variable. Ce tutoriel vous mettra sur la bonne voie.
Nous vous encourageons à suivre ce tutoriel en téléchargeant et en ouvrant computer_parts.sav, en partie illustré ci-dessous.
- Types de variables SPSS
- Alors Quoi de mieux: Chaîne ou numérique?
- Détermination des types de variables SPSS
- Formats variables SPSS – Introduction
- Détermination des formats variables SPSS
- Formats de variables communs SPSS
- Définition des formats variables dans SPSS
- Types et formats de variables – Pourquoi s’Embêter?
- Notes finales
Types de variables SPSS
SPSS a 2 types de variables:
- Les variables numériques ne contiennent que des nombres et conviennent aux calculs numériques tels que l’addition et la multiplication.
- Les variables de chaîne peuvent contenir des lettres, des chiffres et d’autres caractères. Vous ne pouvez pas faire de calculs sur des variables de chaîne, même si elles ne contiennent que des nombres.
Il n’y a pas d’autres types de variables dans SPSS que string et numeric. Cependant, les variables numériques ont plusieurs formats différents qui sont souvent confondus avec des types de variables. Nous verrons dans une minute comment la vue variable place les utilisateurs sur la mauvaise piste ici.
La seule façon de changer une variable de chaîne en numérique ou inversement est ALTER TYPE. Cependant, il existe plusieurs façons de faire une copie numérique d’une variable de chaîne ou inversement. On y arrivera dans une minute.
Alors Quoi de mieux: Chaîne ou numérique?
La règle empirique la plus simple est queseulement les variables nominales avec de nombreuses catégories
doivent être des variables de chaîne dans SPSS.Les exemples sont les noms de personnes, les adresses e-mail, les numéros de passeport, etc. Bien que de telles variables puissent être utiles, nous ne les analysons généralement pas.
Nous analysons parfois des variables nominales avec peu de catégories – telles que la nationalité, le groupe sanguin ou la profession. S’il s’agit de variables de chaîne, elles peuvent ou non causer des problèmes. Par exemple, la variable indépendante pour ANOVA peut ou non être une variable de chaîne en fonction de la commande exacte que vous utilisez pour elle.Précisément, UNIANOVA le fait et ONEWAY n’accepte pas les variables de chaîne comme facteurs.
Vous pouvez vous en sortir en laissant des variables telles que des chaînes. Cependant, en les copiant dans des variables numériques, vous éviterez tous les problèmes. Une façon décente de le faire est le CODE AUTOMATIQUE. Pour convertir des variables de chaîne métrique – ne contenant que des nombres – en variables numériques, consultez SPSS Convertir une chaîne en variable numérique.
Détermination des types de variables SPSS
Alors, comment savoir si une variable est une chaîne ou numérique? Dans les versions SPSS 24 et supérieures, de minuscules icônes devant les noms de variables nous indiquent le type de variable, le format et même le niveau de mesure. L’icône pour « nominal » peut contenir un minuscule « a » qui indique qu’il s’agit d’une variable de chaîne.
Pour les versions SPSS 23 et antérieures, nous allons inspecter notre vue variable et utiliser la règle suivante:
- si Type dit « Chaîne », vous avez affaire à une variable de chaîne;
- si Type ne dit pas « Chaîne », vous avez affaire à une variable numérique.
SPSS suggère que « Date » et « Dollar » sont également des types de variables. Cependant, ce sont des formats, pas des types. La façon dont ils sont affichés ici parmi les types de variables réels (chaîne et numérique) est l’une des caractéristiques les plus déroutantes de SPSS.
Formats variables SPSS – Introduction
Regardons maintenant les données dans la vue des données comme le montre la capture d’écran ci-dessous. Nous décrirons brièvement les types de variables que nous voyons.
En ce qui concerne ces données, nous avons indiqué précédemment que
est une variable de chaîne et
à sont des variables numériques et ne contiennent que des nombres.
Cependant, des valeurs telles que « 26-jan-2015 » ne ressemblent certainement pas à des nombres, n’est-ce pas? En effet, les SPSS peuvent afficher des nombres de manière très différente. Ces méthodes d’affichage des valeurs de données sont appelées formats variables.
Détermination des formats variables SPSS
Comme nous l’avons vu précédemment, « Type » sous la vue variable montre un mélange déroutant de types et de formats variables. Nous verrons les formats réels en exécutantdisplay dictionary.Une partie du résultat est illustrée par la capture d’écran ci-dessous.
SPSS distingue les formats d’impression et d’écriture, mais nous ne nous soucions pas de cette distinction. Les formats variables SPSS se composent de deux parties. Une ou plusieurs lettres indiquent la famille de formats. La plupart d’entre eux se parlent à eux-mêmes, à l’exception des deux premières variables:
- A(« Alphanumérique ») est le format habituel pour les variables de chaîne;
- F, (« Fortran ») indique une variable numérique standard.Les formats
se terminent par des chiffres, indiquant le nombre de caractères à afficher. Si un point est présent, le nombre après le point indique le nombre de décimales à afficher. La figure ci-dessous illustre ces points.
Formats de variables communs SPSS
La figure ci-dessous résume maintenant certains types et formats de variables courants que nous rencontrerons dans SPSS.
Définition des formats variables dans SPSS
Vous pouvez définir des formats variables pour les variables numériques avec la commande FORMATS. Par exemple, le poids des formats (f4.3).affiche le poids avec 3 décimales. Cela affecte la sortie que vous créez: la plupart des tables ajouteront également une décimale supplémentaire pour le poids. Si vous souhaitez voir cela par vous-même, exécutez la syntaxe ci-dessous et comparez les 2 tables résultantes.
poids des formats (f3.2).
poids descriptifs.
* Affiche 3 décimales pour les descriptifs de poids et d’exécution.
poids des formats (f4.3).
poids descriptifs.
* Notez que le deuxième tableau de sortie affiche plus de décimales.
Gardez à l’esprit que le changement de formats de variables ne modifie en rien vos données. Les valeurs réelles sont toujours exactement les mêmes nombres. Ils sont simplement affichés différemment.
Types et formats de variables – Pourquoi s’Embêter?
Fondamentalement, « ce que vous voyez n’est pas ce que vous obtenez » dans la vue données. Par exemple, nous voyons 20,37 $ mais la valeur réelle n’est que de 20,37. Nous pouvons donc identifier les produits coûtant 20 $ ou plus en exécutant la syntaxe ci-dessous: compute expensive = (prix > = 20).Nous n’incluons pas le signe dollar dans notre syntaxe. Bien que SPSS affiche un signe dollar dans la vue des données, les valeurs réelles ne sont que des nombres et c’est ce sur quoi la syntaxe agit.
Ou disons que nous aimerions ajouter 30 jours à notre variable de date. Nous pourrions le faire en exécutant newdate =datesum(date, 30, ‘jours’).Les valeurs résultantes sont 13644236937.72. Ce sont les nombres corrects, mais ils ne s’afficheront en tant que dates lisibles qu’après avoir exécuté quelque chose comme formats newdate (date11).Une autre raison de déranger les formats variables est de définir des emplacements de décimales pour les tables de sortie. Pour la version SPSS 22 à partir de, OUTPUT MODIFY fait l’affaire comme indiqué ci-dessous.
poids descriptifs.
* Définissez 2 décimales (format = f3.2) pour la moyenne et l’écart type (colonnes 4 et 5).
sortie modifier
/ sélectionner des tables
/ tablecells select=selectdimension=columns format=’f3.2′.
Dans la même veine, CTABLES permet de choisir différents formats pour différentes statistiques dans votre sortie.
ctables
/ commission de table.
Notes finales
Ce tutoriel était quelque peu théorique mais il a beaucoup de conséquences pratiques. J’espère que vous l’avez trouvé utile.
Merci d’avoir lu!