Cours de Psychologie: Initiation à la méthode des tests (Bourdais)

I. Introduction théorique : Histoire des tests (et de la psychologie différentielle)

La psychologie différentielle naît en même temps que les tests.

1) L’associationnisme et le 1er laboratoire de Psychologie expérimentale de Wundt

L’associationnisme de Wundt est basé sur la réaction à l’introspection. C’est l’idée de dire que la complexité psychique humaine doit être segmentée pour travailler sur des éléments psychiques simples. Lorsque l’on réassociera ces éléments on tombera de nouveau sur la complexité psychique.
Wundt veut mesurer tous les éléments psychiques simples -> Si l’on mesure les choses, on est scientifique, on va atteindre la possibilité, les justifications scientifiques. Cela passe aussi par la description physique, au-delà des faits psychiques.
L’associationnisme repose sur les idées philosophiques empiriques car témoigne de la façon dont l’être humain construit ses expériences en fonction des connaissances qu’il a. Puis sur un 2e principe : le réductionnisme => les phénomènes psychiques complexes peuvent être décomposés/réduit en phénomène simple/élémentaire que l’on réassociera. La perspective mécanistique => Ces processus non contrôlé par le sujet, influencé par l’extérieur, le sujet est passif, le contrôle est déterminé par les éléments extérieur.
ASSOCIATIONNISME = EMPIRISME + REDUCTIONNISME + MECANISTE
Mais la philosophie différentielle est postérieure à Wundt.
Si il y a des variations interindividuelles, il n’y a pas de mesure = c’est impossible (erreurs de mesures..). Les êtres humains sont égaux et vont agir de la même manière et si il y a des différences => Problème avec l’outil de mesure.

2) Galton : père de la psychologie différentielle et cousin de Darwin.

Galton se place dans une perspective différentialiste, il est cousin de Darwin et élève de Wundt, mais ses travaux sont marqués par l’évolutionnisme de Darwin et l’idée de sélection naturelle et d’hérédité. Pour Darwin, le milieu va influencer l’évolution des espèces, les interactions entre les espèces et leur environnement est important.
Galton veut appliquer à la psychologie expérimentale les principes du darwinisme. Il va faire une étude qui va lancer le début du mouvement eugéniste. Il fait une expérience sur 300 familles, la moitié étant des familles dont les membres ont réussit socialement (médecin, avocat, magistrat…) et l’autre moitié des familles dans lesquelles il n’y a pas de réussite sociale (mineure, facteur, ouvrier..).

L’eugénisme est appliqué à l’espèce humaine seule, selon les principes du darwinisme. L’eugénisme cherche à l’intérieur de l’espèce humaine, le meilleur être humain avec les meilleures performances dans tous les domaines etc.
Galton utilise les outils de Wundt et récuse le postulat de Wundt grâce à cette expérience (postulat étant l’inverse du darwinisme). Et il va comparer des familles mais surtout leur arbre généalogique.
> on est héréditairement dans la réussite sociale ou non.
Les différences interindividuelle, sociale ou les fonctions simples, sont héréditaires. C’est la base des différences interindividuelles. Il va développer les outils statistiques dont il a besoin pour prouver scientifiquement qu’il a raison comme la corrélation. Création du premier laboratoire anthropométrique qui va s’intéresser aux variations interindividuelles.
> Théorie des aptitudes, fondatrices de la psychologie différentielle qui amène à concevoir les premiers tests (100ans plus tard).

N.B : Pour l’eugénisme qui chercher à crée une race humaine meilleure, on peut faire un parallèle avec le nazisme et le fascisme. L’idée de départ était d’améliorer l’espèce humaine, le rendre toujours plus compétente, plus performante. Le problème c’est qu’il faut alors éliminer les « ratés » de l’espèce, les plus faibles. Velléités très forte. Stérilisation de certaines femmes, interner certaines personnes pour les écarter, soutien financier de certaines familles, éviter d’en soutenir d’autres : va avec un programme politique. Sans parler alors du régime nazi.

3) J.MK. Cattel & Spearman : deux contributions importantes.

1883-1886 : à Leipzig, Cattel travaille sur les temps de réaction et se dit que tout ce que l’on a mesuré c’est l’intelligence. Avec Spearman, ils vont mettre au point des indices de corrélations pour voir si les mesures vont dans le même sens => facteur de corrélation/d’intelligence.
Il va mettre en place des indices statistiques et un jour, il va corréler toutes les mesures de Wundt et de Galton (processus psychiques élémentaires) avec la réussite des enfants à l’école. Mais il n’y a aucune corrélation. Toutes les études vont être abandonnées et il laisse tomber les idées de mesure. Mais Spearman reprend et continu les tests pour l’intelligence et s’intéresse aux différences interindividuelles avec Galton en essayant de trouver ce qui fait ces différences, notamment l’intelligence quotidienne (ou intelligence pratique) et va essayer de la corréler avec les premières mesures perceptives de Wundt.
Ces auteurs vont avoir l’idée que si il y a corrélation entre 2 variables, alors peut être qu’une 3e variable explique cette corrélation.
Docimologie : étude des notes à l’école à grand domaine référentiel à la psychologie différentielle.
Mesure psychophysiques : Galton était au service de la politique.
Eugénisme : la race blanche supérieur

Théories des aptitudes : idée que les aptitudes sont diverses et non hiérarchisées au début des années 60 : qualitatif et non quantitatif à seul point important de Galton.
Spearman : intelligence quotidienne liée avec les mesures psychophysiques. Il va développer des analyses de corrélations.
Corrélation : sert à voir le lien qu’il y a entre 2 variables, par exemple entre les notes en psychologie clinique et les notes en psychologie cognitive.
Schéma : corrélation nulle

Idée derrière la corrélation : il y a des présupposés communs. Il y a un 3e facteur explicatif qui vient expliquer pourquoi il y a un lien fort entre les 2 premières variables. On supprime toute idée de causalité l’une envers l’autre. Il y a un mécanisme commun derrière qui influe.
Schéma : corrélation négative

Travaux de Spearman : corrélation et explication : analyses
Si la corrélation est positive, alors le facteur explicatif caché derrière ne peut être que l’intelligence.

4. Binet et son EMI

En France, Charcot (travaux sur les hystéries : médecin qui va fonder la psychiatrie en France fin 19e siècle : « les mardis de Charcot à la Salpêtrière). Travaux de Charcot : hypnose à travers l’hypnose, une partie des symptômes est levée.
En France, on s’intéresse à la psychologie au niveau pathologique et Charcot va transmettre son laboratoire à Janet en 1980.
Ribot est celui qui fonde la chaine de psychologie du collège de France et qui va propulser Henri Piéron dans le monde de la psychologie et il va proposer la psychologie expérimentale. Dumas en 1901 était en charge de la chaine de psychologie à la Sorbonne.
EMI : échelle Métrique de l’Intelligence à inventé par Binet

Binet vient assister aux Mardis de Charcot et tente de se positionner dans la psychiatrie. Il récupère le laboratoire de charcot de la salpetrière. Il n’est ni médecin, niélevé dans l’esprit de la psychologie. C’est pourquoi il veut s’inscrire dans ce monde et y laisser son nom. Alors il invente l’EMI.
Dès le départ, Binet s’intéresse à l’intelligence. Il ne s’inscit pas dans la psychologie mais prend une voie expérimentale. Pour lui, il veut s’intéresser directement à l’intelligence.
Correction du texte :
Pédagogie individuelle à caractéristiques physique, intellectuelles et morales. La laboratoire est dans l’école. L’assemblée générale de la société libre rassemble : directeurs
d’école, parents, élèves et expérimentateurs (scientifiques). Cette AGSL est construire dans une école : tout le monde réfléchie ensemble pour améliorer l’école. Les classes sont constituées d’élèves d’âges différents et de classes sociales différentes, d’où l’importance de cette expérience. Les parents ne sont pas contre cette expé, ils y participent même car il y a une soif de savoir, de connaissances.
Le maitre est présent pour éduquer et enseigner aux élèves. La cantine est là pour fournir un repas chaud, et notamment aux enfants démunis, pauvres qui n’auraient peut être pas de déjeuner s’ils rentraient chez eux. Elle tente de fournir au moins un repas par jour aux enfants. Le maitre doit aussi repérer dans sa classe les élèves démunis pour les emmener à la cantine. Le maitre n’a pas assez de recul pour fournir de vraies données entre l’âge et la taille. Et binet va se fonder sur ça pour affirmer que l’intelligence grandit en même temps que l’âge et la taille.

III. Définition d’un test

1. Définition d’un test

1- Définition de Henry Piéron (1933) :
« C’est une épreuve définit qui a une tâche à remplir identique pour tous les sujets avec une technique précise d’appréciation du succès ou de l’échec avec une notation numérique »
Tâche :
* Mise en œuvre de connaissances acquises (= test pédagogique)
* Mise en œuvre des fonctions sensori-motrices ou mental (= test psychologique)

2- Définition de Pichot (1949) :

« Test mental = situation expérimental standardisée servant de stimulus à un comportement. Ce comportement évalué par comparaison statistique avec celui d’autre individu placé dans la même situation => classé le sujet examiné quantitativement et typologiquement.
3- Définition d’Anastasi (1969) :
« Test psychologique est essentiellement une mesure objective et standardisée d’un échantillon des comportements »
> Mise en garde de R. Zazzo (1972) :

Sur la définition d’un test. Intelligence différente liées à une des attitudes différentes => Piéron met en garde sur l’EMI de Binet. Pas de modification de l’EMI => le NEMI qui est un réétalonnage de l’échelle de mesure de Binet en 1949. Entre temps, le test EMI s’oriente vers un test Q.I.
Si le test est un modèle de fonctionnement psychique, ne vaut pas grand-chose quand on en connait pas le secret de fabrication.

* Postulat de l’Essence : postulat de l’existence des dimension psychologiques que l’on mesure.
Les tests sont basés sur l’idée de mesurer quelque chose qui existe. Par exemple, l’existence de l’intelligence chez l’être humain, alors on peut la mesurer. On a jamais démontré empiriquement que l’intelligence existe => c’est un postulat, une construction conceptuelle que l’on définit pour délimiter l’intelligence et ainsi la mesurer. On peut dire pareil pour l’angoisse ou la dépression.
D’une part, on pari que cela existe et surtout de façon stable, saisissable, durable chez les individus => cela nous constitue (= essence).
C’est une conception occidentale de la nature humaine qui n’est pas définit, qui est très culturelle et locale. Il y a des conceptions de l’Homme où seul existe les faits, observables, ephémère qui ne constitue pas la personne en elle-même.
* Postulat de contingence (Chercher sur internet)

2. Etape de construction d’un test

* Cadre de référence théorique : Savoir par rapport aux dimensions psychologiques, la mesure de l’intelligence par exemple, n’avait pas de cadre théorique pour la construction du test. Caractéristiques :
> Revue de littérature : voir ce qui a déjà été écrit sur le sujet, les publications empiriques, pratique sur le sujet à traité.
> Analyser les instruments : ayant un lien avec ce que l’ont veut mesurer
> Description de la dimension psychologique que l’on cherche à évaluer
* Le choix du dispositif : observation, questionnaire, expérience, manipulation. Il est lié à la première étape et aussi aux buts que l’on cherche à atteindre et dans ces dispositifs on a la question de savoir si le test doit être individuel ou collectif. Ainsi qu’à la notion de durée, combien de temps que l’on consacre à cette évaluation.
Caractéristiques :
> Combien de dimension psychologique on veut évaluer avec les sous-catégories de dimensions ou non, combien d’item par dimension…
> La population à laquelle on destine le test se caractérise différemment. Caractéristique basique comme l’âge mais aussi, selon les études, les caractéristiques de la population (étudiant, autiste, ouvrier…)

* Mise en forme des items : un certain nombre de caractéristiques sont requises au minimum. Les tests verbaux ont seulement des items verbaux.
Caractéristiques :
o Les items ne doivent pas contenir d’ambigüité, c'est-à-dire que si l’on attend une seule réponse, ile ne doit pas u avoir de piège, une seule réponse plausible.
o Items courtes
o Une seule réponse possible, ou si plusieurs, on doit les définir.
o Pas d’erreur dans la question
o Rédaction correcte : en langage écrit et doit respecter les règles de grammaire et d’orthographe de la langue écrite.
o Doivent mesurés la dimension souhaitée et pas une autre. C'est-à-dire qu’il faut faire attention à ne pas mélanger les items.
o Caractérisé par l’ensemble des réponses qui répond à tel item ou tel item (item ouverts) à test exploratoire pour voir les réponses possibles. A partir de là, on peut choisir les questions que l’on peut poser pour obtenir les réponses attendues.

* Evaluation et sélection des items : on choisit un premier échantillon à qui on destine le test. Puis on applique le test et on fait subir aux réponses les statistique habituelles pour voir comment se « balade » les réponses, si elles correspondent aux statistiques habituelle.
Analyse statistique :
* Toutes les réponses où les gens répondent correctement (à 100%) à enrichissement de la partie théorique de la psychologie car développement quasi-inexistante. On ne les met pas dans le test.
* Vérification de la variabilité des items grâce à la loi normale
* Série d’analyse item par item puis sous-catégorie par sous-catégorie.
* Typologie de l’individu => corrélation qui amène à valider ou invalider le test.
> Amène à conserver, modifier ou supprimer des items et/ou des groupes d’items. Processus d’ajustement des items pour obtenir un bon test pour se faire en X fois.

* Deuxième version du test et on applique : nouveaux un échantillon que l’on espère définitif.
> Etalonnage du test à étalon : groupe de référence qui caractérise la population de référence par ce test.
Il va nous dire ce que l’on peut comparer ou non l’individu en fonction de cet étalonnage qui nous donne la situation de l’individu que l’on a testé.
> Groupe de référence auquel on fait passer le test qui existe grâce aux résultats de cette population de référence.
Petit à petit, les performances évoluent et il faut donc faire évoluer l’étalonnage. On vérifie si la loi normale est respecté. Les tests, l’étalonnage est basé sur cette loi normale, qu’elle suit une loi normale, que les plupart des individus aient la moyenne.
Réétalonnage = renouvellement de la population de référence.
L’échantillon est soit ciblé sur tel ou tel item, soit il est pris au hasard ou il est représentationnelle de la population générale.

IV. Exemples de Tests :

1) Tests de personnalité (16P.F et MMPI)

2) Tests projectifs (Rorschach)

Comment répertorier un test ?
Schéma à suivre :
* Noms du (des) auteurs.
* Dates et historiques de la création des tests
* But(s)
* Cadre théorique de référence
* Description rapide du matériel utilisé
N.B. : les calculs (QI, population, etc.) ne sont pas requis pour ce cours.

3) Tests d’intelligences (WAIS, WISC) – Test de Wichsler

N.B. : Différentes formes :
* WISC : 6 à 16ans
* WPPSI : 3 à 6ans période préscolaire
* WAIS : adpaté jusqu’à l’âge adulte.
Le WISC a été crée en 1967, la version française à été éditée en 1972 et 1992.
* Dates : VO : 1955 ; VF : 1958
* Cadre de référence théorique + but : Le Wichsler a été crée pour les adultes pathologiques, placés en psychiatrie. Il s’agit d’une échelle d’intelligence qui va être adaptée aux plus jeunes. Ce sont les fonctions globales qui sont mesurées. Selon Wichsler, il existe 2 Q.I. :
* Un QI verbal
* Un QI de performance
Néanmoins les 2 ne sont pas corrélés : Wichsler travaillait avec des populations pathologiques (ex : le QI peut être fiable et la performance élevée). Il ne conçoit pas d’évolution du QI. L’échelle a été construite telle que les différences interindividuelles restent visibles (toujours la même, il n’y a pas de différences importantes au niveau inter âge).
Il adopte un modèle athéorique. Il réutilise ses propres connaissances. Il s’agit d’une théorie de l’intelligence globale, il y a un perspective où l’intelligence est propre à chacun et qu’elle reste fixe durablement.
Le WISC, version 4 (2006) permet plus de différenciation des performances :
* Un indice verbal
* Un raisonnement perceptif ; mémoire de travail ; analyse de la vitesse de traitements.

La vision du WISC IV est beaucoup plus multidimensionnelle (même si il comportait 2 facettes).
Suppression de certains items. Plus proche de :
* L’intelligence fluide (situation nouvelles, réaction)
* L’intelligence cristallisée (scolaires, cf. Binet)
Wechsler a crée d’abord le WAIS puis le WISC et enfin le WPPSI.
Ces tests son régulièrement réviser(réetalonnage et modification de certains items). Le premiers WISC a été crée en 1958, après la 2nde G.M. aux Etats Unis. En cette période, les américains avait une perspective de rentabilité de l’éducation pour détecter le plus tôt possible les performances pour répartir mieux dans ce que les enfants savaient le mieux faire.
Il a travaillé avec des adultes en HP en dehors de toutes considérations théoriques d’intelligence. Par la création de ces tests, Wechsler a contribué empiriquement à l’évaluation de l’intelligence. Dans son approche, il y a une considération unidimensionnelle athéorique de l’intelligence, pour lui, l’intelligence est une caractéristique de la personne. C’est aussi une caractéristique intemporelle, car pour lui, elle n’évolue pas avec le temps. Ces tests ont donc été construit pour que l’intelligence ne varie pas.
Il veut caractériser une intelligence de façon métrique.
C’est aussi le premier test qui va travailler sur les statistiques de ces étalonnages et qui va faire un changement épistémologique de l’intelligence => la norme statistique va devenir la norme psychologique.
Plutôt que de définir qualitativement l’intelligence moyenne, là où il y a le plus de mode sur un ensemble de population, c’et la norme, la moyenne (en distribution normale).
Il va marquer al psychologie puisque l’on va désormais adopter ce point de vue statistique. CE point de vue alimente les conceptions théoriques.
N.B. : dans la révision des tests => adaptation culturelle de ces tests. Modifier des items mais surtout réetalonner en fonction d’un nouveau groupe de référence.
Le WISC 4 intègre de nouvelles considérations comme l’intelligence fluide (= ce qui nous permet de réagir à des situations nouvelles) et l’intelligence cristallisée (= rapport avec l’apprentissage scolaire).

4) Test de développement- Test de Brunet-Lézine.

* Auteurs : Odette BRUNET et Irène LEZINE
* Dates : 1ère version (1951), 2ème version (1997)
* But : Développement psycho-moteur de
o 1 à 30 mois (1ère version)
o 2 à 30 mois (2ème version)
* Références théoriques : développement postural, coordination occulo-manuelle pour la prise en main des objets, langage, sociabilité.

* Identiques pour les 2 versions mais développement important des recherches faites pour les enfants (cf. Bruner : routines interactives)
* Ré-étalonnage des tests pour éviter les effets plafonds
* Révision test : ré-étalonnage + modification, suppression ou ajout d’items, de la population également.
N.B. : Voir les travaux de Vigotsky (apparais sur le tare, 1997 G-Froide) ; Wallon (B-L étaient ses élèves et ont empruntés des idées pour les théories globales du développement de l’enfant et son environnement social).
Le test de Brunet-Levine est un test qui évalue 4 domaines de développement => développement psychomoteur
* Le développement Postural
* La Coordination visuo-manuelle
* Le Langage
* La Sociabilité
B et L ont fait une transposition de la notion d’intelligence aux âges précoces du développement. Il doit y avoir au mons 2 passations de ce test par enfant. Dans le premier manuel, Wallon dit qu’il serait bien de faire passer le test tous les mois jusqu’à 24 mois pour vérifier que bon développement de l’enfant.
La question est de voir 4 domaines de développement qui se développe plus ou mons directement, pas de manière systématique.
> Ecarts normaux et ecarts pouvant être inquiétant sont dans le manuel.
Ce test renvoi à une perspective développementale.
Essentiellement, les parents sont interrogés aussi pour voir l’interaction avec l’adulte chez l’enfant, surtout lorsque l’enfant n’a pas envie d’interagir avec le psychologue.
La révision du test de Brunet-Lezine date de 1996, en plus de la perspective constructiviste de Piaget, de la théorie de Wallon et du maturationnisme de Gesell, on rajoute la perspective d’interaction social et du développement du langage de Vigotsky et Brüner.

IV. Les qualités métrologiques d’un test

La métrologie est la science de la mesure, c’est ce qui deviendra plus tard la psychométrie qui s’intéresse à la mesure des aspects psychologiques.
Un premier consensus à été signé en 1931 à Moscou pour de mettre d’accord sur un certain nombre de qualités que les test devront avoir pour être dit valable en psychologie.
Si la psychométrie est une science, il doit y avoir des exigences qui soient les mêmes que pour les autres outils de mesures. C’est pour cela que les test psychométriques répondent à des exigences scientifiques

1) 1ère qualité : L’objectivité

> Classe , hiérarchiser les individus par rapport à leurs résultats aux tests.
Le but est que le classement ne varie pas à chaque fois que l’on change de personne. Il faut pour cela que le test soit standardisé, que les conditions de passation et la cotation de l’outil de mesure soit standardisée.
Pour être objectif (= obtenir à peu près la même mesure), on standardise le test. Mais l’objectivité s’oppose à la subjectivité. On entre dans une observation armée des comportements dans laquelle on utilise un outil et on est dans une démarche opposé à l’observation non armée (à main nue, juste en regardant).
Ici, on cherche à s’éloigner de la subjectivité et du rôle que pourrait jouer la sympathie/l’antipathie et l’outil, le matériel permet de supprimer la subjectivité. Pour cela, le but est que les observateurs peuvent être interchangeables car la médiation entre sujet interrogé et interrogateur permet une hiérarchisation dans l’objectivité.
La standardisation permet une distance entre la subjectivité entre les individus.
Facteurs de subjectivité :
* L’erreur de mesure
* Du côté de l’examinateur, les variables contrôlés comme le stress, le fait de vouloir plaire. La façon dont la personne reçoit l’examen peur faire preuve de subjectivité.
* Les aspects culturels, il y a des biais culturels à l’intérieur même des tests.
* La désirabilité sociale
* Les tests projectifs : projeter son intérieur, donc subjectif (type test de Rorsach). Le matériel est standardisé mais les résultats analysés sont l’effet que l’examinateur produit sur la subjectivité de l’enfant.
L’objectivité est un idéal difficile à atteindre, du moment où il y a de l’humain, il y a apparition de subjectivité de façon non contrôlé et non contrôlable. Ce sont des objectifs auxquels on s’efforce de répondre le mieux.
Il faut également faire attention aux variations de motivation et d’émotion. La motivation peut se manifester par :
* La vulnérabilité sociale
* La représentation lié à la tâche
o Représentation de la tâche elle-même
o Représentation de ce que l’on attend d’eux
o Représentation de la difficulté de la tâche
o Représentation de la bonne réponse
L’objectivité est recherché mais rarement atteinte et pas forcément souhaitable.

2) 2e qualité : L’étalonnage (ou la graduation)

L’étalonnage va donner du sens aux résultats individuels pour avoir une représentation du groupe de références auquel on veut comparer le test de l’individu. Il peut être variable mais c’est une étape importante de la construction d’un test.
La comparaison avec le monde de la physique prévaut en psychométrie, l’étalonnage joue le rôle de maitre-étalon dans la mesure physique de grandeurs.
Le test doit se baser sur un groupe étalon de référence et pour cela, on a différentes manières de procéder pour obtenir cette banque de donnée :
* L’échantillonnage au hasard : on part du principe que l’on aura autant de chance de tomber sur tel ou tel chose dans une population large.
* L’échantillonnage sélectionné : on sélectionne le type de population sur laquelle on veut se baser
* La stratification ou représentation proportionnelle : on prend tel pourcentage de cette catégorie de population.
* L’échantillonnage multiple : quand on fait des groupes différents selon des pathologies (par ex.), si le but du test est de différencier des groupes. On regarde comment ces groupes ont été défini.
N.B. : on n’est pas dans une perspective, une orientation bien particulière à cause du DSM. Certaines données théoriques sont absentes de l’étalonnage. Les spécialistes se disent athéorique et pourtant ils sont orientés.
Le but est d’obtenir une banque de données à laquelle on fait passer un certain nombre de statistiques qui va servir de groupe de référence pour situer l’individu. Certains étalonnages sont complexes à l’intérieur de chaque sous-population.

3) 3e qualité : la sensibilité (ou finesse de discrimination).

La sensibilité renvoie au pouvoir discriminatoire/aux orientations interindividuelles, aux différences. Il doit discriminer assez finement de manière à pouvoir classer un individu/ situer par rapport à un groupe de référence. Il répond à la question du classement des individus.
On est basé sur l’idée qu’il existe des différences interindividuelles sur la question, l’idée en question.
Les variations existent dans la mesure mais pas forcément chez l’individu. Ce n’est pas sur la bonne sensibilité du test que cela renseigne mais sur la dimension mesurée.
> Le test permet de mesurer telle ou telle caractéristique de l’individu. On ne mesure juste pas la même chose chez tout le monde.
On peut faire jouer une généralisation ou une discrimination précise d’un certain item.
Le problème est que de faire du grosso-modo psychose/névrose. Cependant, si il faut pointer quelle est la difficulté dans l’apprentissage mathématique/lecture car varie selon le temps.
La finesse de discrimination est importante d’autant plus si il faut être prudent pour pas qu’il y ait de variation dans le temps.
Il y a beaucoup de risque d’erreur.
Le but du test est aussi important sur la sensibilité.
La sensibilité pour le test d’intelligence = on utilise souvent une façon d’augmenter la sensibilité du test en introduisant des difficultés/variations interindividuelles/ des paramètres supplémentaires. On ne mesure plus la même chose => on mesure la rapidité de réponse ou de traitement.
Dans ce processus d’élaboration des tests, on supprime les items plus facile ou trop difficile pour éviter l’effet plafond.

4) 4e qualité : La fidélité

On peut tomber sur des comportements d’un jour qui ne reviendront pas forcément le lendemain. On cherche donc ici à ce que la fidélité temporelle soit respectée car peu de test sont des tests de développement. On veut être sur de la fidélité intra individuelle du test.
La plupart des tests sont conçu pour être un minimum fidèle.
On cherche à savoir que si on fait repasser un test à quelques semaines d’intervalles, les résultats seront à peu près identique/stable, savoir si la mesure est objective et partout la même quelque soit le temps. Cela montre comment le temps peut distordre les outils de mesures.
La constance de la mesure renvoie à une constance de la dimension psychologique étudiée. Elle se mesure de différentes manières :
* La méthode Test-Retest : faire passer 2 fois de suite le test à la même population d’étalonnage que lorsque l’on considère que le test ne subira pas d’effet d’apprentissage. Il permet de donner des corrélations.
* La méthode Test en Split-Half : divisé en 2 partie, on fait passer la première moitié du test à un temps T1 et l’autre moitié à un temps T2. On divise chaque sub-test en 2.
Il faut que les sub-test soient homogènes. On obtient un degré d’homogénéité des 2 notes en plus du degré de fidélité car cela dit si les 2 moitiés du test sont très bien corrélées.
* La méthode des 2 formes différentes : Forme A et B. On construit 2 formes différentes, on dédouble le test/les items à chaque fois. On construit l’équivalent du test (le même mais en différent). C’est la méthode la plus complète car il n’y a pas d’effet d’apprentissage et d’homogénéité.
N.B. : on doit avoir une des 3 méthodes pour tester la fidélité du test. Mais cela pose un certain nombre de problème.

5) 5e qualité : La validité

C’est la qualité qui permet de dire que l’on mesure bien ce que l’on était censé mesurer. Le test mesure bien ce que l’on attendait. Elle est plus difficile car comment peut-on savoir que l’on mesure bien la bonne chose. Elle peut être évalué par le degré de liaison entre le test en question et d’autres tests ou d’autres activités supposés liés aux même processus psychologiques.
* La validité conceptuelle : elle est estimée sur la base de la liaison entre le test et un autre test plus ancien dont on connait les propriétés.
o Méthode d’évaluation : on fait passer à un groupe de sujet le test et un autre test d’intelligence général. On calcule la corrélation entre les 2 mesures. Si la corrélation est de l’ordre de .40-.60, on estime que le test a une bonne validité vis-à-vis d’autres mesures intellectuelles
* La validité prédictive : elle est estimée sur la base de la relation entre le test et une activité de référence pour répondre à la question. La note au test permet de prédire certaines performances future ?
o Méthode d’évaluation : on fait passer à un groupe de sujet le test et on recueille leur performance scolaire (ou réussite professionnelle). Après un certain délai, quelques années plus tard (par ex.), on calcule la corrélation entre les 2 mesures. Si la corrélation est de l’ordre de ;40-.60, on estime que le test a une bonne validité vis-à- corrélation est de l’ordre de ;40-.60, on estime que le test a une bonne validité vis-à-vis de la réussite scolaire (ou pro).

Cours de Psychologie

mercredi 5 mars 2014

Initiation à la méthode des tests (Bourdais)

Aucun commentaire:

Enregistrer un commentaire