I. Introduction théorique : Histoire des tests (et de la psychologie différentielle)
La psychologie différentielle naît en même temps que les tests.
1) L’associationnisme et le 1er laboratoire de Psychologie expérimentale de Wundt
L’associationnisme
de Wundt est basé sur la réaction à l’introspection. C’est l’idée de
dire que la complexité psychique humaine doit être segmentée pour
travailler sur des éléments psychiques simples. Lorsque l’on réassociera
ces éléments on tombera de nouveau sur la complexité psychique.
Wundt
veut mesurer tous les éléments psychiques simples -> Si l’on mesure
les choses, on est scientifique, on va atteindre la possibilité, les
justifications scientifiques. Cela passe aussi par la description
physique, au-delà des faits psychiques.
L’associationnisme repose
sur les idées philosophiques empiriques car témoigne de la façon dont
l’être humain construit ses expériences en fonction des connaissances
qu’il a. Puis sur un 2e principe : le réductionnisme => les
phénomènes psychiques complexes peuvent être décomposés/réduit en
phénomène simple/élémentaire que l’on réassociera. La perspective
mécanistique => Ces processus non contrôlé par le sujet, influencé
par l’extérieur, le sujet est passif, le contrôle est déterminé par les
éléments extérieur.
ASSOCIATIONNISME = EMPIRISME + REDUCTIONNISME + MECANISTE
Mais la philosophie différentielle est postérieure à Wundt.
Si
il y a des variations interindividuelles, il n’y a pas de mesure =
c’est impossible (erreurs de mesures..). Les êtres humains sont égaux et
vont agir de la même manière et si il y a des différences =>
Problème avec l’outil de mesure.
2) Galton : père de la psychologie différentielle et cousin de Darwin.
Galton
se place dans une perspective différentialiste, il est cousin de Darwin
et élève de Wundt, mais ses travaux sont marqués par l’évolutionnisme
de Darwin et l’idée de sélection naturelle et d’hérédité. Pour Darwin,
le milieu va influencer l’évolution des espèces, les interactions entre
les espèces et leur environnement est important.
Galton veut
appliquer à la psychologie expérimentale les principes du darwinisme. Il
va faire une étude qui va lancer le début du mouvement eugéniste. Il
fait une expérience sur 300 familles, la moitié étant des familles dont
les membres ont réussit socialement (médecin, avocat, magistrat…) et
l’autre moitié des familles dans lesquelles il n’y a pas de réussite
sociale (mineure, facteur, ouvrier..).
L’eugénisme est appliqué à l’espèce humaine seule, selon les
principes du darwinisme. L’eugénisme cherche à l’intérieur de l’espèce
humaine, le meilleur être humain avec les meilleures performances dans
tous les domaines etc.
Galton utilise les outils de Wundt et
récuse le postulat de Wundt grâce à cette expérience (postulat étant
l’inverse du darwinisme). Et il va comparer des familles mais surtout
leur arbre généalogique.
> on est héréditairement dans la réussite sociale ou non.
Les
différences interindividuelle, sociale ou les fonctions simples, sont
héréditaires. C’est la base des différences interindividuelles. Il va
développer les outils statistiques dont il a besoin pour prouver
scientifiquement qu’il a raison comme la corrélation. Création du
premier laboratoire anthropométrique qui va s’intéresser aux variations
interindividuelles.
> Théorie des aptitudes, fondatrices de la
psychologie différentielle qui amène à concevoir les premiers tests
(100ans plus tard).
N.B : Pour l’eugénisme qui chercher à crée
une race humaine meilleure, on peut faire un parallèle avec le nazisme
et le fascisme. L’idée de départ était d’améliorer l’espèce humaine, le
rendre toujours plus compétente, plus performante. Le problème c’est
qu’il faut alors éliminer les « ratés » de l’espèce, les plus faibles.
Velléités très forte. Stérilisation de certaines femmes, interner
certaines personnes pour les écarter, soutien financier de certaines
familles, éviter d’en soutenir d’autres : va avec un programme
politique. Sans parler alors du régime nazi.
3) J.MK. Cattel & Spearman : deux contributions importantes.
1883-1886
: à Leipzig, Cattel travaille sur les temps de réaction et se dit que
tout ce que l’on a mesuré c’est l’intelligence. Avec Spearman, ils vont
mettre au point des indices de corrélations pour voir si les mesures
vont dans le même sens => facteur de corrélation/d’intelligence.
Il
va mettre en place des indices statistiques et un jour, il va corréler
toutes les mesures de Wundt et de Galton (processus psychiques
élémentaires) avec la réussite des enfants à l’école. Mais il n’y a
aucune corrélation. Toutes les études vont être abandonnées et il laisse
tomber les idées de mesure. Mais Spearman reprend et continu les tests
pour l’intelligence et s’intéresse aux différences interindividuelles
avec Galton en essayant de trouver ce qui fait ces différences,
notamment l’intelligence quotidienne (ou intelligence pratique) et va
essayer de la corréler avec les premières mesures perceptives de Wundt.
Ces
auteurs vont avoir l’idée que si il y a corrélation entre 2 variables,
alors peut être qu’une 3e variable explique cette corrélation.
Docimologie : étude des notes à l’école à grand domaine référentiel à la psychologie différentielle.
Mesure psychophysiques : Galton était au service de la politique.
Eugénisme : la race blanche supérieur
Théories des aptitudes : idée que les aptitudes sont diverses et non
hiérarchisées au début des années 60 : qualitatif et non quantitatif à
seul point important de Galton.
Spearman : intelligence quotidienne liée avec les mesures psychophysiques. Il va développer des analyses de corrélations.
Corrélation
: sert à voir le lien qu’il y a entre 2 variables, par exemple entre
les notes en psychologie clinique et les notes en psychologie cognitive.
Schéma : corrélation nulle
Idée derrière la corrélation : il y a des présupposés communs. Il y a
un 3e facteur explicatif qui vient expliquer pourquoi il y a un lien
fort entre les 2 premières variables. On supprime toute idée de
causalité l’une envers l’autre. Il y a un mécanisme commun derrière qui
influe.
Schéma : corrélation négative
Travaux de Spearman : corrélation et explication : analyses
Si la corrélation est positive, alors le facteur explicatif caché derrière ne peut être que l’intelligence.
4. Binet et son EMI
En
France, Charcot (travaux sur les hystéries : médecin qui va fonder la
psychiatrie en France fin 19e siècle : « les mardis de Charcot à la
Salpêtrière). Travaux de Charcot : hypnose à travers l’hypnose, une
partie des symptômes est levée.
En France, on s’intéresse à la psychologie au niveau pathologique et Charcot va transmettre son laboratoire à Janet en 1980.
Ribot
est celui qui fonde la chaine de psychologie du collège de France et
qui va propulser Henri Piéron dans le monde de la psychologie et il va
proposer la psychologie expérimentale. Dumas en 1901 était en charge de
la chaine de psychologie à la Sorbonne.
EMI : échelle Métrique de l’Intelligence à inventé par Binet
Binet vient assister aux Mardis de Charcot et tente de se positionner
dans la psychiatrie. Il récupère le laboratoire de charcot de la
salpetrière. Il n’est ni médecin, niélevé dans l’esprit de la
psychologie. C’est pourquoi il veut s’inscrire dans ce monde et y
laisser son nom. Alors il invente l’EMI.
Dès le départ, Binet
s’intéresse à l’intelligence. Il ne s’inscit pas dans la psychologie
mais prend une voie expérimentale. Pour lui, il veut s’intéresser
directement à l’intelligence.
Correction du texte :
Pédagogie
individuelle à caractéristiques physique, intellectuelles et morales.
La laboratoire est dans l’école. L’assemblée générale de la société
libre rassemble : directeurs
d’école, parents, élèves et
expérimentateurs (scientifiques). Cette AGSL est construire dans une
école : tout le monde réfléchie ensemble pour améliorer l’école. Les
classes sont constituées d’élèves d’âges différents et de classes
sociales différentes, d’où l’importance de cette expérience. Les parents
ne sont pas contre cette expé, ils y participent même car il y a une
soif de savoir, de connaissances.
Le maitre est présent pour
éduquer et enseigner aux élèves. La cantine est là pour fournir un repas
chaud, et notamment aux enfants démunis, pauvres qui n’auraient peut
être pas de déjeuner s’ils rentraient chez eux. Elle tente de fournir au
moins un repas par jour aux enfants. Le maitre doit aussi repérer dans
sa classe les élèves démunis pour les emmener à la cantine. Le maitre
n’a pas assez de recul pour fournir de vraies données entre l’âge et la
taille. Et binet va se fonder sur ça pour affirmer que l’intelligence
grandit en même temps que l’âge et la taille.
III. Définition d’un test
1. Définition d’un test
1- Définition de Henry Piéron (1933) :
«
C’est une épreuve définit qui a une tâche à remplir identique pour tous
les sujets avec une technique précise d’appréciation du succès ou de
l’échec avec une notation numérique »
Tâche :
* Mise en œuvre de connaissances acquises (= test pédagogique)
* Mise en œuvre des fonctions sensori-motrices ou mental (= test psychologique)
2- Définition de Pichot (1949) :
«
Test mental = situation expérimental standardisée servant de stimulus à
un comportement. Ce comportement évalué par comparaison statistique
avec celui d’autre individu placé dans la même situation => classé le
sujet examiné quantitativement et typologiquement.
3- Définition d’Anastasi (1969) :
« Test psychologique est essentiellement une mesure objective et standardisée d’un échantillon des comportements »
> Mise en garde de R. Zazzo (1972) :
Sur la définition d’un test. Intelligence différente liées à une des
attitudes différentes => Piéron met en garde sur l’EMI de Binet. Pas
de modification de l’EMI => le NEMI qui est un réétalonnage de
l’échelle de mesure de Binet en 1949. Entre temps, le test EMI s’oriente
vers un test Q.I.
Si le test est un modèle de fonctionnement psychique, ne vaut pas grand-chose quand on en connait pas le secret de fabrication.
* Postulat de l’Essence : postulat de l’existence des dimension psychologiques que l’on mesure.
Les
tests sont basés sur l’idée de mesurer quelque chose qui existe. Par
exemple, l’existence de l’intelligence chez l’être humain, alors on peut
la mesurer. On a jamais démontré empiriquement que l’intelligence
existe => c’est un postulat, une construction conceptuelle que l’on
définit pour délimiter l’intelligence et ainsi la mesurer. On peut dire
pareil pour l’angoisse ou la dépression.
D’une part, on pari que
cela existe et surtout de façon stable, saisissable, durable chez les
individus => cela nous constitue (= essence).
C’est une
conception occidentale de la nature humaine qui n’est pas définit, qui
est très culturelle et locale. Il y a des conceptions de l’Homme où seul
existe les faits, observables, ephémère qui ne constitue pas la
personne en elle-même.
* Postulat de contingence (Chercher sur internet)
2. Etape de construction d’un test
*
Cadre de référence théorique : Savoir par rapport aux dimensions
psychologiques, la mesure de l’intelligence par exemple, n’avait pas de
cadre théorique pour la construction du test. Caractéristiques :
>
Revue de littérature : voir ce qui a déjà été écrit sur le sujet, les
publications empiriques, pratique sur le sujet à traité.
> Analyser les instruments : ayant un lien avec ce que l’ont veut mesurer
> Description de la dimension psychologique que l’on cherche à évaluer
*
Le choix du dispositif : observation, questionnaire, expérience,
manipulation. Il est lié à la première étape et aussi aux buts que l’on
cherche à atteindre et dans ces dispositifs on a la question de savoir
si le test doit être individuel ou collectif. Ainsi qu’à la notion de
durée, combien de temps que l’on consacre à cette évaluation.
Caractéristiques :
>
Combien de dimension psychologique on veut évaluer avec les
sous-catégories de dimensions ou non, combien d’item par dimension…
>
La population à laquelle on destine le test se caractérise
différemment. Caractéristique basique comme l’âge mais aussi, selon les
études, les caractéristiques de la population (étudiant, autiste,
ouvrier…)
* Mise en forme des items : un certain nombre de caractéristiques
sont requises au minimum. Les tests verbaux ont seulement des items
verbaux.
Caractéristiques :
o Les items ne doivent pas
contenir d’ambigüité, c'est-à-dire que si l’on attend une seule réponse,
ile ne doit pas u avoir de piège, une seule réponse plausible.
o Items courtes
o Une seule réponse possible, ou si plusieurs, on doit les définir.
o Pas d’erreur dans la question
o Rédaction correcte : en langage écrit et doit respecter les règles de grammaire et d’orthographe de la langue écrite.
o Doivent mesurés la dimension souhaitée et pas une autre. C'est-à-dire qu’il faut faire attention à ne pas mélanger les items.
o
Caractérisé par l’ensemble des réponses qui répond à tel item ou tel
item (item ouverts) à test exploratoire pour voir les réponses
possibles. A partir de là, on peut choisir les questions que l’on peut
poser pour obtenir les réponses attendues.
* Evaluation
et sélection des items : on choisit un premier échantillon à qui on
destine le test. Puis on applique le test et on fait subir aux réponses
les statistique habituelles pour voir comment se « balade » les
réponses, si elles correspondent aux statistiques habituelle.
Analyse statistique :
*
Toutes les réponses où les gens répondent correctement (à 100%) à
enrichissement de la partie théorique de la psychologie car
développement quasi-inexistante. On ne les met pas dans le test.
* Vérification de la variabilité des items grâce à la loi normale
* Série d’analyse item par item puis sous-catégorie par sous-catégorie.
* Typologie de l’individu => corrélation qui amène à valider ou invalider le test.
>
Amène à conserver, modifier ou supprimer des items et/ou des groupes
d’items. Processus d’ajustement des items pour obtenir un bon test pour
se faire en X fois.
* Deuxième version du test et on applique : nouveaux un échantillon que l’on espère définitif.
> Etalonnage du test à étalon : groupe de référence qui caractérise la population de référence par ce test.
Il
va nous dire ce que l’on peut comparer ou non l’individu en fonction de
cet étalonnage qui nous donne la situation de l’individu que l’on a
testé.
> Groupe de référence auquel on fait passer le test qui existe grâce aux résultats de cette population de référence.
Petit
à petit, les performances évoluent et il faut donc faire évoluer
l’étalonnage. On vérifie si la loi normale est respecté. Les tests,
l’étalonnage est basé sur cette loi normale, qu’elle suit une loi
normale, que les plupart des individus aient la moyenne.
Réétalonnage = renouvellement de la population de référence.
L’échantillon
est soit ciblé sur tel ou tel item, soit il est pris au hasard ou il
est représentationnelle de la population générale.
IV. Exemples de Tests :
1) Tests de personnalité (16P.F et MMPI)
2) Tests projectifs (Rorschach)
Comment répertorier un test ?
Schéma à suivre :
* Noms du (des) auteurs.
* Dates et historiques de la création des tests
* But(s)
* Cadre théorique de référence
* Description rapide du matériel utilisé
N.B. : les calculs (QI, population, etc.) ne sont pas requis pour ce cours.
3) Tests d’intelligences (WAIS, WISC) – Test de Wichsler
N.B. : Différentes formes :
* WISC : 6 à 16ans
* WPPSI : 3 à 6ans période préscolaire
* WAIS : adpaté jusqu’à l’âge adulte.
Le WISC a été crée en 1967, la version française à été éditée en 1972 et 1992.
* Dates : VO : 1955 ; VF : 1958
*
Cadre de référence théorique + but : Le Wichsler a été crée pour les
adultes pathologiques, placés en psychiatrie. Il s’agit d’une échelle
d’intelligence qui va être adaptée aux plus jeunes. Ce sont les
fonctions globales qui sont mesurées. Selon Wichsler, il existe 2 Q.I. :
* Un QI verbal
* Un QI de performance
Néanmoins
les 2 ne sont pas corrélés : Wichsler travaillait avec des populations
pathologiques (ex : le QI peut être fiable et la performance élevée).
Il ne conçoit pas d’évolution du QI. L’échelle a été construite telle
que les différences interindividuelles restent visibles (toujours la
même, il n’y a pas de différences importantes au niveau inter âge).
Il
adopte un modèle athéorique. Il réutilise ses propres connaissances. Il
s’agit d’une théorie de l’intelligence globale, il y a un perspective
où l’intelligence est propre à chacun et qu’elle reste fixe durablement.
Le WISC, version 4 (2006) permet plus de différenciation des performances :
* Un indice verbal
* Un raisonnement perceptif ; mémoire de travail ; analyse de la vitesse de traitements.
La vision du WISC IV est beaucoup plus multidimensionnelle (même si il comportait 2 facettes).
Suppression de certains items. Plus proche de :
* L’intelligence fluide (situation nouvelles, réaction)
* L’intelligence cristallisée (scolaires, cf. Binet)
Wechsler a crée d’abord le WAIS puis le WISC et enfin le WPPSI.
Ces
tests son régulièrement réviser(réetalonnage et modification de
certains items). Le premiers WISC a été crée en 1958, après la 2nde G.M.
aux Etats Unis. En cette période, les américains avait une perspective
de rentabilité de l’éducation pour détecter le plus tôt possible les
performances pour répartir mieux dans ce que les enfants savaient le
mieux faire.
Il a travaillé avec des adultes en HP en dehors de
toutes considérations théoriques d’intelligence. Par la création de ces
tests, Wechsler a contribué empiriquement à l’évaluation de
l’intelligence. Dans son approche, il y a une considération
unidimensionnelle athéorique de l’intelligence, pour lui, l’intelligence
est une caractéristique de la personne. C’est aussi une caractéristique
intemporelle, car pour lui, elle n’évolue pas avec le temps. Ces tests
ont donc été construit pour que l’intelligence ne varie pas.
Il veut caractériser une intelligence de façon métrique.
C’est
aussi le premier test qui va travailler sur les statistiques de ces
étalonnages et qui va faire un changement épistémologique de
l’intelligence => la norme statistique va devenir la norme
psychologique.
Plutôt que de définir qualitativement
l’intelligence moyenne, là où il y a le plus de mode sur un ensemble de
population, c’et la norme, la moyenne (en distribution normale).
Il
va marquer al psychologie puisque l’on va désormais adopter ce point de
vue statistique. CE point de vue alimente les conceptions théoriques.
N.B.
: dans la révision des tests => adaptation culturelle de ces tests.
Modifier des items mais surtout réetalonner en fonction d’un nouveau
groupe de référence.
Le WISC 4 intègre de nouvelles
considérations comme l’intelligence fluide (= ce qui nous permet de
réagir à des situations nouvelles) et l’intelligence cristallisée (=
rapport avec l’apprentissage scolaire).
4) Test de développement- Test de Brunet-Lézine.
* Auteurs : Odette BRUNET et Irène LEZINE
* Dates : 1ère version (1951), 2ème version (1997)
* But : Développement psycho-moteur de
o 1 à 30 mois (1ère version)
o 2 à 30 mois (2ème version)
*
Références théoriques : développement postural, coordination
occulo-manuelle pour la prise en main des objets, langage, sociabilité.
* Identiques pour les 2 versions mais développement important des
recherches faites pour les enfants (cf. Bruner : routines interactives)
* Ré-étalonnage des tests pour éviter les effets plafonds
* Révision test : ré-étalonnage + modification, suppression ou ajout d’items, de la population également.
N.B.
: Voir les travaux de Vigotsky (apparais sur le tare, 1997 G-Froide) ;
Wallon (B-L étaient ses élèves et ont empruntés des idées pour les
théories globales du développement de l’enfant et son environnement
social).
Le test de Brunet-Levine est un test qui évalue 4 domaines de développement => développement psychomoteur
* Le développement Postural
* La Coordination visuo-manuelle
* Le Langage
* La Sociabilité
B
et L ont fait une transposition de la notion d’intelligence aux âges
précoces du développement. Il doit y avoir au mons 2 passations de ce
test par enfant. Dans le premier manuel, Wallon dit qu’il serait bien de
faire passer le test tous les mois jusqu’à 24 mois pour vérifier que
bon développement de l’enfant.
La question est de voir 4 domaines de développement qui se développe plus ou mons directement, pas de manière systématique.
> Ecarts normaux et ecarts pouvant être inquiétant sont dans le manuel.
Ce test renvoi à une perspective développementale.
Essentiellement,
les parents sont interrogés aussi pour voir l’interaction avec l’adulte
chez l’enfant, surtout lorsque l’enfant n’a pas envie d’interagir avec
le psychologue.
La révision du test de Brunet-Lezine date de
1996, en plus de la perspective constructiviste de Piaget, de la théorie
de Wallon et du maturationnisme de Gesell, on rajoute la perspective
d’interaction social et du développement du langage de Vigotsky et
Brüner.
IV. Les qualités métrologiques d’un test
La
métrologie est la science de la mesure, c’est ce qui deviendra plus
tard la psychométrie qui s’intéresse à la mesure des aspects
psychologiques.
Un premier consensus à été signé en 1931 à Moscou
pour de mettre d’accord sur un certain nombre de qualités que les test
devront avoir pour être dit valable en psychologie.
Si la
psychométrie est une science, il doit y avoir des exigences qui soient
les mêmes que pour les autres outils de mesures. C’est pour cela que les
test psychométriques répondent à des exigences scientifiques
1) 1ère qualité : L’objectivité
> Classe , hiérarchiser les individus par rapport à leurs résultats aux tests.
Le
but est que le classement ne varie pas à chaque fois que l’on change de
personne. Il faut pour cela que le test soit standardisé, que les
conditions de passation et la cotation de l’outil de mesure soit
standardisée.
Pour être objectif (= obtenir à peu près la même
mesure), on standardise le test. Mais l’objectivité s’oppose à la
subjectivité. On entre dans une observation armée des comportements dans
laquelle on utilise un outil et on est dans une démarche opposé à
l’observation non armée (à main nue, juste en regardant).
Ici, on
cherche à s’éloigner de la subjectivité et du rôle que pourrait jouer
la sympathie/l’antipathie et l’outil, le matériel permet de supprimer la
subjectivité. Pour cela, le but est que les observateurs peuvent être
interchangeables car la médiation entre sujet interrogé et interrogateur
permet une hiérarchisation dans l’objectivité.
La standardisation permet une distance entre la subjectivité entre les individus.
Facteurs de subjectivité :
* L’erreur de mesure
*
Du côté de l’examinateur, les variables contrôlés comme le stress, le
fait de vouloir plaire. La façon dont la personne reçoit l’examen peur
faire preuve de subjectivité.
* Les aspects culturels, il y a des biais culturels à l’intérieur même des tests.
* La désirabilité sociale
*
Les tests projectifs : projeter son intérieur, donc subjectif (type
test de Rorsach). Le matériel est standardisé mais les résultats
analysés sont l’effet que l’examinateur produit sur la subjectivité de
l’enfant.
L’objectivité est un idéal difficile à atteindre, du
moment où il y a de l’humain, il y a apparition de subjectivité de façon
non contrôlé et non contrôlable. Ce sont des objectifs auxquels on
s’efforce de répondre le mieux.
Il faut également faire attention aux variations de motivation et d’émotion. La motivation peut se manifester par :
* La vulnérabilité sociale
* La représentation lié à la tâche
o Représentation de la tâche elle-même
o Représentation de ce que l’on attend d’eux
o Représentation de la difficulté de la tâche
o Représentation de la bonne réponse
L’objectivité est recherché mais rarement atteinte et pas forcément souhaitable.
2) 2e qualité : L’étalonnage (ou la graduation)
L’étalonnage
va donner du sens aux résultats individuels pour avoir une
représentation du groupe de références auquel on veut comparer le test
de l’individu. Il peut être variable mais c’est une étape importante de
la construction d’un test.
La comparaison avec le monde de la
physique prévaut en psychométrie, l’étalonnage joue le rôle de
maitre-étalon dans la mesure physique de grandeurs.
Le test doit
se baser sur un groupe étalon de référence et pour cela, on a
différentes manières de procéder pour obtenir cette banque de donnée :
*
L’échantillonnage au hasard : on part du principe que l’on aura autant
de chance de tomber sur tel ou tel chose dans une population large.
* L’échantillonnage sélectionné : on sélectionne le type de population sur laquelle on veut se baser
* La stratification ou représentation proportionnelle : on prend tel pourcentage de cette catégorie de population.
*
L’échantillonnage multiple : quand on fait des groupes différents selon
des pathologies (par ex.), si le but du test est de différencier des
groupes. On regarde comment ces groupes ont été défini.
N.B. :
on n’est pas dans une perspective, une orientation bien particulière à
cause du DSM. Certaines données théoriques sont absentes de
l’étalonnage. Les spécialistes se disent athéorique et pourtant ils sont
orientés.
Le but est d’obtenir une banque de données à laquelle
on fait passer un certain nombre de statistiques qui va servir de groupe
de référence pour situer l’individu. Certains étalonnages sont
complexes à l’intérieur de chaque sous-population.
3) 3e qualité : la sensibilité (ou finesse de discrimination).
La
sensibilité renvoie au pouvoir discriminatoire/aux orientations
interindividuelles, aux différences. Il doit discriminer assez finement
de manière à pouvoir classer un individu/ situer par rapport à un groupe
de référence. Il répond à la question du classement des individus.
On est basé sur l’idée qu’il existe des différences interindividuelles sur la question, l’idée en question.
Les
variations existent dans la mesure mais pas forcément chez l’individu.
Ce n’est pas sur la bonne sensibilité du test que cela renseigne mais
sur la dimension mesurée.
> Le test permet de mesurer telle
ou telle caractéristique de l’individu. On ne mesure juste pas la même
chose chez tout le monde.
On peut faire jouer une généralisation ou une discrimination précise d’un certain item.
Le
problème est que de faire du grosso-modo psychose/névrose. Cependant,
si il faut pointer quelle est la difficulté dans l’apprentissage
mathématique/lecture car varie selon le temps.
La finesse de
discrimination est importante d’autant plus si il faut être prudent pour
pas qu’il y ait de variation dans le temps.
Il y a beaucoup de risque d’erreur.
Le but du test est aussi important sur la sensibilité.
La
sensibilité pour le test d’intelligence = on utilise souvent une façon
d’augmenter la sensibilité du test en introduisant des
difficultés/variations interindividuelles/ des paramètres
supplémentaires. On ne mesure plus la même chose => on mesure la
rapidité de réponse ou de traitement.
Dans ce processus d’élaboration des tests, on supprime les items plus facile ou trop difficile pour éviter l’effet plafond.
4) 4e qualité : La fidélité
On
peut tomber sur des comportements d’un jour qui ne reviendront pas
forcément le lendemain. On cherche donc ici à ce que la fidélité
temporelle soit respectée car peu de test sont des tests de
développement. On veut être sur de la fidélité intra individuelle du
test.
La plupart des tests sont conçu pour être un minimum fidèle.
On
cherche à savoir que si on fait repasser un test à quelques semaines
d’intervalles, les résultats seront à peu près identique/stable, savoir
si la mesure est objective et partout la même quelque soit le temps.
Cela montre comment le temps peut distordre les outils de mesures.
La
constance de la mesure renvoie à une constance de la dimension
psychologique étudiée. Elle se mesure de différentes manières :
*
La méthode Test-Retest : faire passer 2 fois de suite le test à la même
population d’étalonnage que lorsque l’on considère que le test ne
subira pas d’effet d’apprentissage. Il permet de donner des
corrélations.
* La méthode Test en Split-Half : divisé en 2
partie, on fait passer la première moitié du test à un temps T1 et
l’autre moitié à un temps T2. On divise chaque sub-test en 2.
Il
faut que les sub-test soient homogènes. On obtient un degré
d’homogénéité des 2 notes en plus du degré de fidélité car cela dit si
les 2 moitiés du test sont très bien corrélées.
* La méthode des
2 formes différentes : Forme A et B. On construit 2 formes
différentes, on dédouble le test/les items à chaque fois. On construit
l’équivalent du test (le même mais en différent). C’est la méthode la
plus complète car il n’y a pas d’effet d’apprentissage et d’homogénéité.
N.B. : on doit avoir une des 3 méthodes pour tester la fidélité du test. Mais cela pose un certain nombre de problème.
5) 5e qualité : La validité
C’est
la qualité qui permet de dire que l’on mesure bien ce que l’on était
censé mesurer. Le test mesure bien ce que l’on attendait. Elle est plus
difficile car comment peut-on savoir que l’on mesure bien la bonne
chose. Elle peut être évalué par le degré de liaison entre le test en
question et d’autres tests ou d’autres activités supposés liés aux même
processus psychologiques.
* La validité conceptuelle : elle est
estimée sur la base de la liaison entre le test et un autre test plus
ancien dont on connait les propriétés.
o Méthode d’évaluation :
on fait passer à un groupe de sujet le test et un autre test
d’intelligence général. On calcule la corrélation entre les 2 mesures.
Si la corrélation est de l’ordre de .40-.60, on estime que le test a une
bonne validité vis-à-vis d’autres mesures intellectuelles
* La
validité prédictive : elle est estimée sur la base de la relation entre
le test et une activité de référence pour répondre à la question. La
note au test permet de prédire certaines performances future ?
o
Méthode d’évaluation : on fait passer à un groupe de sujet le test et on
recueille leur performance scolaire (ou réussite professionnelle).
Après un certain délai, quelques années plus tard (par ex.), on calcule
la corrélation entre les 2 mesures. Si la corrélation est de l’ordre de
;40-.60, on estime que le test a une bonne validité vis-à- corrélation est de l’ordre de ;40-.60, on estime que le test a une bonne validité vis-à-vis de la réussite scolaire (ou pro).
Aucun commentaire:
Enregistrer un commentaire