Psicometria

Psicometria
Settore della psicologia che ha lo scopo di tradurre in termini numerici e quantitativi gli aspetti dell'attività psichica e gli aspetti normali e patologici della personalità, al fine di rendere oggettivi e descrittivi i fenomeni osservati. Tale ambito si è sviluppato inizialmente all'interno della psicologia differenziale, rispetto alla quale la p. si è venuta a configurare come l'insieme delle tecniche di rilevazione, elaborazione e interpretazione dei dati psicofisiologici, psicoattitudinali e, in seguito, caratteriologici. Gli strumenti utilizzati in tal senso sono i test, misurazioni obiettive e standardizzate di un campione di comportamento. I primi test mentali, utilizzati dagli psicologi alla fine dell'Ottocento, erano principalmente valutazioni condotte in laboratorio nell'ambito di esperimenti sulle reazioni psicofisiologiche e sulla valutazione di memoria, attenzione e altre aree ristrette del comportamento intelligente. Tali studi, nati dall'esigenza di fornire alla neonata psicologia la dignità di scienza esatta, miravano alla costruzione di modelli teorici e leggi scientifiche.
In generale, un test, per essere utilizzabile, deve possedere le seguenti caratteristiche:
1) Validità. È la capacità di un test di misurare esattamente ciò che si propone, quindi la sua selettività fra ciò che deve essere misurato e ciò che non interessa. All'interno di questo criterio, si distinguono la validità di contenuto, relativa alle funzioni o ai meccanismi mentali da prendere in considerazione quando si costruisce un test; la validità concettuale o esattezza, con cui un test aderisce al modello ipotetico della funzione presa in esame; la validità di congruenza, che risulta dal confronto dei risultati forniti dal test con quelli ottenuti con strumenti analoghi; la validità predittiva, che risulta dal confronto dei risultati del test con gli indici di successo (ad esempio, di una terapia) ottenuti in un periodo successivo all'applicazione del test.
2) Attendibilità. È data dall'accuratezza con cui il test misura e dalla costanza delle sue misurazioni, che devono fornire risultati identici, se somministrato ripetutamente allo stesso individuo nelle stesse condizioni. La prima caratteristica è assicurata dall'omogeneità degli item e dalla loro capacità discriminativa. La seconda caratteristica, detta anche stabilità, è verificabile con il metodo del test-retest (applicazione ripetuta a distanza di tempo dello stesso test allo stesso gruppo di soggetti), delle forme parallele (l'approntare due protocolli della stessa natura e dello stesso grado di difficoltà al fine di ottenere, attraverso la loro correlazione l'indice di equivalenza) e dello split-half (comparazione dei risultati di una metà del reattivo con quelli dell'altra metà).
3) Sensibilità. È la capacità del test di discriminare fra individuo e individuo e fra i diversi livelli evolutivi e di apprendimento dello stesso individuo. Per ottenere tali caratteristiche, è necessario che la gamma delle valutazioni all'interno della quale distribuire la popolazione sia piuttosto ampia e che gli item siano costruiti in modo da abbracciare l'intero tratto evolutivo dell'attitudine che si vuole valutare. L'applicazione clinica dello strumento deve permettere di identificare correttamente la variabile da misurare nei soggetti che realmente la presentano, quindi con bassa probabilità di falsi negativi (valore predittivo positivo), e di non identificarla nei soggetti che realmente non la presentano, quindi con bassa probabilità di falsi positivi (valore predittivo negativo).
4) Praticità ed economia. Pur essendo caratteristiche di minor valore teorico, decidono, di fatto, l'adozione di un reattivo rispetto a un altro. Si riferiscono alla comodità di impiego, alla semplicità di correzione, al tempo di applicazione e di spoglio dei risultati.
I primi psicologi a utilizzare in funzione di applicazioni pratiche i test furono Binet e Simon, in Francia, con intenti educativi e clinici, e Wechsler, negli Stati Uniti, che validò i suoi test di intelligenza sulla popolazione militare americana. I test di livello si riferiscono a un concetto di intelligenza che ha subito variazioni nel tempo; la prima Scala Metrica di Intelligenza di Binet e Simon, commissionata dal Ministero dell'Istruzione francese per studiare il problema del recupero dei bambini con ritardo mentale, si fonda su una teoria pluralista dell'intelligenza, che risulterebbe essere una capacità di adattamento al mondo attraverso l'utilizzo di strumenti quali la comprensione (di vocaboli, ma anche di situazioni di vita), l'invenzione (analisi dei dati e ricerca della soluzione), la direzione (capacità di procedere, senza deviazioni, verso la soluzione dei problemi) e la critica (capacità di verificare il processo di soluzione dei problemi). La scala costruita da Binet e Simon si componeva di una serie di problemi da risolvere, attinenti alla vita quotidiana. Un concetto già presente in Binet, ripreso successivamente da Terman, è quello di abilità mentale, qualità mentale innata che aumenta con l'età, distinta da ingegno, qualità costante che determina il tasso di sviluppo della capacità mentale di un individuo e il grado di abilità mentale che raggiungerà. Tale distinzione, al fine della costruzione dei test, si rivela metodologicamente fondamentale, in quanto l'abilità mentale (in seguito detta età mentale) viene misurata dal punteggio che l'individuo riceve nelle prove, mentre una misura dell'ingegno (valutato, in seguito, come Quoziente Intellettivo) viene ottenuta confrontando il punteggio di un soggetto alle prove del test con quello degli altri della stessa età. La scala di Binet-Simon ebbe un'enorme diffusione, anche perché ne fu esteso l'uso anche agli adulti. Tale estensione venne, tuttavia, criticata da Wechsler, principalmente sulla base del fatto che l'intelligenza di un adulto non si può valutare in termini di età mentale. Wechsler, inoltre, si basò sulle teorie multifattoriali dell'intelligenza per la costruzione di tutte le sue scale, articolate, infatti, in prove verbali e prove di performance. I subtest verbali valutano la cultura generale, l'orientamento in situazioni di vita quotidiana, la memoria a breve termine, il ragionamento aritmetico, le analogie tra due oggetti e il vocabolario posseduto. Le prove pratiche consistono nell'associazione di simboli grafici a numeri, nel riordinare vignette che costituiscono una breve storia, nella prova di completamento di figure disegnate senza un particolare, in una prova di riproduzione di disegni con cubi colorati e nella ricostruzione di figure di cartoncino. I risultati delle scale Wechsler, oltre a dare un'indicazione sul livello globale di efficienza mentale (QI totale), offrono indicazioni più articolate, per quanto da utilizzarsi con cautela, quali, ad esempio, il calcolo del livello di deterioramento mentale, dato dal rapporto fra i subtest che non variano con l'età, rispetto a quelli sensibili al deterioramento nel tempo. Le stesse teorie che hanno originato le scale individuali di intelligenza sono anche alla base dei test collettivi di livello. Le differenze fra strumenti somministrati a singoli e a gruppi sono soprattutto in funzione della maggior autonomia che la somministrazione collettiva presuppone. I test collettivi presentano, in genere, le seguenti caratteristiche: le risposte sono sempre a scelta multipla; i test sono autosomministrabili; all'interno della prova i quesiti sono disposti secondo un ordine a spirale, cioè viene presentato successivamente un quesito per ogni tipo di contenuto o di problema, per poi ricominciare da capo quando la tipologia è esaurita. I più diffusi test di livello reperibili in Italia sono il test Mosaico di Gille, utilizzato a livello di scuola elementare, il test di Otis e il test Eta Beta. Ampia diffusione hanno anche i test carta e matita, quali il test della figura umana della Goodenough o il test della Fay, nei quali viene richiesto di disegnare, appunto, una figura umana. Tali test si basano sul principio che, nell'esecuzione del disegno, siano implicati processi di analisi e astrazione, abilità visuo-spaziali e di coordinamento. La misura di aspetti cognitivi specifici, importanti per la diagnosi e il trattamento di danni strutturali cerebrali, è il compito dei test neuropsicologici. Alla diagnosi neuropsicologica concorre una molteplicità di elementi: esami strumentali, scale di valutazione, autodescrizioni del paziente e valutazione delle caratteristiche emotive, nel caso di diagnosi differenziale fra patologie neurologiche e psichiatriche (ad esempio, tra demenza organica e pseudodemenza depressiva). La specificità dei disturbi mentali organici e i problemi che insorgono nell'esame di pazienti gravemente danneggiati sono tali da esigere una grande varietà di tecniche, molte delle quali sono finalizzate a evidenziare patologie specifiche e comportano difficoltà notevoli per la validazione e la standardizzazione. L'esame neuropsicologico abitualmente include un test di abilità generale, quale, ad esempio, una delle scale di Wechsler, per evidenziare eventuali deficit in aree cognitive importanti e per procurarsi un termine di confronto per le valutazioni riferite ad aree più specifiche (attenzione, memoria) che possono essere state selettivamente danneggiate. La valutazione della memoria è una delle componenti fondamentali dell'esame clinico e sino ad alcuni anni or sono era considerata essenziale, in ambito clinico, la distinzione tra la memoria recente (la più suscettibile ai danni) e la memoria remota. Attualmente, si preferisce fare riferimento a un quadro più articolato, dove viene data importanza non solo alla quantità di tempo interposta fra l'evento e il richiamo dello stesso, ma anche alla qualità degli eventi intercorsi nel frattempo, al contenuto (figurativo, verbale etc.) e al contesto dell'evento e all'interferenza di fattori quali l'intelligenza generale, l'attenzione, la motivazione e lo status socioculturale. Gli studi neurobiologici sulla memoria hanno introdotto anche altre distinzioni, ad esempio tra memoria di fatti (abilità nel memorizzare liste di parole, numeri, visi etc.) e memoria di procedimenti (ad esempio, abilità percettivo-motorie). Le sindromi amnesiche sono numerose e varie e interessano un'ampia gamma di patologie. La prova di Memoria di Cifre della Scala di Intelligenza Wechsler per adulti è largamente utilizzata, da sola o unitamente ad altre prove; tuttavia, dello stesso autore esiste una Wechsler Memory Scale, una delle poche batterie di prove mnesiche pubblicate in Italia. Essa comprende sette subtest: informazioni personali e generali; orientamento spazio-temporale; controllo mentale (ad esempio, conto alla rovescia); memoria semantica (numero di unità ideative di un testo riprodotte correttamente); memoria immediata di cifre; riproduzione di figure geometriche; memoria di coppie di parole. Altra batteria è il Profilo di rendimento mnesico di Rey (o test di Rey), che consiste nella presentazione di forme e nel loro riconoscimento immediato, differito nel tempo, nel riconoscimento delle stesse forme disegnate in modo schematico, dapprima nell'ordine originario, poi mescolate, e nell'evocazione libera degli oggetti presentati nella prima tavola-stimolo. Esistono alcuni test per valutare la memoria remota di eventi (Questionario di memoria di eventi passati, MLT 77) basati sulla presentazione e sul riconoscimento di fatti notori avvenuti fra gli anni Venti e gli anni Sessanta-Settanta. La memoria recente può inoltre essere esaminata con riferimento a contenuti di diverso tipo, in modo da distinguere le situazioni in cui c'è una perdita generalizzata rispetto a quelle in cui il danno è prevalentemente connesso con un'area specifica. In particolar modo, vengono confrontate le prestazioni in rapporto a contenuti visuo-spaziali e semantico-verbali, in funzione di ipotesi sulla specializzazione emisferica. Le prove basate su contenuti verbali, generalmente, sono test di apprendimento o di ripetizione di liste di parole (test di ripetizione seriale di parole bisillabiche, apprendimento di liste di parole, apprendimento supra-span verbale, breve racconto). Una prova di memoria seriale di posizioni spaziali è il test di Corsi, nel quale lo stimolo è costituito da una tavoletta sulla superficie della quale sono disposti cubetti che vengono toccati secondo una sequenza standard, richiedendo poi al soggetto di toccarli nella stessa sequenza. Attenzione e concentrazione sono state oggetto di studio fin dagli esordi della psicologia sperimentale e clinica. Nell'infanzia e nell'adolescenza i disturbi dell'attenzione assumono caratteristiche proprie e possono essere parte di una sindrome caratterizzata anche da iperattività. È quindi opportuno accertare con precisione quali sono i comportamenti del bambino che non sta attento, esaminandone il livello di maturazione e il livello cognitivo generale, nonché la qualità dei rapporti con gli educatori e i genitori. Nella valutazione dell'attenzione, in generale, si considerano, a volte distintamente, i due estremi di un continuum dell'ampiezza di attenzione: da una parte i problemi di chi ha un'attenzione così focalizzata da trascurare molti elementi di informazione; dall'altra, i problemi di chi non riesce a concentrare l'attenzione sui dettagli. I tipici test sull'attenzione si basano sulla cancellatura di lettere o di segni. Uno dei più diffusi è sicuramente il test dei deux barrages di R. Zazzo, che consta di due prove: nella prima viene presentato un foglio con 40 righe di segni. Tra questi segni ce n'è uno, specificato all'inizio, che il soggetto deve sbarrare. Il testista annota il tempo impiegato dal soggetto per ogni gruppo di 4 righe. Nella seconda prova, il soggetto ha 10 minuti di tempo per individuare e sbarrare 2 segni diversi. Il testista annota per ogni minuto quanto lavoro è stato svolto. Un altro test ampiamente diffuso è il test di Stroop o Color and Word Test. È una prova semplice da somministrare e rapida, articolata in tre subtest: leggere una lista di nomi di colori, dire il nome del colore che presentano alcune macchie di colore, dire il nome del colore in cui sono stampate alcune denominazioni di colore (ad esempio, se c'è la parola verde scritta in giallo, bisogna dire giallo). Il test si basa su un effetto descritto da Stroop oltre cinquant'anni fa: dire il nome di una macchia di colore richiede più tempo che leggere una denominazione di colore e dire il nome del colore è molto difficile se il colore in questione viene usato per scrivere il nome di un altro colore. Questo test serve principalmente a valutare la capacità di attenzione in riferimento alla capacità di sopprimere risposte non volute. Questa componente dell'attenzione è ritenuta importante nella verifica dell'integrità dei lobi frontali. I disturbi del linguaggio possono investire prevalentemente la componente fonetica (ad esempio, compromettendo la distinzione tra i suoni, come nelle intossicazioni da barbiturici), quella lessicale (ad esempio, l'amnesia verbale) o quella sintattica, oppure caratterizzarsi macroscopicamente con perdita della capacità di comprendere o produrre messaggi. Con il termine generale di afasia si designano i disturbi acquisiti del linguaggio conseguenti al danno di determinate strutture degli emisferi cerebrali. Le sindromi afasiche possono comportare anche disturbi della funzione simbolica, della percezione e dell'abilità spaziale. Vi saranno, dunque, test che valutano: a) l'insieme delle abilità linguistiche (ad esempio, Illinois Test of Psycholinguistic Abilities) la comprensione semantico-verbale (ad esempio, test dei gettoni); b) la dislessia e l'acalculia (ad esempio, test per l'acalculia, Batteria per lo studio dei disturbi del sistema dei numeri e del calcolo); c) l'afasia (ad esempio, Aachener Aphasie Test, Prove per il corretto rilievo delle turbe fasico-gnosico-prassiche); d) la fluidità nella produzione verbale (ad esempio, test di generazione di frasi). In presenza di un danno cerebrale, sovente si notano danni alla motricità grossa e fine. Non di rado, deficit di questo tipo sono associati a una riduzione delle performance inerenti alla percezione e all'abilità visuo-spaziale. In ambito psicometrico, esistono test che valutano selettivamente i deficit relativi al coordinamento tra movimento appreso e percezione: ad esempio, quando il soggetto diventa incapace o lento nel vestirsi, oppure incapace di servirsi appropriatamente del linguaggio gestuale. Questo tipo di deficit può essere inquadrato nelle aprassie, termine con cui vengono indicati i disturbi dei movimenti finalizzati. I test evidenziano questo tipo di danno per lo più mediante compiti di esecuzione di gesti, di disegni o costruzione. I test di copiatura o di costruzione di una figura, con riferimento a un modello, sono però anche sensibili a difficoltà nella percezione visuo-spaziale complessa e a stati di agnosia visiva, cioè a condizioni soggettive in cui lo stimolo viene percepito (in assenza di deficit sensoriali), ma non ne viene riconosciuto il significato. I test più noti in tale ambito sono il Bender Visual Motor Gestal Test e il Benton Visual Retention Test. Sono test di copiatura di figure geometriche, nei quali si ipotizza che i fattori di prossimità, di continuità, di organizzazione interna e di strutturazione dello stimolo inducano reazioni rivelative del funzionamento cognitivo del soggetto. Esistono, infine, batterie flessibili di test, il cui utilizzo varia a seconda della sintomatologia del paziente. Una delle più recenti, la Luria-Nebraska Neuropsychological Battery, è stata costruita adattando, e in parte standardizzando, un ampio insieme di prove cliniche del sovietico Luria. È composta da 269 item raggruppati in 11 scale: motricità, ritmo, tattile, visuo-spaziale, linguaggio recettivo, linguaggio espressivo, scrittura, lettura, aritmetica, memoria e processi intellettivi. Utilizzando gli item di queste scale si assegnano altri tre punteggi: patognomonico (raccoglie gli item di varie scale ritenuti particolarmente indicativi di patologia neurologica), emisfero destro ed emisfero sinistro (si basano su elementi delle scale di motricità e tattile che consentono di valutare differenzialmente le prestazioni del lato destro e sinistro del corpo). La misurazione delle caratteristiche non cognitive di personalità è affidata a diversi strumenti nati, in ambito psichiatrico e psicologico-clinico, con lo scopo di valutare e confrontare in termini quantitativi i sintomi del paziente. Successivamente, il grande numero di variabili di personalità stimolò l'utilizzo di test più articolati e complessi, miranti alla valutazione di profili sia normali sia patologici. È possibile suddividere, schematicamente, gli strumenti attualmente in uso in scale psichiatriche, questionari autodescrittivi e test proiettivi. Alcune scale psichiatriche sono estremamente generiche (ad esempio: Psychiatric Rating Scale, Brief Psychiatric Rating Scale); tuttavia, la maggior parte di esse mira all'indagine di singole caratteristiche cliniche. Molte scale si limitano alla valutazione comportamentale, agli stati emotivi soggettivi o all'esame di quadri clinici definiti: alcuni autori, interessati a sindromi specifiche, hanno elaborato strumenti per valutarne la fenomenologia (ad esempio, PANS e SANS, scale per la valutazione dei sintomi positivi e negativi della schizofrenia; SCI, per la valutazione dei disturbi psicosomatici). L'indagine su stati emotivi soggettivi, quali l'ansia e la depressione, ha costituito invece lo spunto per la costruzione di rating scales che, pur derivando da ambiti teorici diversi, risultano poi, nelle aree indagate, analoghe (ad esempio, per la Depression Scale di Hamilton, di Zung, di Beck). L'ansia ha costituito un oggetto di particolare attenzione e sono stati elaborati strumenti correlati alla distinzione teorica fra ansia come stato (una situazione transitoria) e come tratto (ansia come caratteristica stabile della personalità), quali le scale Stai Y1 e Stai Y2 di Spielberger. I questionari descrittivi di personalità o inventari hanno avuto origine, storicamente, dall'intervista psichiatrica strutturata. Uno dei primi strumenti destinati ad applicazioni pratiche su larga scala fu il Personal Data Sheet di Woodworth (1919), che si proponeva di dare una misura della tendenza psiconevrotica in vista della selezione compiuta dall'esercito statunitense per costituire il corpo d'armata che partecipò alla Prima Guerra Mondiale. Il test di personalità attualmente più diffuso e studiato in campo internazionale è il Minnesota Multiphasic Personality Inventory (MMPI) (Hathaway e McKinley 1967), un questionario autodescrittivo composto, nella forma ridotta, da 357 item che consentono una rilevazione della sintomatologia psichiatrica. L'MMPI ha il vantaggio di un'ampia validazione in campo psicosomatico, anche nel senso del rilievo di aspetti personologici che possono essere influenzati dall'esperienza di malattia. Gli item vengono raggruppati in 13 scale, ciascuna con un proprio range di normalità, al di sopra o al di sotto del quale si può ritenere il tratto corrispondente come lievemente o gravemente patologico. Le prime tre scale sono di validazione e controllo del test (esiste, ad esempio, un lie factor, fattore bugia, che può invalidare l'intero protocollo); le rimanenti scale valutano gli aspetti ipocondriaci, la depressione, i sintomi conversivi, la presenza/assenza di disturbi psicopatologici in generale, l'adattamento al proprio ruolo sessuale, la paranoia, la sintomatologia dissociativa, la maniacalità e l'introversione sociale. Esiste una recente revisione del test (MMPI II, pubblicato in Italia nel 1992) in base a criteri diagnostici aggiornati, con riferimento alla nosografia del DSM III-R. L'espressione test proiettivi fa riferimento alla dinamica di produzione delle risposte a tali test: come reazione a uno stimolo più o meno strutturato che viene presentato, il soggetto proietta, esprime elementi profondi della propria personalità. Di fatto, l'ipotesi proiettiva non è certo l'unica interpretazione psicodinamica possibile: le risposte a un test proiettivo possono essere effetto anche di un qualsiasi altro meccanismo di difesa. In tal senso, risulta più corretto affermare che il termine proiettivo, in riferimento a test e a tecniche di indagine, designa un processo mediante il quale, nell'ambito di un compito di immaginazione, le caratteristiche oggettive degli stimoli vengono distorte o arricchite perché il soggetto attribuisce agli stimoli stessi i contenuti soggettivi della propria esperienza, delle proprie caratteristiche personali e le sue dinamiche. I test e le tecniche proiettive si caratterizzano, rispetto ad altri strumenti, in quanto contengono stimoli non strutturati, quali disegni o macchie; propongono ai soggetti compiti interpretativi e richieste di ristrutturazione o strutturazione del materiale presentato; non hanno risposte giuste o sbagliate, ma risposte aperte, codificate in modo molto particolareggiato dai manuali di interpretazione; l'interpretazione delle risposte è un compito complesso, anche per l'ampiezza delle variabili misurate. I due test maggiormente rappresentativi di tale categoria sono il Thematic Apperception Test (TAT) e il test di Rorschach. La tecnica usata nel TAT consiste nel sottoporre al soggetto alcune tavole (20) che, per lo più, rappresentano persone raffigurate realisticamente in situazioni diverse. Si dice ai soggetti che è una prova di immaginazione e si chiede loro di raccontare una storia per ciascuna delle illustrazioni. L'interpretazione di tali storie mira a individuare alcune categorie importanti: l'eroe, ossia il personaggio centrale attorno al quale ruotano gli eventi; i bisogni dell'eroe, di cui si valuta l'intensità su una scala da 1 a 5 punti; le pressioni ambientali sull'eroe; i conflitti significativi e i risultati delle azioni e interazioni dell'eroe con l'ambiente. Esistono, per tale test, diversi metodi di interpretazione, facenti capo ad ambiti teorici diversi. Gli stimoli utilizzati dallo psichiatra svizzero Hermann Rorschach erano forme accidentali ottenute facendo cadere poche gocce di inchiostro, nero o colorato, su un foglio di carta e ripiegandolo in modo da ottenere una figura approssimativamente simmetrica. La somministrazione consiste sostanzialmente nel presentare tali macchie, attualmente un set standardizzato di 10, chiedendo al soggetto in esame di riferire cosa vede. Esaurite le 10 tavole si passa all'inchiesta, con lo scopo di accertare quali sono le caratteristiche dello stimolo che hanno indotto il soggetto a dare le risposte fornite. Tali risposte vengono integralmente trascritte su un foglio per essere poi siglate (codificate). Le categorie proposte per la codifica delle risposte sono: i fattori determinanti la risposta (forma, colore, movimento); i modi di comprensione, ossia la localizzazione del contenuto (in un dettaglio della macchia, o nell'insieme); i contenuti della risposta (animali, umani, oggetti etc.). Le caratteristiche della personalità prese in esame sono ampie: dalla valutazione qualitativa dell'intelligenza, alla misura della forza dell'Io, all'esame dei rapporti interpersonali, delle caratteristiche dell'affettività, dei tratti psicopatologici, alla predittività dell'esito delle psicoterapie.