La valutazione su vasta scala dei sistemi scolastici
Sito Bottani –
febbraio 2019
Non ho mai scritto qualcosa sulla valutazione delle scuole
in generale, e più in particolare degli alunni, degli insegnanti, dei
dirigenti o degli amministratori scolastici, dei sistemi scolastici. Mi sono
piuttosto concentrato sulle valutazioni comparate dei sistemi scolastici e
sulle valutazioni su larga scala, cioè sulle valutazioni dei sistemi scolastici
che contemplano il coinvolgimento di molti alunni e di molte scuole e non ho
scritto molte cose. Ho scoperto che in Italia si è discusso di
valutazione censuaria e di valutazione campionaria. In Italia si è optato per
la valutazione censuaria che però mi pare non sia quella che si intende di
solito. Si considera censuaria una valutazione più o meno campionaria.
Non sono uno specialista delle valutazioni ed è questa la ragione per la quale
ho capito che dovevo abbandonare il campo degli indicatori scolastici
quando per l'appunto la valutazione delle scuole è diventata una
questione cruciale nello sviluppo dell'insieme di indicatori scolastici
internazionali comparati. Devo anche ammettere che la comparazione
proclamata mi è sembrata assai bizzarra. Si tentava di comparare oggetti che a
prima vista sembravano tra loro incomparabili ma che invece non lo erano,
tuttavia la metodologia per compararli era alquanto zoppicante e gli sforzi per
migliorare la comparazione sono stati fin qui poco rilevanti.
Non ero all'altezza di questa sfida. I responsabili politici volevano sapere,
giustamente, cosa si apprendeva nelle scuole, cosa contava insomma che si
facesse nel servizio scolastico e gli strumenti a disposizione erano carenti e
in gran parte mancanti. Non mi dilungo sullo stato della statistica scolastica
attorno al 1990, sia a livello internazionale sia nei singoli stati. In ogni
modo le discussioni sui tipi di valutazione scolastica da promuovere e sui dati
raccolti dalle valutazioni scolastiche hanno suscitato un grande
interesse nei media e nei politici e anche tra gli insegnanti che si sono
divisi in due gruppi: i favorevoli e i contrari alla valutazione. Per
disinnestare la bomba una delle soluzioni ventilate fu l'autovalutazione che
ebbe un momento di gloria e forse lo avrà ancora da parte di persone che
capiscono poco di valutazione comparata . Questo è successo anche con le
famiglie con figli a scuola. In taluni casi si è dovuto concedere un diritto di
obiezione. Si è adottata una clausola di obiezione di coscienza che permettesse
di non partecipare alle valutazioni.
Ho seguito e pilotato in parte per cinque o sei anni, tra il 1990 e il 1995,
le discussioni dietro le quinte sui tipi di valutazione internazionale
comparata dei sistemi scolastici e ho frequentato le "alte
sfere" che facevano il bello e il brutto tempo nelle sedi nelle quali si
realizzavano le valutazioni scolastiche su larga scala ( intendo qui alludere
soprattutto all'IEA). Tutto ciò mi ha permesso di apprendere qualcosa sulla
valutazione comparata dei sistemi scolastici e di capire cosa significassero i
test scolastici. Alcune di queste considerazioni le enumero ora una
ventina di anni dopo quel periodo d'ascolto, perché mi accorgo che sono ancora
al centro del dibattito in corso pro o contro la valutazione scolastica soprattutto
nel contesto italico dove l'INVALSI , cioè l'Istituto nazionale di valutazione
del sistema d'istruzione ( questo è il senso dell'acronimo) è
regolarmente attaccato fino al punto di rischiarne la soppressione mentre nel
lontano 1997 , all'epoca dal Ministro dell'istruzione Luigi Berlinguer a Roma e
con il sostegno unanime del parere di una commissione di periti internazionali
scelti dall'OCSE e di cui ero membro, si è tentato di creare un servizio
nazionale di valutazione della scuola, appunto l'INVALSI.
In primo luogo devo dire che sono sempre stato sorpreso dalla grossolanitÃ
delle comparazioni internazionali effettuate con le valutazioni scolastiche. La
pratica di comparare è assai ardua, ma la comparazione come è effettuata
tuttora mi pare proprio poco attendibile. Negli anni in cui ero al timone del
progetto di costruzione di un insieme di indicatori scolastici si era convenuto
che la comparazione tra sistemi scolastici diversi si potesse effettuare solo
con indagini campionarie. Ci si forzava di costruire campioni di scuole e di
studenti simili, rappresentativi di tutto un sistema scolastico. Questa
operazione la si sa fare. C'erano allora alcuni ( pochi) specialisti di questa
questione e ci si accorse quasi subito che non era affatto semplice costruire
campioni scolastici identici comparabili tra loro: molte autorità scolastiche e
molte autorità politiche baravano sui dati statistici cioè fornivano
informazioni errate sulle proporzioni di alunni dei vari ordini di scuola e sul
numero delle scuole coinvolti nei campioni. I campioni non erano quindi tra
loro comparabili, né erano rappresentativi dell'insieme della popolazione
scolastica, ma si pubblicarono nonostante tutto risultati medi e classifiche
ottenute con questi campioni. Si sono corrette le deformazioni più vistose ma
non so se i campioni odierni , costruiti sulla base delle statistiche fornite
dai servizi nazionali, ossia dai governi che gestiscono i sistemi scolastici
pubblici e che più o meno controllano quelli privati. Ora come ora la discussione
sui campioni più o meno rappresentativi è finita e si ammette che il
metodo per costruire questi campioni rappresentativi, tra loro comparabili,
sia a punto. Lo spero. Ma dubito che sia così. Si dovrebbe conoscere
qualcosa di più sulla qualità delle statistiche nazionali usate per costruire
l'insieme di indicatori internazionali tra loro comparabili. Nel contesto
attuale i dati statistici vengono forniti dai servizi nazionali di statistica e
non sempre questi dati sono attendibili. Non so se si usano senza modifiche ,
così come sono trasmessi.
La seconda sorpresa concerne l'oggettività delle valutazioni scolastiche. Va
detto una volta per tutte che le valutazioni scolastiche non sono oggettive,
ossia neutre, ma che nella loro parzialità sono nondimeno valide,
adottano uno stesso punto di vista e sono rigorose. Ed è proprio qui che il
dente duole. L'accettazione delle valutazioni implica l'accettazione di un
punto di riferimento comune, ossia di un meta-sistema scolastico le cui
caratteristiche sono rispettate da tutti, sono un punto di riferimento comune.
La scelta dei parametri da considerare per costruire test, questionari e
campioni di indagine è sempre soggettiva, effettuata in funzione di una
concezione dell'istruzione pubblica condivisa e l'incrocio tra risultati dei
test e informazioni soggettive provenienti dai questionari è sempre più o meno
aleatorio, nel senso che fornisce informazioni a domande o a ipotesi
prescelte. Le conclusioni sono ipotetiche nel senso che dipendono dalle
ipotesi adottate in partenza
In terzo luogo si deve riconoscere la grande qualità di molti test costruiti
per valutare l'efficacia dei sistemi scolastici. Qui si possono citare alcuni
esempi. Quando nel 2001 si sono resi pubblici i risultati del test imperniato
sulla comprensione di testi ( il test di lettura) la sorpresa di moltissimi
insegnanti fu enorme. Si scoprì in primo luogo che non c'erano solo testi
letterari e che nella vita quotidiana i testi da capire non erano quelli
letterari: le lettere delle banche o delle assicurazioni, le lettere dei
servizi pubblici , oppure le tabelle degli orari dei trasporti pubblici, gli
articoli di fondo della stampa sportiva erano un "materiale" che si
doveva leggere e capire, perché di uso quotidiano. In secondo luogo si scoprì
che i sistemi scolastici nei quali la comprensione dei testi scritti oppure la
rapidità della lettura era migliore erano pure quelli che prevedevano
esercitazioni di lettura ogni anno, ossia si scoprì che la lettura va
esercitata e che non basta apprendere una volta per tutte a decifrare i testi,
ossia a leggerli più o meno bene. La stessa cosa capito` con le matematiche e
con la cultura scientifica. Ci si accorse che il sapere scolastico cambiava di
natura se si prendeva in considerazione l'uso pratico, quello quotidiano.
I quindicenni , indipendentemente dalle loro scelte professionali, alla
fine della scuola dell'obbligo, più o meno , dovevano dimostrare la padronanza
di determinate conoscenze, cioè di essere in possesso di un certo bagaglio di nozioni
di base( Il "bagaglio minimo di conoscenze" : questo era il
gergo in voga attorno al 1995). Fu d'uopo arrendersi all'evidenza ossia
constatare che un certo numero di sistemi scolastici non preparavano affatto i
discenti all'esistenza quotidiana e che le ingiustizie , le differenze di
abilità , di comprensione, di bravura tra discenti che avevano effettuato lo
stesso percorso scolastico erano enormi. Che fare? In certi sistemi
scolastici, per esempio in quello finlandese, i quindicenni erano migliori di
altri. Sembrò a molti responsabili politici, a molti insegnanti e a svariati
periti che che quei sistemi scolastici andavano copiati. Non fu quanto
successo tranne qualche eccezione, ma i programmi scolastici cambiarono
alquanto. Si introdussero per esempio ore o momenti di lettura, si introdussero
concetti matematici ignorati o nozioni di scienze trascurati nei
programmi di la scuola media ( uso qui una terminologia italiana), si
obbligarono gli insegnanti di lingua materna a fare leggere. Non tutto è filato
liscio; però questa fu la strada che si intraprese scoprendo quanto
i test proponevano. Un ultimo caso è quello delle conoscenze finanziarie. Su
basi facoltative ( la scelta di partecipare ai test era lasciata libera ai
singoli sistemi scolastici) si propose un test finalizzato a raccogliere
informazioni sul livello di conoscenze dei quindicenni di cultura
economica-finanziaria in uso quotidianamente nelle società evolute e si scoprì
che molte nozioni non erano affatto apprese, che i programmi scolastici le
ignoravano, che le diversità tra discenti della stessa età erano colossali.
Stessa cosa per la cultura matematica e quella scientifica ( in inglese la
terminologia in voga é "literacy" al posto di cultura). In altri
termini i test per quindicenni hanno aperto gli occhi dei responsabili
scolastici su quanto si insegnava e su come si insegnava nelle scuole. I
programmi scolastici non erano più all'altezza dei tempi e delle aspettative
dei responsabili politici che finanziavano i sistemi scolastici. Andavano
perciò modificati. Ma come fare in modo che ovunque passasse l'identico
messaggio? Un bel grattacapo.
In quarto luogo mi ha sempre impressionato la potenza degli algoritmi
utilizzati per spiegare i risultati dei test. Forse anche perché li dovevo
capire per pubblicarli. Ho incontrato gruppetti di specialisti molto abili a
elaborare nuovi algoritmi e a spiegarne l'utilità e molti responsabili
scolastici poco qualificati che facevano finta di capirli. Le informazioni
messe a punto dagli uni non erano capite dagli altri. Il metodo di lavoro era
diventato una scatola chiusa proprio nell'ambito di una operazione che si
prefiggeva invece il contrario , ossia di eliminare le scatole chiuse. Faccio
un esempio semplice e rilevante: il calcolo della varianza "within
schools" e "between schools" . Questo calcolo non è affatto
semplice anche se sfocia su informazioni cruciali per le politiche
scolastiche. Forse proprio perché le spiegazioni erano lacunari oppure
difficili da fornire che tale misura è stata fin qui poco utilizzata. Cosa si
intende con queste due misure? Nelle analisi comparate dei sistemi scolastici è
utile sapere se le differenze tra scuole sono forti e se tra scuole di una
regione e di un'altra regione di una stessa economia queste differenze si
attenuano o si accentuano. Nei sistemi scolastici scandinavi le differenze tra
scuole che sono presso il polo Nord e quelle che sono al Sud, presso il mare
Baltico sono poco rilevanti. Orbene tra Nord e Sud ci sono più di mille km di
distanza. Questa è un'indicazione dell'applicazione di una politica
scolastica attenta a offrire identiche opportunità d'istruzione su tutto il
territorio. Le differenze esistenti all'interno di una scuola invece dipendono
dalle differenze tra i discenti. Queste sono normali. Gli esseri umani sono
diversi. Stessa cosa per le opportunità educative, un elemento che è stato
trascurato nelle indagini internazionali recenti sugli apprendimenti
scolastici. Si pubblicano dati come se le opportunità d'istruzione siano identiche.
Orbene non lo sono e queste diversità incidono sui punteggi conseguiti nei test
scolastici.
Concludo dicendo che c'è ancora moltissima strada da percorrere per migliorare
le valutazioni scolastiche ma che non se ne può più fare a meno. C'è da sperare
che tra qualche decennio ( questo è il tempo che ci vorrà ) le politiche
scolastiche ricorreranno alle valutazioni per essere più efficaci , più giuste,
più efficienti. Non si raggiungeranno questi obiettivi eliminando le
valutazioni scolastiche. Le modalità odierne per effettuarle sono criticate da
una parte del corpo insegnante ma non solo, però si possono modificare, come si
possono sperimentare modalità di esecuzione delle valutazioni più pertinenti,
più robuste, meno invasive. La ricerca e lo sviluppo di forme valutative
alternative è essenziale. Le modalità per attuarle sono un elemento non
trascurabile.