Dibattito/La valutazione dei sistemi scolastici


La valutazione su vasta scala dei sistemi scolastici
Sito Bottani – febbraio 2019
Non ho mai scritto qualcosa sulla valutazione delle scuole in generale, e più in particolare degli alunni, degli insegnanti,  dei dirigenti o degli amministratori scolastici, dei sistemi scolastici. Mi sono piuttosto concentrato sulle valutazioni comparate dei sistemi scolastici e sulle valutazioni su larga scala, cioè sulle valutazioni dei sistemi scolastici che contemplano il coinvolgimento di molti alunni e di molte scuole e non ho scritto molte cose. Ho scoperto che in Italia si è discusso  di valutazione censuaria e di valutazione campionaria. In Italia si è optato per la valutazione censuaria che però mi pare non sia quella che si intende di solito. Si considera  censuaria una valutazione più o meno campionaria.
Non sono uno specialista delle valutazioni ed è questa la ragione per la quale ho capito che dovevo abbandonare il campo degli indicatori scolastici  quando per l'appunto la valutazione delle scuole è diventata una questione cruciale nello sviluppo dell'insieme di  indicatori scolastici internazionali comparati.  Devo anche ammettere che la comparazione proclamata mi è sembrata assai bizzarra. Si tentava di comparare oggetti che a prima vista sembravano tra loro incomparabili  ma che invece non lo erano, tuttavia la metodologia per compararli era alquanto zoppicante e gli sforzi per migliorare la comparazione sono stati fin qui  poco rilevanti.

Non ero all'altezza di questa sfida. I responsabili politici volevano sapere, giustamente,  cosa si apprendeva nelle scuole, cosa contava insomma che si facesse nel servizio scolastico e gli strumenti a disposizione erano carenti e in gran parte mancanti. Non mi dilungo sullo stato della statistica scolastica attorno al 1990, sia a livello internazionale sia nei singoli stati. In ogni modo le discussioni sui tipi di valutazione scolastica da promuovere e sui dati raccolti  dalle valutazioni scolastiche  hanno suscitato un grande interesse nei media e nei politici e anche tra gli insegnanti che si sono divisi in due gruppi: i favorevoli e i contrari alla valutazione. Per disinnestare la bomba una delle soluzioni ventilate fu l'autovalutazione che ebbe un momento di gloria e forse lo avrà ancora  da parte di persone che capiscono poco di valutazione comparata . Questo è successo anche con le famiglie con figli a scuola. In taluni casi si è dovuto concedere un diritto di obiezione. Si è adottata una clausola di obiezione di coscienza che permettesse di non partecipare alle valutazioni.
Ho seguito e pilotato in parte per cinque o sei anni, tra il 1990 e il 1995,  le discussioni dietro le quinte sui tipi di valutazione internazionale comparata dei sistemi scolastici e ho frequentato  le "alte sfere" che facevano il bello e il brutto tempo nelle sedi nelle quali si realizzavano le valutazioni scolastiche su larga scala ( intendo qui alludere soprattutto all'IEA). Tutto ciò mi ha permesso di apprendere qualcosa sulla valutazione comparata dei sistemi scolastici e di capire cosa significassero i test  scolastici. Alcune di queste considerazioni le enumero ora una ventina di anni dopo quel periodo d'ascolto, perché mi accorgo che sono ancora al centro del dibattito in corso pro o contro la valutazione scolastica soprattutto nel contesto italico dove l'INVALSI , cioè l'Istituto nazionale di valutazione del sistema d'istruzione  ( questo è il senso dell'acronimo)  Ã¨ regolarmente attaccato fino al punto di rischiarne la soppressione mentre nel lontano 1997 , all'epoca dal Ministro dell'istruzione Luigi Berlinguer a Roma e con il sostegno unanime del parere di una commissione di periti internazionali scelti dall'OCSE e di cui ero membro, si è tentato di creare un servizio nazionale di valutazione della scuola, appunto l'INVALSI.

In primo luogo devo dire che sono sempre stato sorpreso dalla grossolanità delle comparazioni internazionali effettuate con le valutazioni scolastiche. La pratica di comparare è assai ardua, ma la comparazione come è effettuata tuttora mi pare proprio poco attendibile. Negli anni in cui ero al timone del progetto di costruzione di un insieme di indicatori scolastici si era convenuto che la comparazione tra sistemi scolastici diversi si potesse effettuare solo con indagini campionarie. Ci si forzava di costruire campioni di scuole e di studenti simili, rappresentativi di tutto un sistema scolastico. Questa operazione la si sa fare. C'erano allora alcuni ( pochi) specialisti di questa questione e ci si accorse quasi subito che non era affatto semplice costruire campioni scolastici identici comparabili tra loro: molte autorità scolastiche e molte autorità politiche baravano sui dati statistici cioè fornivano informazioni errate sulle proporzioni di alunni dei vari ordini di scuola e sul numero delle scuole coinvolti nei campioni. I campioni non erano quindi tra loro comparabili, né erano rappresentativi dell'insieme della popolazione scolastica, ma si pubblicarono nonostante tutto risultati medi e classifiche ottenute con questi campioni. Si sono corrette le deformazioni più vistose ma non so se i campioni odierni , costruiti sulla base delle statistiche fornite dai servizi nazionali, ossia dai governi che gestiscono i sistemi scolastici pubblici e che più o meno controllano quelli privati. Ora come ora la discussione sui campioni più o meno rappresentativi è finita e si ammette che  il metodo per costruire questi campioni rappresentativi, tra loro comparabili,  sia a punto. Lo spero. Ma dubito che sia così. Si dovrebbe conoscere qualcosa di più sulla qualità delle statistiche nazionali usate per costruire l'insieme di indicatori internazionali tra loro comparabili. Nel contesto attuale i dati statistici vengono forniti dai servizi nazionali di statistica e non sempre questi dati sono attendibili. Non so se si usano senza modifiche , così come sono trasmessi.

La seconda sorpresa concerne l'oggettività delle valutazioni scolastiche. Va detto una volta per tutte che le valutazioni scolastiche non sono oggettive, ossia neutre,  ma che nella loro parzialità sono nondimeno valide, adottano uno stesso punto di vista e sono rigorose. Ed è proprio qui che il dente duole. L'accettazione delle valutazioni implica l'accettazione di un punto di riferimento comune,  ossia di un meta-sistema scolastico le cui caratteristiche sono rispettate da tutti, sono un punto di riferimento comune. La scelta dei parametri da considerare per costruire test, questionari e campioni di indagine è sempre soggettiva, effettuata in funzione di una concezione dell'istruzione pubblica condivisa e l'incrocio tra risultati dei test e informazioni soggettive provenienti dai questionari è sempre più o meno aleatorio, nel senso che fornisce informazioni a domande o a ipotesi  prescelte. Le conclusioni sono ipotetiche nel senso che dipendono dalle ipotesi adottate in partenza


In terzo luogo si deve riconoscere la grande qualità di molti test costruiti per valutare l'efficacia dei sistemi scolastici. Qui si possono citare alcuni esempi. Quando nel 2001 si sono resi pubblici i risultati del test imperniato sulla comprensione di testi ( il test di lettura) la sorpresa di moltissimi insegnanti  fu enorme. Si scoprì in primo luogo che non c'erano solo testi letterari e che nella vita quotidiana i testi da capire non erano quelli letterari:  le lettere delle banche o delle assicurazioni, le lettere dei servizi pubblici , oppure le tabelle degli orari dei trasporti pubblici, gli articoli di fondo della stampa sportiva erano un "materiale" che si doveva leggere e capire, perché di uso quotidiano. In secondo luogo si scoprì che i sistemi scolastici nei quali la comprensione dei testi scritti oppure la rapidità della lettura era migliore erano pure quelli che prevedevano esercitazioni di lettura ogni anno, ossia si scoprì che la lettura va esercitata e che non basta apprendere una volta per tutte a decifrare i testi, ossia a leggerli più o meno bene. La stessa cosa capito` con le matematiche e con la cultura scientifica. Ci si accorse che il sapere scolastico cambiava di natura se si prendeva in considerazione  l'uso pratico, quello quotidiano. I quindicenni , indipendentemente dalle loro scelte professionali,  alla fine della scuola dell'obbligo, più o meno , dovevano dimostrare la padronanza di determinate conoscenze, cioè di essere in possesso di un certo bagaglio di nozioni  di base( Il "bagaglio minimo di conoscenze" : questo era il gergo in voga attorno al 1995). Fu d'uopo arrendersi all'evidenza ossia constatare che un certo numero di sistemi scolastici non preparavano affatto i discenti all'esistenza quotidiana e che le ingiustizie , le differenze di abilità , di comprensione, di bravura tra discenti che avevano effettuato lo stesso percorso scolastico erano enormi. Che fare? In  certi sistemi scolastici, per esempio in quello finlandese, i quindicenni erano migliori di altri. Sembrò a molti responsabili politici, a molti insegnanti e a svariati periti che che quei sistemi scolastici andavano copiati. Non fu quanto  successo tranne qualche eccezione, ma i programmi scolastici cambiarono alquanto. Si introdussero per esempio ore o momenti di lettura, si introdussero concetti matematici ignorati  o nozioni di scienze trascurati nei programmi di la scuola media ( uso qui una terminologia italiana), si obbligarono gli insegnanti di lingua materna a fare leggere. Non tutto è filato liscio;  però questa fu  la strada che si intraprese scoprendo quanto i test proponevano. Un ultimo caso è quello delle conoscenze finanziarie. Su basi facoltative ( la scelta di partecipare ai test era lasciata libera ai singoli sistemi scolastici)  si propose un test finalizzato a raccogliere informazioni sul livello di conoscenze dei quindicenni di cultura economica-finanziaria in uso quotidianamente nelle società evolute e si scoprì che molte nozioni non erano affatto apprese, che i programmi scolastici le ignoravano, che le diversità tra discenti della stessa età erano colossali. Stessa cosa per la cultura matematica e quella scientifica ( in inglese la terminologia in voga é "literacy" al posto di cultura). In altri termini i test per quindicenni hanno aperto gli occhi dei responsabili scolastici su quanto si insegnava e su come si insegnava nelle scuole. I programmi scolastici non erano più all'altezza dei tempi e delle aspettative dei responsabili politici che finanziavano i sistemi scolastici. Andavano perciò modificati. Ma come fare in modo che ovunque passasse l'identico messaggio?  Un bel grattacapo.

In quarto luogo mi ha sempre impressionato la potenza degli algoritmi utilizzati per spiegare i risultati dei test. Forse anche perché li dovevo capire per pubblicarli. Ho incontrato gruppetti di specialisti molto abili a elaborare nuovi algoritmi e a spiegarne l'utilità e molti responsabili scolastici poco qualificati che facevano finta di capirli. Le informazioni messe a punto dagli uni non erano capite dagli altri. Il metodo di lavoro era diventato una scatola chiusa proprio nell'ambito di una operazione che si prefiggeva invece il contrario , ossia di eliminare le scatole chiuse. Faccio un esempio semplice e rilevante: il calcolo della varianza "within schools" e "between schools" . Questo calcolo non è affatto semplice  anche se sfocia su informazioni cruciali per le politiche scolastiche. Forse proprio perché le spiegazioni erano lacunari oppure difficili da fornire che tale misura è stata fin qui poco utilizzata. Cosa si intende con queste due misure? Nelle analisi comparate dei sistemi scolastici è utile sapere se le differenze tra scuole sono forti e se tra scuole di una regione e di un'altra regione  di una stessa economia queste differenze si attenuano o si accentuano. Nei sistemi scolastici scandinavi le differenze tra scuole che sono presso il polo Nord e quelle che sono al Sud, presso il mare Baltico sono poco rilevanti. Orbene tra Nord e Sud ci sono più di mille km di distanza.  Questa è un'indicazione dell'applicazione di una politica scolastica attenta a offrire identiche opportunità d'istruzione su tutto il territorio. Le differenze esistenti all'interno di una scuola invece dipendono dalle differenze tra i discenti. Queste sono normali. Gli esseri umani sono diversi. Stessa cosa per le opportunità educative, un elemento che è stato trascurato nelle indagini internazionali recenti sugli apprendimenti scolastici. Si pubblicano dati come se le opportunità d'istruzione siano identiche. Orbene non lo sono e queste diversità incidono sui punteggi conseguiti nei test scolastici.

Concludo dicendo che c'è ancora moltissima strada da percorrere per migliorare le valutazioni scolastiche ma che non se ne può più fare a meno. C'è da sperare che tra qualche decennio ( questo è il tempo che ci vorrà) le politiche scolastiche ricorreranno alle valutazioni per essere più efficaci , più giuste, più efficienti. Non si raggiungeranno questi obiettivi eliminando le valutazioni scolastiche. Le modalità odierne per effettuarle sono criticate da una parte del corpo insegnante ma non solo, però si possono modificare, come si possono sperimentare modalità di esecuzione delle valutazioni più pertinenti, più robuste, meno invasive. La ricerca e lo sviluppo di forme valutative alternative è essenziale. Le modalità per attuarle sono un elemento non trascurabile.
 
 
 
Salva Segnala Stampa Esci Home