Over de macht en onmacht van centrale toetsen

Het Centrum voor Taal en Onderwijs (KU Leuven) werkt momenteel in opdracht van de Vlaamse minister van Onderwijs aan een screeningsinstrument taalvaardigheid voor 5-jarige kleuters. Het is de bedoeling dat op basis van een grootschalig kalibratie-onderzoek waarin 1500 kleuters worden betrokken een betrouwbare, valide en gestandaardiseerd toetsinstrument tot stand komt dat kleuterscholen vanaf najaar 2021 in gebruik kunnen nemen. Zo kunnen ze tijdens het eerste trimester kleuters identificeren wiens taalvaardigheid Nederlands te laag is en hen in de rest van het schooljaar extra taalstimulering aanbieden. Of het instrument een positief effect zal hebben op de taalvaardigheid van de kleuters, zal in de eerste plaats afhangen van het gebruik van het instrument en de opvolging van de toetsresultaten, eerder dan van het instrument zelf.

Dat geldt voor alle goed gemaakte centrale of gestandaardiseerde toetsen. Dat blijkt ook uit de 6 scenario’s die hieronder volgen: in sommige hebben centrale of gestandaardiseerde toetsen een positief effect, in andere een uitgesproken negatief effect. Geen van de scenario’s is fictief. De wetenschappelijke literatuur toont dat van elk van de scenario’s sprekende voorbeelden zijn te vinden, en dat we niet altijd ver moeten reizen om ze te vinden.

  • Scenario 1: Een basisschool maakt gebruik van een gestandaardiseerde batterij van 6 begrijpend-leestoetsen (2 voor elke graad). Dankzij deze batterij krijgt het schoolteam goede voorbeelden van hoe je begrijpend lezen kan toetsen en een beter inzicht in wat begrijpend lezen inhoudt. Omdat de resultaten tegenvielen, heeft het schoolteam zich verdiept in evidence-based aanpakken van begrijpend-leesdidactiek en heeft de directie een professionaliseringstraject voor het hele team opgezet om een effectieve leesdidactiek tot op de klasvloer te krijgen, niet alleen tijdens de taallessen, maar doorheen het curriculum. Leerlingen krijgen al naargelang hun scores gepaste uitdagingen en ondersteuning, en ook ouders worden in acties rond leesbevordering betrokken. Het team volgt de evolutie van de scores nauwgezet op om waar nodig haar onderwijs bij te sturen. De kans dat het gebruik van deze toetsbatterij een positief effect heeft op de leesvaardigheid van de leerlingen is groot.
  • Scenario 2: Een secundaire school wordt door haar overheid verplicht om alle leerlingen van het eerste jaar bij intrede in de school op taalvaardigheid te screenen. Zij maakt gebruik van een gestandaardiseerde leestoets voorzien van normen. De toetsafnames worden opgenomen door de taalbeleidscoördinator van de school. De resultaten van de screening worden op een personeelsvergadering aan alle leerkrachten van de eerste graad meegedeeld. Enkele leerlingen die echt ondermaats scoorden (categorie E) krijgen buiten de klasuren extra leestaken, maar op het reguliere onderwijs heeft de toets geen impact. De kans dat het gebruik van deze screening een zeer gering effect (noch positief, noch negatief) heeft op de taalvaardigheid van de leerlingen is groot.
  • Scenario 3: Alle secundaire scholen van een bepaald land worden door hun overheid verplicht om aan het einde van het secundair onderwijs van de leerlingen een centrale, gestandaardiseerde eindtoets voor taal en wiskunde af te nemen. De toets wordt digitaal afgenomen en de resultaten hebben een impact op de kansen van de leerlingen om bepaalde vormen van hoger onderwijs te mogen volgen. Tijdens het laatste jaar van het secundair onderwijs worden leerlingen daarom intensief voorbereid op het afleggen van de eindtoets. De kans dat het gebruik van deze eindtoets voor veel leerlingen een positief effect heeft op de verwerving van de getoetste onderdelen is groot; tegelijk is de kans echter reëel dat onderdelen die in de toets niet of nauwelijks aan bod komen, uit het curriculum van het laatste jaar verdwijnen of stiefmoederlijk worden behandeld. De kans dat het gebruik van deze toets een negatief effect op de niet-getoetste onderdelen is eveneens groot.
  • Scenario 4: Een basisschool gebruikt verplicht een centrale, gestandaardiseerde toets en is ook verplicht om te rapporteren hoe het reageert op tegenvallende resultaten. Deze basisschool reageert op de resultaten door de leerlingen in niveaugroepen onder te verdelen. Haar redenering is dat op die manier elke groep onderwijs op haar eigen maat kan krijgen. De kans dat het gebruik van de toets tot gemengde resultaten op de vaardigheid van de leerlingen leidt, is groot. Sommige leerlingen zullen baat hebben bij de aangepaste uitdagingen en begeleiding-op-maat die ze krijgen, maar wellicht niet allemaal (onder andere omdat ook zogenaamd homogene niveaugroepen nog heterogeen zijn en heterogener over de tijd worden). Bovendien bestaat de kans dat de leerlingen in de “zwak presterende” groepen een laag zelfbeeld en laag zelfvertrouwen ontwikkelen, en dat de inhouden en taken die zij krijgen oververeenvoudigd worden. Hen wordt ook de kans ontnomen om van sterker presterende leerlingen te leren. De kans dat de prestatiekloof tussen de groepen uitdiept, is dus reëel.
  • Scenario 5: Alle basisscholen worden door de overheid verplicht om de taalvaardigheid van hun leerlingen nauwgezet op te volgen via centrale, gestandaardiseerde toetsen en de toetsresultaten op te laden in een centrale gegevensbank. De resultaten worden door de pers gebruikt om een ranking van scholen op te stellen en te publiceren. Het gevolg is dat sommige scholen met relatief zwakke gemiddelde scores een slechte reputatie krijgen, moeilijker bekwame leerkrachten kunnen aantrekken en hun bekwame leerkrachten zien vertrekken, en/of aan krampachtige teaching to the test gaan doen. Andere scholen gedijen goed in het systeem en voelen zich gesterkt in hun aanpak. Nog andere scholen gebruiken de resultaten om hun taaldidactiek op punt te zetten en hun leraren bij te scholen en in de klas te coachen in een poging de resultaten nog verder op te krikken. De kans dat het gebruik van de toetsen een zeer gemengd effect (positief in sommige scholen, negatief in andere) zal hebben, is groot. De kans dat de prestatiekloof tussen scholen uitdiept, is groot. De kans dat de prestatiekloof tussen leerlingen met een verschillende sociale achtergrond uitdiept, neemt toe naarmate het scholenpark gesegregeerd is.

Wie als schoolteam “a” zegt (aanschaffen van een gestandaardiseerde toets), moet vooral “b” zeggen (bewustwording van het team en beleid ontwikkelen rond kwaliteitsvol interpreteren en opvolgen van evaluatiegegevens). Ik ben tijdens mijn loopbaan betrokken geweest bij de ontwikkeling van tal van gestandaardiseerde taaltoetsen: TAL, TAL-K, en KOBI-TV voor het kleuteronderwijs, SALTO (voor het eerste leerjaar), VLOT (een leerlingvolgsysteem taalvaardigheid voor het lager onderwijs), TASAN (voor het OKAN-onderwijs), TAS en TIST (voor de eerste graad secundair onderwijs), en een aantal toetsen voor het NT2-volwassenenonderwijs waaronder de officiële examens van het Certificaat Nederlands als vreemde taal. Ik heb de vraag “ben je voor of tegen gestandaardiseerde toetsen?” altijd een vreemde vraag gevonden. Ik zie de potentiële voordelen en ben erg beducht voor de negatieve uitwassen van een oneigenlijk gebruik van toetsen. Een toets an sich maakt niet het verschil, het is het gebruik in een bepaalde context dat de kracht (“the power, zou Shohamy zeggen) van de toets uitmaakt. En in dat opzicht is een toets als dynamiet: je kan hem maar beter voor goede doeleinden gebruiken, en dat heel oordeelkundig en doordacht doen.