Skolevalg - Blandingsmodellen

  • 24. February 2022 (modified 26. March 2022)

For noen år tilbake etablerte Oslo kommune et utvalg for å vurdere modeller for inntak til videregående skoler. En modell er i denne sammenhengen en mekanisme som fordeler elever på skoler. Slike modeller tar ofte hensyn til elevenes karaktersnitt og ønsker, men kan også bruke andre faktorer (eksempelvis reisevei).

Bekymringen til politikerne er i hovedsak segregeringen som karakterbasert opptak fører til. I Oslo har det skjedd en opphopning av elever med høyt snitt på enkelte skoler, samtidig som elever med lavt snitt samles på andre skoler. Figuren nedenfor viser skolenes gjennomsnittskarakterer. Jeg tilpasset en enkel romlig modell og la på konturlinjer i et forsøk på å illustrere det geografiske aspektet.

Uansett hvilken politisk mening man har om saken, så finnes det gode og dårlige måter å implementere en gitt politikk på i en modell. Det har blitt forsket mye på skolemodeller, og konsepter som stabilitet, effektivitet og strategisikkerhet er relevante begrep fra litteraturen. Jeg synes at modeller for skolevalg er interessante, og publiserte en artikkelserie for to år siden:

Jeg skrev også en artikkel kalt “Mangelfull evaluering av inntaksmodeller”, som ble publisert i Bedre Skole” nr 3/2020. Her argumenterte jeg for at modellene som ble evaluert var dårlige, og at de ikke baserte seg på forskningslitteraturen. Gjerne les artikkelen om du vil vite mer.

Etter å ha publisert artikkelen glemte jeg saken i to år.

To år senere - en ny modell

Den 15. februar 2022 publiserte Aftenposten artikkelen “Gode karakterer kan få mindre å si for valg av videregående skole i Oslo”, der det kommer frem at en ny modell vurderes. Utdanningsnytt omtalte også saken i artikkelen “Byrådet vurderer ny inntaksmodell som blander elever med ulikt karaktersnitt”.

Begge disse artiklene refererer til et notat der “blandingsmodellen” blir introdusert. Denne modellen er verken nevnt i inntaksutvalgets rapport (154-siders PDF) eller simulert i OsloMets rapport (168-siders PDF). Det er med andre ord en helt ny modell.

Jeg er positiv til å vurdere nye modeller. En denne modellen inspirert av forskningslitteraturen?

Nok en hjemmelaget modell

Blandingsmodellen som introduseres i notatet er uten en eneste referanse til litteraturen, og evalueres ikke opp mot kjente og relevante egenskaper som f.eks. effektivitet. Modellen er simulert, men simuleringer på den tidligere søkermassen er av liten verdi om modellen har uønskede egenskaper eller vil endre måten elevene prioriterer sine ønsker på.

Alle har muligheter - men hva betyr det?

Modellen blir introdusert som dette:

Halvparten av søkerne blir tatt opp på bakgrunn av grunnskolepoeng som i dag. Den andre halvparten tas inn fra ulike karakterintervaller. Det gjør at alle, uansett hvilket karakternivå de har, har en mulighet til å komme inn på den skolen de ønsker. I dag er den muligheten kun forbeholdt de med de beste karakterene.

Å si at en modell gir alle en mulighet høres flott ut. Det insinuerer at før hadde bare noen muligheter, men nå får alle muligheter. Men noen vil alltid være bakerst i køen. Mulighetsrommet kan ikke utvides for alle, uten at det går ut over noen. Uansett allokerer en modell skoleplasser, ikke muligheter, og hver elev kommer enten inn på skolen de ønsker, eller ikke. Hva en “mulighet” betyr i kontekst av en skolemodell er ikke veldefinert. Det ville vært mer ærlig å si at “vi ønsker å gi flere elever med lavt snitt skoleplasser på populære skoler, på bekostning av de andre elevenes ønsker”.

For å sette det på spissen, her er en modell som gir alle elever en mulighet: trekk lodd og gi én heldig vinner sitt førsteønske, send deretter alle andre til en skole de ikke ønsker å gå på. Her har “alle, uansett hvilket karakternivå de har, en mulighet”. Modellen er fremdeles eksepsjonelt dårlig.

Jeg hadde foretrukket om den modelltekniske beskrivelsen mer presist forklarte hvordan algoritmen faktisk fungerer, og kun forholdt seg til veldefinerte begreper.

Gode insentiver?

Videre i notatet står det at:

Blandingsmodellen er gjenkjennelig. Den bevarer incentivene for å få gode karakterer på ungdomsskolen, og gjør det mulig å konkurrere seg inn på de beste skolene for de med best karakterer. På den måten er dette en justering av karakterbasert opptak, der majoriteten tas inn på samme måte som i dag. I tillegg vil inntak fra ulike karakterintervaller sikre en mulighet for søkere med lavere karakterer en mulighet til å kunne komme inn på alle skoler.

Før jeg kommenterer insentiver, bruker jeg et avsnitt på å drøfte hva det vil si å publisere en modell/algoritme. Blandingsmodellen er ikke beskrevet i pseudokode, eller i faktisk kode. Alt jeg har å basere meg på for å forstå modellen er noen avsnitt med overordnet forklaring, og alle som har forsøkt å implementere ikke-trivielle algoritmer vet at dette ikke er godt nok. En algoritme som potensielt skal fordele skoleplasser til tusenvis av elever fortjener å bli offentliggjort på en forståelig måte.

Basert på den overordnede beskrivelsen, antar jeg at man først fordeler elever basert på grunnskolepoeng. Deretter tolker jeg at man fyller opp skolenes kvoter (basert på karakterintervaller i søkermasser) én etter én fra høyeste intervall til laveste, og tar elevene sortert synkende etter karaktersnitt i hvert karakterintervall.

Hvis man ikke er i topp \(50 \%\) i grunnskolepoeng, vil man komme inn på en skole via en kvoteplass på et karakterintervall. La oss anta at intervallene går fra \([1, 2)\), \([2, 3)\), \([3, 4)\), etc. La \(\epsilon\) være et lite tall, f.eks. \(0.01\). Det er mer gunstig å ha karaktersnitt lik \(2 - \epsilon\), slik at man er på toppen i intervallet \([1, 2)\), heller enn å ligge midt i intervallet \([4, 5)\).

Om man er elev og ikke i topp \(50\%\), har man to muligheter:

  • Hvis man vet hva intervallene for kvotene er, gjelder det å legge seg på toppen av et vilkårlig intervall heller enn å jobbe for best mulig karakter. Å ha et snitt på \(2 - \epsilon\) er mye mer gunstig enn \(4 + \epsilon\). Det intervallet det er enkleste å legge seg på toppen av er selvsagt det laveste intervallet.
  • Hvis man ikke vet hva intervallene for kvotene er, er mekanismen en loddtrekning. Det er ingen insentiv for å jobbe i det hele tatt, men mindre man er sikker på at man er i topp \(50 \%\) og unngår hele kvoteringen.

Til og med om man er i topp \(50\%\), så er det fremdeles bedre å være i toppen av en kvote. Eksempelvis vil en elev med snitt på \(2 - \epsilon\) være først i køen på \([1, 2)\) intervallet (som alle skoler har kvoteplass på), mens en elev i \(90 \%\) persentilen har \(10\%\) av søkermassen foran seg i køen.

De elevene som modellen insentiverer til å jobbe, er de som er i toppen av den halvdelen med høyeste karaktersnitt. Dette er elevene som kanskje kjenner mest på karakterpress fra før av.

Effektivitet og segregerings-effektivitet

Definisjon (Pareto-effektivitet). En modell er effektiv dersom det ikke finnes en gruppe elever som kan bytte skoleplasser seg i mellom, slik at alle elevene i gruppa blir mer fornøyde, og ingen andre blir mindre fornøyde.

Med andre ord: hvis det kan forekomme at Ola blir plassert på skole \(A\), og Kari til skole \(B\), men Ola foretrekker skole \(B\) fremfor \(A\) og Kari foretrekker skole \(A\) fremfor \(B\), så er modellen ikke effektiv.

Det er enkelt å se at blandingsmodellen ikke er effektiv etter denne definisjonen. Nedenfor er et eksempel med \(4\) elever i \(2\) karakterintervaller, som skal inn på \(2\) skoler. Pilene angir hver elevs førsteønske. Elev \(a\) får sitt førsteønske, elev \(b\) får sitt andreønske fordi det ikke er plass i kvoten på skole \(B\). Resultatet av fordelingen er at elev \(b\) og \(d\) kan bytte skoleplasser seg i mellom, og begge vil være mer fornøyde.

Er tap av effektivitet greit hvis det reduserer segregeringen? I eksempelet ovenfor blir skolene mer segregerte på karakter dersom alle elevene får ønskene sine. Noen vil mene at elevene \(b\) og \(d\) må tåle å ofre sine ønsker for å redusere segregeringen, selv når å realisere sine egne ønsker ikke går ut over andres ønsker. Dette er en politisk beslutning.

Men hva om elevers ønsker ofres til ingen nytte, og segregeringen ikke reduseres? La oss utvide definisjonen av effektivitet til å ta hensyn til segregering.

Definisjon (Segregerings-effektivitet). La oss definere en modell som forsøker å redusere segregering som segregerings-effektiv dersom det ikke finnes en gruppe elever som kan bytte skoleplasser seg i mellom, slik at (1) alle elevene i gruppa blir mer fornøyde, (2) ingen andre elever blir mindre fornøyde og (3) segregeringen ikke øker som resultat av byttene.

Man kan argumentere for og mot effektivitet i en modell som skal redusere segregering. Men det er vanskelig å se for seg et argument mot segregerings-effektivitet som en ønsket egenskap. Hvis modellen ikke er segregerings-effektiv, kan den forkaste elevenes ønsker uten noen reduksjon i segregeringen. Elevene ønsker selv å bytte plass, byttene går ikke ut over andre, og byttene øker ikke segregeringen.

Segregering har så vidt jeg vet ikke blitt definert presist matematisk av politikerne, men jeg tenker at variasjonen til gjennomsnittskarakterene på skolene er et naturlig mål på segregering. Det er dette blandingsmodellen implisitt prøver å redusere med sine kvoter. Jeg vil tro at man kan bevise det samme uansett hvilket mål for segregering man velger, så det er egentlig ikke så viktig—men vi trenger å tallfeste segregering for å undersøke modellen.

Blandingsmodellen er ikke segregerings-effektiv

Her er et eksempel som viser at modellen ikke er segregerings-effektiv. Jeg legger til grunn at jeg har forstått modellen riktig, og som nevnt er det vanskelig uten en presis forklaring av modellen. Husk at for å bevise at en egenskap ikke er innfridd, trenger vi kun å produsere ett eksempel der egenskapen ikke er innfridd. Om leseren opplever eksempelet nedenfor som konstruert er det riktig—det er laget spesifikt for å vise at modellen ikke er segregerings-effektiv.

Anta at alle elevene som blir fordelt basert på grunnskolepoeng uten kvoteringer allerede er fordelt. Det er \(8\) gjenstående elever, fordelt på \(4\) karakterintervaller og \(2\) skoler. Pilene viser førsteønsket til elevene. Elevene fordeles til skolene etter modellen, og fordelingen er vist i figuren. Først får \(a\) sitt første ønske, så får \(b\) sitt andre ønske fordi skole \(B\) har fylt opp kvoten for elevene i det høyeste karakterintervallet. Så fordeles \(c\), og så videre. Her står \(\epsilon\) for et lite tall. Du kan gjerne tenke at \(\epsilon \approx 0.01\).

Elevene får følgende ønsker innvilget av modellen:

\begin{equation*} (a, b, c, d, e, f, g, h) = (1, 2, 1, 2, 1, 2, 1, 2) \end{equation*}

Halvparten av elevene får førsteønsket sitt, mens den resterende halvparten får andreønsket. Elevene \(\{b, d, f, h\}\) kunne ha byttet plasser seg i mellom slik at alle får førsteønsket innvilget.

Modellens fordeling gir følgende gjennomsnittskarakter på skolene:

\begin{align*} A&: \, \text{avg}(h, e, c, b) = \text{avg}(2 +  \epsilon, 4 - \epsilon, 4 + 2\epsilon, 5 + \epsilon) = 15/4 \\ B&: \, \text{avg}(g, f, d, a) = \text{avg}(3 - \epsilon, 4 -2 \epsilon, 4 + \epsilon, 6 - \epsilon) = 17/4 \end{align*}

Det er litt forskjell mellom skolene, altså noe segregering.

Men det er ingen konflikter eller konkurranse her, for alle elevene kan komme inn på sitt førsteønske. Den eneste konflikten som oppstår er på grunn av kvoteringen i seg selv. Hva om vi gir alle elevene førsteønsket? Da får alle elevene gå på den skolen de ønsker, og det blir null segregering!

\begin{align*} A&: \, \text{avg}(f, e, d, c) = \text{avg}(4 -  2 \epsilon, 4 - \epsilon, 4 + \epsilon, 4 + 2 \epsilon) = 16/4 \\ B&: \, \text{avg}(h, g, b, a) = \text{avg}(2 + \epsilon, 3 - \epsilon, 5 + \epsilon, 6 - \epsilon) = 16/4 \end{align*}

Blandingsmodellen ofrer elevenes prioriteter for å vedlikeholde et kvoteringssystem som ikke nødvendigvis reduserer segregering.

Oppsummering

En ny modell kalt “blandingsmodellen” har blitt introdusert i et notat fra byrådet. Ingen analyser av modellens matematiske egenskaper ser ut til å ha blitt gjennomført. Det er ikke en eneste referanse til faglitteratur. Det blir sagt at modellen gir alle elevene en mulighet til å komme inn på den skolen de ønsker. Dette høres bra ut, men endrer ikke det faktum at noen alltid vil være bakerst i køen dersom enkelte skoler er populære.

Det skrives deretter at modellen bevarer insentivene til å få gode karakterer på ungdomsskolen, men jeg kan ikke forstå hvordan det kan stemme. Modellen belønner elever som er på toppen av et karakterintervall, om det er intervallet \([1,2)\) eller \([4,5)\) er likegyldig. Det er ikke noe som insentiverer til gode karakterer for de fleste elever.

Beskrivelsen av modellen er ikke god nok til at jeg forstår detaljene. Verken kode, pesudokode eller referanser er publisert. På grunn av dette må jeg gjette hvordan detaljene i modellen fungerer, og det er mulig at jeg har misforstått modellen. Hvis modellen fungerer slik jeg tolker den, er den verken effektiv eller segregerings-effektiv. Det betyr at modellen kan forkaste elevenes egne ønsker, ikke bare når det reduserer segregering, men også når det øker segregeringen.

Problematikken med både insentiver og effektivitet oppstår på grunn av kvoter. Modellen “vektet loddtrekning” som jeg presenterte i Bedre Skole unngår disse problemene. Den er strategisikker, effektiv og har gode insentiver.

Men heller ikke vektet loddtrekning optimerer for lav segregering direkte. Den endrer rekkefølgen elevene prioriteres i, i et håp om at det vil redusere segregering. Vil man redusere segregering mest mulig og samtidig innfri flest mulig av elevenes ønsker, er optimeringsmodeller et alternativ. Også dette skrev jeg om for to år siden.