Flervalsfrågor

I digital testning är flervalsfrågor en vanlig form, tack vare dess enkelhet. Det är enkelt att skapa programvara, det är enkelt att skapa test och dom har hängt med länge så dom är lättförståeliga och enkla att använda för de testande. Endast i undantagsfall är denna form ett hinder för genomförandet av testet.

En stor anledning till flervalsfrågornas popularitet och breda användande är på grund av stora nationella kunskapstest, som högskoleprovet i Sverige och SAT i USA. De har en lång historik bakom sig inleddes under den predigitala tiden då all testning, administration och rättning sköttes på papper. Då var flervalsfrågornas enkelhet en förutsättning för att kunna använda dem i stor skala. De var det enda rimliga alternativet för testning av stora grupper.

Flervalsfrågor är inte alltid det bästa sättet att testa kunskap på. Just enkelheten är inte bara en fördel utan också deras största nackdel. Som testkreatör vill man ofta mäta strukturell djupkunskap. Flervalsfrågor tenderar fungerar dock bäst för testning av ytlig detaljkunskap och tenderar att glida åt det hållet om man inte är uppmärksam vid skapandet av frågorna.

Innan man väljer testmetod ska man alltid ställa sig frågan: Vilken metod passar bäst för det jag vill mäta? När vi utformar digitala test har vi andra alternativ som kan passa bättre.

När man efterfrågar exakta svar är fri inmatning att föredra framför flervalsfrågor. Ett typiskt exempel är rättstavning. Det är visserligen möjligt att testa rättstavning med flervalsfrågor, men fri inmatning passar bättre eftersom användare kan göra alla möjliga sorters misstag som du inte har kunnat föreställa dig.

Ett annat område där fri inmatning är att föredra är programmering. Naturligtvis måste man använda fri inmatning då man efterfrågar kod. Men även då man testar kodförståelse är det en fördel att ställa frågan: Vilket output ger följande kod? med fri inmatning i stället för att hinta om svaret med färdiga svarsalternativ.

Vid test med numeriska svar, oftast som resultat av uträkningar är fri inmatning också att föredra. Dock är det viktigt att tänka på att svar med flera decimaler behöver klart definieras för användaren hur många decimaler hen ska tillfoga till svaret.

När man testar kreativitet bör man också nyttja fri inmatning som ett alternativ.

Flervalsfrågor fungerar således bäst när det finns ett entydigt rätt svar på frågan och då förståelsen av begreppet är viktigare än utformningen av termen. Ett exempel:

Vad har Schweiz för styrelseskick?

  1. Monarki
  2. Federation
  3. Diktatur
  4. Kommunism

Rätt svar är federation. Men även förbundsstat och förbundsrepublik skulle ha kunnat vara rätt svar på frågan. Detta är en stor nackdel för fri inmatning, eftersom man måste ta hänsyn till alla möjliga rätta svar. Dessutom måste man bygga funktioner för att korrigera felstavning, men trots detta kommer ändå en del användare att lyckas stava så mycket fel att inläsningen inte ger dem rätt, trots att dom förstår hur Schweiz styrelseskick fungerar.

Antalet svarsalternativ brukar oftast ligga mellan 4-6. Med färre än fyra svarsalternativ minskar spridningen radikalt och slumpen får större effekt på resultatet. Fyra till sex alternativ ger också de testande en god överblick av samtliga alternativ. Det är dock fullt möjligt att använda många fler svarsalternativ. Dock, för varje svarsalternativ blir vinsten mindre, samtidigt som det blir svårare att hitta relevanta alternativ. Man tjänar ofta mer på att välja ett färre antal svarsalternativ som är mer genomtänkta än att ha alltför många ogenomtänkta.

När man konstruerar svarsalternativ för flervalsfrågor vill man få så stor spridning som möjligt i resultatet. Därför ska man alltid sträva mot att konstruera svarsalternativen för flervalsfrågor i olika kvalitativa skikt. Svarsalternativen ska kunna rangordnas i närhet till det rätta svaret. Vid en perfekt testkonstruktion ska varje svarsalternativ utöka gruppen av möjliga svar. Ett exempel:

Vem bekämpade balrogen Durins Bane och föll ner i avgrunden i Morias gruvor under kampen?

  1. Legolas
  2. Saruman
  3. Aslan
  4. Gandalf

Rätt svar är Gandalf. Låt oss se på de felaktiga svarsalternativen.

Aslan är en mytologisk figur i C.S.S. Lewis fantasyvärld Narnia. Det är det minst troliga alternativet. Har man ett hum om Tolkiens sagovärld och att frågan handlar om den kan man utesluta Aslan som alternativ och har högre sannolikhet att svara rätt.

Saruman är liksom Gandalf en magiker. Vet man att det var en magiker som kämpade mot Durins Bane och känner till att både Gandalf och Saruman är magiker, kan man utöka sina chanser att svara rätt till 50%.

Legolas var liksom Gandalf en av de nio i ringens brödraskap och befann sig i Morias gruvor under kampen. Det är inte heller osannolikt att Legolas sköt iväg en pil eller två mot balrogen, även om han aldrig föll ner i avgrunden i denna kamp. Känner man till att det var någon ur ringens brödraskap som bekämpade balrogen har man också 50% chans att besvara frågan rätt.

Man arbetar alltså med flervalsfrågor genom att försöka hitta olika gemensamma kvaliteter för att kunna differentiera mellan dem som har viss förståelse från dem som fullständigt saknar förståelse. På det sättet får man ett bättre resultat på grund av den större variationen.

Tar man inte hänsyn till olika kvaliteter när man skapar frågan och svarsalternativen förlorar frågan kvalitet. Låt mig visa ett exempel på dålig frågekonstruktion:

Vilken av följande karaktärer är en alv?

  1. Legolas
  2. Frodo
  3. Pippin
  4. Sam

Det rätta svaret är Legolas. Det uppenbara felet med svarsalternativen är den slående endimensionaliteten. Här jämför vi endast två kvaliteter med varandra: Alv eller ickealv. För att förvärra det för oss är samtliga felaktiga svarsalternativ hobbitar. Man kan med säkerhet besvara frågan korrekt, utan att veta någonting om alver så länge man vet någonting om hobbitar. För att skapa fler kvaliteter bland svarsalternativen kan man omformulera frågan på följande sätt:

Vilken av följande karaktärer är en alv?

  1. Legolas
  2. Frodo
  3. Boromir
  4. Gimli

Svarsalternativen är förbättrade såtillvida att samtliga svarsalternativ inte är av samma ras. Frodo är en hobbit, Boromir är en människa och Gimli är en dvärg. Frågan är dock fortfarande inte tillräckligt välkonstruerad. För att förbättra den behöver vi använda oss av fler kvaliteter i de felaktiga svarsalternativen:

Vilken av följande karaktärer är en alv?

  1. Legolas
  2. Frodo
  3. Spock
  4. Anatis

Varje felaktigt svarsalternativ har nu en koppling till alver. Frodo förekommer också i Tolkiens sagovärld. Spock ser ut som en alv med sina spetsiga öron. Anatis är en egyptisk gudom som har ett väldigt alvlikt namn. Värt att observera är att jag valde bort Osiris som alternativ, trots alvliknande namn, eftersom sannolikheten då skulle vara större att kunskap om egyptiska gudar förbättrar sannolikheten för rätt svar när vi inte vill mäta detta.

En viktig aspekt att ta hänsyn till när man ser på testet som helhet är att inte göra alla frågor perfekta. Följer man samma formula för samtliga frågor kommer en del testande att intuitivt eller logiskt inse detta och få ett bättre resultat än deras kunskap inom området motsvarar. För att motverka denna effekt bör man infoga 10-20% icke välkonstruerade frågor.

Låt mig förklara lite närmare vad jag menar. En testande som har knäckt testkreationskoden kan titta på exemplet ovan och resonera på följande sätt: Legolas och Frodo förekommer båda i Tolkiens fantasyvärld. Legolas och Spock har båda spetsiga öron. Anatis och Legolas har båda alvklingande namn. Legolas har kopplingar till samtliga andra alternativ medan de andra alternativen har mycket svaga kopplingar till varandra. Därför är sannolikheten stor att Legolas är det rätta svaret, även om jag inte med säkerhet vet att Legolas är en alv.

Därför, för att inte själva testet ska påverka resultatet i onödigt stor omfattning bör man variera kopplingarna mellan svarsalternativen på de olika frågorna och infoga några frågor med sämre uppbyggnad. Ett exempel:

Vilken av följande filmer har Robert De Niro medverkat i?

  1. Gudfadern
  2. Gudfadern 3
  3. Tjuren från Bronx
  4. Broarna i Madison County

Rätt svar är Tjuren från Bronx. Frågan i sig är inte särskilt välkonstruerad med tanke på att möjliggöra flera nivåer av kunskap. Den präglas av endimensionalitet och svarsalternativen saknar kopplingar som gör att halvt insatta testande kan öka sannolikheten att få rätt. Kvaliteten ligger i stället på ett för testet övergripande plan. Det finns en uppenbar koppling mellan Gudfadern och Gudfadern 3 (och det faktum att Robert De Niro medverkar i Gudfadern 2). Testande som har knäckt testkreationskoden och som inte kan rätt svar kommer mest troligt att välja ett av Gudfadernalternativen på grund av deras koppling till varandra. Detta är precis det vi vill komma åt, det vill säga få en åtskillnad i resultatet mellan de som behärskar kunskapen vi vill testa och de som kan tänka strategiskt.

Sammanfattningsvis, man vill alltid att test ska särskilja resultatet för de testande i största möjliga mån. Det gör vi genom att skapa flerdimensionella frågor och svarsalternativ. Genom flera lager av kvaliteter ökar vi sannolikheten för delvis insatta att få rätt, trots att de inte känner till det rätta svaret. Dock är det viktigt att infoga frågor som bryter mot detta mönster för att motverka att testande får bättre resultat på grund av strategiskt tänkande i stället för den kunskap vi vill testa.