Direktlänk till inlägg 22 augusti 2022

Hjärnan, sannolikhet och slump

Av Henrik - 22 augusti 2022 00:12

Det finns en enkel övning i tänkande kring sannolikhet där förvånansvärt många människor går i fällan. Jag har själv testat den på ett antal personer genom åren och märkt att även några jag trodde skulle klara den gick bet på att resonera korrekt på egen hand.

Du tar två tärningar och slår dem. Är det lika sannolikt att du får en etta och en sexa som att du får två fyror?

Svaret är egentligen enkelt: Det är dubbelt så sannolikt att slå en etta och en sexa som två fyror, eftersom det finns två kombinationer – 1:6 och 6:1 - som ger det utfallet, men bara en kombination – 4:4 – som ger det andra. Ändå blir många osäkra om de inte sysslat med tärningsspel och inte så få klampar rakt i fällan och säger att sannolikheten är lika stor.

(bild: Pexels.com, foto Jonathan Persson)

Om du kände dig osäker så kan jag trösta dig med att du är i mycket bättre sällskap än du förmodligen tror. Fram till 1970-talet fanns i forskningen en ganska utbredd föreställning om att vi människor var ”intuitiva statistiker”. Det är egentligen ingen konstig idé ur ett evolutionsperspektiv. Det har stor betydelse för överlevnad att kunna bedöma sannolikheter för olika saker. Både för att undvika risker och att inte slösa energi på saker som har liten chans att ge framgång.

Naturligtvis har vi såna förmågor som alla andra djur. Det är bara det att de inte alls fungerar i många sammanhang som handlar om annat än att hitta mat för dagen och inte bli uppäten av rovdjur. Nobelpristagaren Daniel Kahneman har tillsammans med sin kollega Amos Tversky bidragit med en rad experiment och studier som visat att även de som borde veta mycket bättre många gånger gör fel när de skattar sannolikheter. Till och med professorer i statistik! Deras ingång till problemet var insikten att de själva, trots all utbildning på området, drog felaktiga slutsatser baserat på intuition.

Daniel Kahneman - en av de verkligt stora tänkarna kring människans tänkande och kännande i vår tid och huvudinspiratör och källa till fakta i den här bloggposten (bild: Karolinska institutet, KI)

De flesta av de brister vi har i vårt tänkande kring sannolikhet och slump är inte så svåra att förstå när man väl får dem förklarade för sig. Man kan precis som bloggaren sakna alla insikter i högre matematik och ändå fatta grunderna i dem. Men i en konkret situation måste man ändå ofta medveten tänka efter för att inte falla i någon av alla de fällor som vår hjärna lätt fastnar i när den går på autopilot.

Nu ska gå vi igenom några. Du känner säkert igen flera. Det bör också påpekas att de bör ses som olika sidor av samma mynt: Det är mångt och mycket samma typ av felaktigt tänkande som skapar fällorna.

De små talens lag

Våra hjärnor är konstruerade för att dra generaliserade slutsatser om verkligheten. Jordgubbar är gott. Spisar kan man bränna sig på. Dagisfröknar är snälla. Redan som småbarn börjar vi bygga en kunskapsbank som med åren växer sig allt större. Vi har en enorm nytta av denna förmåga, men den har också en allvarlig baksida: Våra slutsatser om verkligheten är inte sällan byggda på ett alldeles för litet urval av händelser. Som vi konstaterade ovan är det evolutionärt sett faktiskt fördelaktigt att dra förhastade slutsatser om risker och möjligheter, jämfört med att inte dra någon slutsats alls.

De små talens lag beskriver hur vi drar slutsatser om verkligheten baserat på ett alldeles för litet urval. ”Vi” i det här fallet är både vanliga människor och experter.

Vad våra hjärnor inte riktigt förstår är att resultat ur små urval löper mycket större risk att inte spegla verkligheten. Okej, vi förstår att om SVT går ut och frågar fem personer på stan om hur de tänker rösta i höst så säger det föga om utgången i riksdagsvalet. Men hur är det med 150 personer? Eller 1 500 personer? Kahneman och Tverskys undersökningar visade att även forskare som hade fullt klart för sig hur man beräknar nödvändiga urvalsstorlekar och statistisk signifikans mycket ofta designade sina studier utifrån intuition när man bestämde antal deltagare. En intuition som ledde till resultat som hade en alldeles för stor risk att de berodde på slumpen.

Det är också så att även om vi förstår att fem intervjuer inte förutsäger ett valresultat så drar vi lätt slutsatser i vår egen vardag på mycket små datamängder. Vad skulle du till exempel dra för slutsatser av att det står 5-2 i matcher mellan två basketlag efter sju inbördes möten? Att laget som vunnit fem gånger är bättre är i varje fall den tanke som intuitivt kommer till en. Men faktum är att om två exakt lika bra lag möts sju gånger i en sport där slumpen har en viss inverkan så kommer det ena laget vinna fem, sex eller alla sju matcherna nästan en fjärdedel av gångerna!

Ju mindre urval, desto större sannolikhet att slumpen ger ett resultat som inte stämmer med verkligheten. Anta att tre personer på en medelstor arbetsplats drabbas av cancer inom loppet av ett år. Det väcker förstås förstämning bland arbetskamraterna, men ganska säkert också oro: Är det något i miljön på jobbet som ligger bakom? Det kan förstås inte uteslutas, men sannolikt är det slumpens verk. För i små populationer är sannolikheten för resultat som avviker drastiskt från medelvärdet mycket större.

Anta att risken att drabbas av cancer inom ett år för hela mängden personer som arbetar på den här typen av arbetsplatser utifrån ålder och hälsa är 0,5%. Om det är hundra personer på arbetsplatsen så innebär tre drabbade en sex gånger så hög frekvens (3%) som snittet. Samtidigt noterar förmodligen ingen att varken i fjol eller förfjol var det någon som blev sjuk. Risken var ungefär 1 på 100 att någon skulle ha blivit sjuk, men utfallet blev 0.

I det långa loppet kommer saker och ting som styrs av sannolikheter att falla ut på det sätt som sannolikheterna förutsäger, antingen det handlar om tärningskast, sportresultat eller cancerfall i en population. Men som en matematiker jag känner en gång uttryckte saken på sitt träffande, precisa sätt: Vi förstår inte hur långt det långa loppet faktiskt är.

Att se mönster som inte finns.

Våra hjärnor söker ständigt efter förklaringar till det vi upplever. Det är därför mycket mer naturligt för oss att tro att det finns kausala orsaker till att något händer än att det är ren slump. Vi är bra på att se mönster, men tyvärr också mönster som inte finns.

Ett klassiskt exempel handlar om bilar som kör igenom en korsning. De är antingen röda eller blå. Vi står och observerar dem. Först kommer sex bilar i den här ordningen:

Blå – Röd – Röd – Blå – Röd – Blå

Sen följer tio bilar till:

Röd – Röd – Röd– Blå – Blå – Blå

Bägge dessa kombinationer är exakt lika sannolika, givet förstås att det totalt passerar lika många röda och blå bilar i korsningen. Ändå ser de flesta hjärnor ett mönster i den andra sekvensen. Nästa tanke blir då lätt att passagen av bilar inte är slumpmässig. För förutom den skenbara harmonin i hur fint röda och blå bilar sorterade upp sig i två grupper så har hjärnan svårt att tro att slumpen skapar kluster av den där typen: Många bilar av samma färg eller klavar i rad ”borde” inte kunna inträffa om det verkligen är slumpen som styr tänker den. Ett misstag som brukar kallas clustering illusion.

(bild: Freepik.com)

Det kan vara mycket svårt att övertyga människor som fått för sig att de ser ett mönster som visar på någon sorts orsak-verkan som inte är slump. Under Blitzen i London fick många för sig att det fanns ett mönster i form av områden i staden som inte träffats av några bomber. Det spekulerades vilt i att det bodde tyska spioner där. Men statistiker kunde visa att mönstret av träffade och ”skonade” områden såg precis ut som man kunde vänta sig i en i princip slumpmässig process. Det blev i det här fallet kluster av ovanligt många träffar på vissa ställen, medan det var ovanligt få på andra.

Om man som jag ägnar en del tid och kraft åt spel där det finns slumpinslag så måste man leva med att det uppstår kluster av frustrerande otur ibland. Tanken att det ligger något bakom kan dyka upp i huvudet även på oss som definitivt egentligen vet bättre. För andra kan det växa till en övertygelse. När jag spelade poker fanns det mängder av människor som var övertygade om att pokersidorna var ”riggade” så att det gick sämre för dem än det egentligen borde göra. Inga sakargument bet på dem. De kunde helt enkelt inte ha så mycket otur hävdade de.

Ett annat fenomen vi lätt kan drabbas av i vårt mönstersökande kallade astronomen Carl Sagan att bokföra träffarna, men glömma missarna. Om någon som gärna vill tro på det övernaturliga går till en spågumma så visar forskning att det finns en klar tendens att personen fokuserar på de påståenden där spågumman råkar träffa rätt (t.ex. att personens mamma är död), men bortser omedvetet från de påståenden som är felaktiga. Då framstår det lätt som att spågumman verkligen kan ”se” saker, när hon i själva verket inte har lyckats bättre med sina ”förutsägelser” än vad en dator som på slump skulle välja ut ett antal godtyckliga gissningar om en persons förhållanden. Mönstret av rätta gissningar man tror sig se är alltså inte ens en feltolkning, utan en ren vantolkning. Ungefär som att tänka bort allt det röda i en blå, grön och rödrandig matta och hävda att den är blågrön.

Sen kommer spågumman med all säkerhet också att använda sig av cold reading-teknik för att övertyga kunden om sin paranormala förmåga. Men det är ett psykologiskt fenomen som bloggen kanske tar upp nån annan gång.

Slumpen har inget minne

Massor av pengar har spelats bort vid roulettehjul utifrån föreställningen att det nu bara ”måste” komma upp rött, udda eller kanske ett visst nummer. Det har ju varit en lång sekvens av spinn utan. Denna idé om att slumpen skulle ha någon slags minne har döpts till Gambler’s fallacy.

Om vi kastar krona eller klave så är chansen att det blir krona 1 på 2. Om vi har kastat krona eller klave 9 gånger och det blivit krona varje gång är chansen att det blir krona en tionde gång fortfarande 1 på 2. Så varför tror vi då så lätt på motsatsen?

Vi har alla hört uttrycket ”det jämnar ut sig i längden”. Om det kommer fler kronor än klavar de första femtio kasten, borde det då inte komma fler klavar de nästa femtio? Men det som jämnar ut sig är den relativa frekvensen: Om vi kastar krona/klave fyra gånger finns det 2 av 16 möjliga utfall som ger mindre än 25% eller fler än 75% krona. Det händer alltså i snitt 12,5 gånger av 100. Men redan om vi dubblar till att kasta 8 gånger så sjunker antalet utfall med mindre än 25 eller mer än 75% till 18 av 256 möjliga. Det är lite drygt 7 gånger av 100. Och det är ändå ingenting mot om vi kastar 100 gånger. Då är antalet möjliga utfall så få att om jag låter en dator köra 100 000 omgångar med 100 kast så händer det i snitt färre än 6 gånger att det blir 75 eller fler klavar eller kronor!

Äntligen fick jag ett skäl att gräva fram min gamla dammiga myntsamling och använda den fina gamla tvåkronan för att illustrera något i bloggen. Krona är den sida av myntet som har kungens bild på sig.

Det här gör att effekten av tillfälliga mindre sannolika sekvenser, t ex att vi får krona fler än 9 gånger på 10 kast (sannolikheten för det är lite drygt 1%), kommer att minska i längden av alla mer sannolika utfall. Det behöver alltså inte komma fler klavar än kronor för att vi med tiden om vi kastar tillräckligt många gånger kommer allt närmare en fördelning 50%-50%. Och slumpen behöver inte ”minnas” att det nog är dags för lite klavar nu. Faktum är att eftersom den inte har något minne så är det något mer sannolikt att vi fortfarande har lite fler kronor än klavar när vi kastat 100 eller 1000 eller 10 000 gånger.

Inte så svårt egentligen, eller hur? Men något i våra hjärnor verkar helt enkelt inte gillar den äkta slumpen. Vi letar som alltid efter orsak och verkan och då är det naturligt att tänka att det som hänt i det förflutna på något vis påverkar det som händer i framtiden. Det är inte ologiskt, bara logik som utgår från felaktiga antaganden. För saken är den att en definition av äkta slump är att den just inte är underkastad orsak och verkan. Och så verkar det vara något i själva logiken kring att en osannolik serie av händelser ändå består av enskilda steg som i sig själva inte alls är särskilt osannolika som svär emot vår intuition. Och får oss att tro fel som följd.

Regression till medelvärdet

Anta att två ovanligt långa personer (mannen 200 cm och kvinnan 185) skaffar barn tillsammans. Hur långa kommer barnen att bli som vuxna?

När människor gissar på detta så kommer de högst sannolikt att gissa en för hög kroppslängd, även om de känner till att korrelationen mellan föräldrars och barns kroppslängd som vuxna är långt ifrån perfekt (den lär ligga på ungefär 0.5) På samma sätt kommer de antagligen att gissa fel på resultaten andra dagen och rundan av en golftävling när de utgår från resultaten den första dagen och sätta för lågt antal slag på de som ligger i toppen och för högt antal på de som ligger i botten.

Felet består i att vi underskattar slumpens roll och kraft i de flesta sammanhang. Eller faktorer som får samma effekt som slump. Och de logiska slutsatserna av det.

Om två händelser (t.ex. en pappa och en sons längd som vuxna) har en viss, men inte perfekt korrelation så kommer den andra händelsen i genomsnitt ligga närmare medelvärdet än den första. Men precis som slumpen saknar minne så är det här inte något resultat av en mystisk kraft som jämnar ut saker. Det är bara en annan aspekt av korrelation. Ju mer något avviker från medelvärdet, desto större sannolikhet att det är resultatet av egenskaper eller händelser med ganska låg sannolikhet att inträffa. Få män är två meter långa eller mer och i de allra flesta fall kommer de och barnets mamma föra över mer ”normala” kombinationer av gener som styr längd till sonen. Därför blir en son till en sån pappa i genomsnitt åtminstone något kortare. Och en ovanligt kort pappa får sannolikt en något längre son av samma skäl.

Golfspelare som gjort toppresultat på en runda gör i genomsnitt sämre ifrån sig nästa dag. Och tvärtom. Åtminstone givet att deltagarnas spelstyrka är någorlunda normalfördelad, d.v.s att några är lite sämre och några lite bättre och de flesta ligger nånstans i mitten i gruppen. En enskild runda kommer deras resultat dock med all sannolikhet vara lite mer utspridda. Detta därför att en del av det beror på sådant som vindar som blåser ”rätt” eller ”fel”. Men också på det faktum att inte ens de bästa golfspelare har full kontroll på sina slag. Därmed gör ren slump att vissa dagar kommer fler slag att bli precis rätt och andra dagar blir fler fel. Så en golfare som i snitt sätter säg 70% av sina puttar upp till ett visst avstånd kan sätta 85% en dag när hen har turen på sin sida, men bara 55% en dag när det är tvärtom. Men de flesta rundor kommer att sluta med ett utfall som ligger närmare 70%.

(bild: Pexels.com, fotograf: Kampus production) Glada på green - då har det nog gått bättre än det brukar idag? Vilket tyvärr mest sannolikt innebär att nästa runda går sämre. Regression to mean explained! Vilket på ett naturligt sätt för oss över till:

Underskattning av slumpens roll i olika skeenden

Daniel Kahneman fick en gång frågan om vad som var hans favoritekvation. Hans svar:

- Framgång = begåvning+tur

- Stor framgång= lite mer begåvning+ mycket tur

I de allra flesta skeenden i våra liv så spelar slump en mycket större roll än vad vi tror eller vill medge. I princip alla stora, framgångsrika företag har haft en väldig tur som bestod i att de kom fram med en produkt i rätt tid och på rätt plats.

Underskattning av slumpens roll är egentligen i huvudsak en funktion av det vi redan nämnt om vår benägenhet att se mönster och orsakssamband även när de inte finns i verkligheten. Och, skulle jag säga, ett psykologiskt motstånd mot tanken på slumpens roll i våra liv. Särskilt kanske när det gäller bra saker. Vi gillar inte tanken på att vårt favoritlags, vår musikaliska idols eller för den delen våra egna framgångar till en del handlar om tur och slump, inte bara hårt arbete och skicklighet.

I sportvärlden talar vi gärna om ”form” och tänker oss att alla lite längre sekvenser av bättre eller sämre resultat än förväntat beror på det och inte på slumpen. Vi förklarar regelmässigt misstag med ”nervositet”, eller ”dålig koncentration”. Och även om det naturligtvis är orsaken ibland till ett dåligt hopp eller kast så kan det precis lika gärna handla om slumpmässig variation som beror på att ingen idrottare behärskar sin idrott helt perfekt och därför gör en viss procent misstag även då hen inte är det minsta nervös eller okoncentrerad.

Vi ogillar slumpen så mycket att vi ibland inte vill erkänna den ens, trots ovedersägliga bevis. I basket märker man ibland hur spelare kommer in i sekvenser där de sätter ovanligt många skott. En sån spelare anses vara ”het” och analyser av amerikansk basket har visat att de får fler passningar av medspelarna när de är i en sån sekvens. Men analyser har också visat att det åtminstone för det mesta rör sig om en illusion. Fördelningen av sekvenser då spelarna sätter eller missar skott skiljer sig inte åt från vad man kan vänta sig av en rent slumpmässig fördelning utifrån hur hög träffprocent spelarna har totalt. En ”het” spelare har därför inte större sannolikhet rent statistiskt att sätta nästa skott än en spelare som inte är det. Men när studien presenterades avfärdades den av flera basketcoacher i NBA. Precis för övrigt som studier som visat att enskilda investerares årsresultat jämfört med andra investerares till största del beror på slumpfaktorer (korrelation mellan olika årsresultatet har varit låg eller obefintlig). Utan att det gett någon återverkan på lusten att ge höga bonusar till de mäklare som uppnått bäst resultat ett år.

En "het" spelare på väg att sätta en trepoängare i NBA? (bild: Beinsports.com)

Avslutning

Vi gör lätt misstag när vi resonerar kring och försöker bedöma sannolikheter och hur slumpen fungerar. Det finns förstås ännu fler fällor än de jag redan tagit upp. En välkänd är hur vi tenderar att överskatta sannolikheten för saker som får mycket uppmärksamhet och sådant som väcker starka känslor hos oss. Mord och flygolyckor är typiska såna saker som studier visat att människor tenderar att tro att det är mycket mer sannolikt att drabbas av än vad det i verkligheten är.

Här är en annan: Du går omkring på en slumpvis utvald plats i USA. Vilken hudfärg är det mest sannolikt att den första fattiga person du möter har? Nu kanske du tänker efter p.g.a det du läst. Men vid ett relativt snabbt svar slår jag vad om att många ser en svart/färgad person. Det är emellertid fel. Misstaget beror på en sammanblandning av absolut och relativ frekvens. I själva verket är det nästan dubbelt så sannolikt att det är en vit person, även när man inte räknar in latinamerikaner (Hispanics) i gruppen. För även om det relativt är nästan var femte svart som lever i fattigdom mot bara ungefär var elfte vit så bor det nästan fem gånger så många vita som svarta i landet (enligt USA:s egen rasbaserade statistik).

Slutligen en variant på samma tema. Ett visst ämne ökar risken för att drabbas av en allvarlig, dödlig sjukdom med 20%. Vad säger det? Inte mycket förrän vi vet hur stor risken var innan. Men med rätt twist kan säkert en kvällstidning skrämma upp ett antal läsare. För insikten att måste vi summera alla sannolikheter för att få fram ett tal som verkligen säger något konkret kommer långt ifrån automatiskt för oss alla. Det är en väldig skillnad om sjukdomen dödar 50 eller 5 000 personer om året. Tänk på det nästa gång du läser ett ”hälsolarm”. Och kom ihåg att när inte ens professorer i statistik är särskilt bra på det här med sannolikhet och slump alla gånger så behöver du inte känna dig helt misslyckad för du – sannolikt! – inte är någon vidare intuitiv statistiker.

Människan (psykologi m.m.)

Dela

Koranbränningarna och den goda lösningens illusion

Kommentarer (0)

Av Henrik - 31 juli 2023 09:00

Ska vi eller ska vi inte förbjuda bränning och annat vanhelgande av religiösa symboler? Var drar vi gränsen i så fall för vilka symboler som ska skyddas och var gränsen går för när något ska räknas som vanhelgande? Sverige har diskuterat det hä...

Alex Schulman och sanningen - Om non-fictionlitter...

Kommentarer (0)

Av Henrik - 4 april 2023 23:15

År 2018 ger författaren, poddaren, programledaren, nöjesjournalisten m.m. Alex Schulman ut romanen ”Bränn alla mina brev”. Boken blir en enorm succé och filmatiseras bara några år senare. Boken handlar om Schulmans morföräldrar: Den på si...

Ukraina - ett år av krig

Kommentarer (0)

Av Henrik - 24 februari 2023 09:35

Natten mot den 24 februari 2022. Rysslands president, Vladimir Putin, ger den slutliga ordern. Mängder av ryska militärfordon korsar gränsen mot Ukraina på ett antal olika platser. Robotar skjuts mot flera platser. Framryckande artilleri börjar skjut...

Är känslor universella?

Kommentarer (0)

Av Henrik - 30 december 2022 16:46

Har vi alla i grunden likadana känslor? Upplever vi glädje, sorg, skam, avundsjuka, stolthet, ilska på samma vis, oberoende på varifrån vi kommer och vilken kulturell kontext som omger oss? I populärkulturen har svaret på den frågan länge varit...

Eftervalsanalys - trender och siffror i riksdagsva...

Kommentarer (0)

Av Henrik - 19 september 2022 21:28

Välkommen till bloggen Jonesiskts eftervalsanalys. Här hittar du en hel del intressanta uppgifter om hur det röstades i det här valet och jämförelser med tidigare val. Det första avsnittet bygger i huvudsak på SVT:s vallokalundersökning (VALU 2022). ...