I tidigare inlägg har jag redogjort för hur min Bayesian Inference valprediktion lyckades (riktigt bra, tack för att du frågar, bättre än många proffs-tyckare, faktiskt!) 🙂
I detta inlägg presenteras några obearbetade “rådata” kring valutgången och populationen i dels samtliga svenska län, dels i kommunerna i Stockholms län.
Vidare presenteras en regressionsanalyser över partiernas valresultat releterat till andelen utrikes födda i respektive valområde, då huruvida detta har påverkat valresultatet har varit och är ett aktuellt debattämne.
Då jag anser att graferna nedan är självförklarande (åtm. för den primära målgruppen för denna blogg) så räcker det att jag påpekar en intressant skillnad i regressionsplottarna mellan å ena sidan Stockholms kommuner och andra sidan landets län… Den skillnaden bör vara av intresse för ev. statsvetare samt övriga valforskare…
[Addendum]
Efter att ha funderat ett tag på hur det kan komma sig att regressionslinjerna går i motsatt riktning för Stockholms kommun och aggregationen av länen, så tror jag mig nu ha svaret: helt enkelt att en eller ett par “outliers” på kommun-nivå har ingen större effekt när man aggregerar kommunerna till en större enhet. För att verifiera detta körde jag en simulering:
de röda, mindre prickarna representerar kommuner i ett län, de större oranga länen i landet. Den röd-oranga stora pricken är medelvärdet för kommunerna i de små prickarna, och därmed ett av värdena på länsnivå, dvs den “ingår” i mängden oranga prickar i den nedre delen av grafen, som en “outlier”.
Tittar man då på den oranga regressionslinjen, så ser man att outliern har en viss påverkan (linjen går över de flesta prickarna pga gravitationen från outliern), men inte tillräckligt för att ändra riktning på länens regression.