Samband mellan migration och sexualbrott…? [Del I]

Brottsförebyggande Rådet, BRÅ, för enligt uppgift inte statistik över etnicitet eller nationalitet på de kriminella i Sverige. Man kan fråga sig varför, då det är känt att vissa grupper är gravt överrepresenterade i vissa typer av brott, och ur ett samhällsperspektiv vore det synnerligen väsentligt att veta vilka dessa grupper är, för att kunna adressera problemet på ett effektivt sätt.

För BRÅ vore det synnerligen enkelt att registrera etnicitet och nationalitet, men som sagt, man har av för mig okända skäl valt att inte göra det. Således, det finns mig veterligen inget direkt sätt att sammanställa denna information, då rådatat saknas.

Dock finns det statistiska metoder som kan användas för att med hjälp av tillgängliga data göra en inferens, dvs statistiska metoder som söker efter sannolikhetsbaserade samband mellan olika dataset.

I den här artikeln har jag samkört två dataset, ett från BRÅ, det andra från Migrationsverket, och utfört en sådan statistisk inferens på dessa data. Datat från BRÅ beskriver antalet anmälda sexualbrott i Sverige åren 1975-2017, medan datat från Migrationsverket beskriver antalet asylsökande från olika länder till Sverige, åren 1984-2017.

Vi kan börja med att titta på dessa data:

sexualbrottasyl_samtliga

Några saker kan konstateras direkt, visuellt, ur dessa två grafer: dels att antalet anmälda sexualbrott ökar konstant, dels att Sverige haft två extrema peak:ar på flyktingmottagningen, den första 1992, under kriget i Jugoslavien, den andra 2015.

Länderna som ingår i Migrationsverkets data över asylsökanden är hela 180 st (!):

Afghanistan
Albanien
Algeriet
Angola
Argentina
Armenien
Australien
Azerbajdzjan
Bahamas
Bahrain
Bangladesh
Barbados
Belgien
Belize
Benin
Bhutan
Bolivia
Bosnien och Hercegovina
Bosnien–Hercegovina
Botswana
Brasilien
Bulgarien
Burkina Faso
Burundi
Centralafrikanska Republiken
Chile
Colombia
Comorerna
Costa Rica
Cypern
Danmark
Dem. republiken Kongo
Djibouti
Dominica
Dominikanska Republiken
Ecuador
Egypten
Ekvatorialguinea
El Salvador
Elfenbenskusten
Eritrea
Estland
Etiopien
Fiji
Filippinerna
Finland
Frankrike
Förenade Arabemiraten
Gabon
Gambia
Georgien
Ghana
Grekland
Grenada
Guatemala
Guinea
Guinea Bissau
Guyana
Haiti
Honduras
Indien
Indonesien
Irak
Iran
Irland
Israel
Italien
Jamaica
Japan
Jemen
Jordanien
Jugoslavien
Juguslavien
Kambodja
Kamerun
Kanada
Kap Verde
Kazakstan
Kenya
Kina
Kirgizistan
Kiribati
Kongo
Kosovo
Kroatien
Kuba
Kuwait
Laos
Lettland
Libanon
Liberia
Libyen
Litauen
Madagaskar
Makedonien
Malawi
Malaysia
Maldiverna
Mali
Malta
Marocko
Mauretanien
Mauritius
Mexiko
Mocambique
Moldavien
Mongoliet
Montenegro
Myanmar
Namibia
Nederländerna
Nepal
Nicaragua
Niger
Nigeria
Nordkorea
Norge
Nya Zeeland
Okänt
Oman
Pakistan
Panama
Paraguay
Peru
Polen
Portugal
Qatar
Rumänien
Rwanda
Ryssland
Saint Kitts och Nevis
Saudiarabien
Schweiz
Senegal
Serbien
Serbien och Montenegro
Seychellerna
Sierra Leone
Singapore
Slovakien
Slovenien
Somalia
Spanien
Sri Lanka
Staten Palestina
Statslös
Surinam
Storbritannien
Sudan
Swaziland
Sydafrika
Sydkorea
Sydsudan
Syrien
Trinidad och Tobago
Tadzjikistan
Taiwan
Tanzania
Tchad
Thailand
Tjeckien
Togo
Tunisien
Turkiet
Turkmenistan
Tyskland
USA
Uganda
Ukraina
Ungern
Uruguay
Uzbekistan
Vanuatu
Venezuela
Vietnam
Vitryssland
Zambia
Zimbabwe
Österrike
Övriga länder

Låt oss då undersöka om det råder något statistiskt samband mellan antalet asylsökanden och antalet sexualbrott: för att göra det, använder vi oss av Linear Regression, en statistisk metod för att undersöka i vilken grad en eller flera faktorer, i vårt fall antalet asylsökande, påverkar en annan faktor, i vårt fall antalet anmälda sexualbrott. Vi börjar med att titta på huruvida det existerar ett statistiskt säkerställt samband mellan SAMTLIGA asylsökande från samtliga ovan listade länder:

linreq-asyl-sex_samtliga

Grafen från Linear Regression-körningen påvisar ett ytterst svagt samband: på en alpha-nivå av 0.05, är inte sambandet statistiskt påvisbart (signifikant). P-värdet i detta fall är hela 0.09, vilket medför att något statistiskt säkerställt samband ej kunde finnas i det aktuella datat. Samma sak påvisas av Cohen’s D-värde, som är ett mått på statistisk “effekt”, där vårt Cohen-D är  0.1, vilket brukar klassificeras som “Very Low Effect”. Slutligen, R2-värdet, som beskriver hur stor del av variabilityn i datat som förklaras av modellen, är också mycket låg, 0.09.

Så, ur ett statistiskt perspektiv, på grundval av de data som vi använt oss av, omfattande samtliga asylsökande från samtliga länder, kan vi inte påvisa något statistiskt säkerställt samband mellan antalet asylsökande och antalet sexualbrott.

I nästa del tittar vi på ytterligare en analys.

About swdevperestroika

High tech industry veteran, avid hacker reluctantly transformed to mgmt consultant.
This entry was posted in Data Analytics, development, Statistics, Sverige and tagged , , , . Bookmark the permalink.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s