Vigerland – Fölsters rapport bygger på tvivelaktig statistik « Svenska Bostadsfonden Nyhetsforum
Lars Vigerland
Ek.dr fastighetseknomi

Vigerland – Fölsters rapport bygger på tvivelaktig statistik

Blogg

Under februari i år presenterade Reforminstitutet rapporten ”Många invandrare ingen nackdel i kartläggning av ”mänsklig utveckling” mellan svenska orter” av Stefan Fölster och Monica Renstig. Rapporten kommenterades av flertalet medier, bland annat Dagens Nyheter och Rapport. I rapporten säger sig författarna utgå ifrån FNs index för mänsklig utveckling kompletterat med fylligare svensk statistik. De variabler som ingår klassas i huvudgrupperna skola, jobb, hälsa, pengar samt hopplöshet och utanförskap. Variabeln brottslighet har man uteslutit med motiveringen att den är mycket osäker.

De variabler man väljer att inkludera i en modell resulterar självklart i det som kan presenteras. De variabler Fölster och Renstig valt kan i sig diskuteras vad de egentligen mäter. Vad innebär exempelvis variabeln sårbarhetsindex och vad mäter egentligen variabeln husprisindex? Utifrån modellen drar man slutsatsen att invandring inte innebär någon nackdel för en kommun. Denna slutsats skulle dock inte jag våga dra av de variabler och analyser man presenterat.

I rapporten presenterar man en del regressioner, sambandet mellan två variabler, och slår fast att förhållanden gäller. Min reflektion när jag tar del av de två diagram över regressionsanalyser som presenteras i rapporten är att vare sig några tekniska data går att finna, exempelvis signifikansnivå (styrkan i regressionen), eller ett resonemang om exempelvis extremvärden (outliers). I den första regressionen har man genomfört en analys på variablerna andel utländsk bakgrund och psykiskt välbefinnande bland niondeklassare. I projektionen framgår det tydligt att det finns ett antal extremvärden, vilka sannolikt helt förrycker analysresultaten. Det hade varit ärligare att diskutera dessa och sedan laborera med analyser utan dessa extremvärden. Dessa extremvärden kommenteras emellertid överhuvudtaget inte.

I den andra projektionen benämnd samband mellan lokalt företagsklimat och elände genomförs en regressionsanalys av variablerna lokalt företagsklimat och mänsklig utveckling. Man hävdar att regressionslinjen påvisar ett starkt samband. Hur starkt detta samband är redovisas emellertid ingenstans i rapporten.

Hade jag själv fått denna rapport i min hand i egenskap av handledare för ett examensarbete, hade jag bett studenterna att ytterligare underbygga och komplettera sina analyser innan denna typ av enkla slutsatser dras. Det är ju nämligen på det viset att variabler till synes kan samvariera utan att för den skull utgöra ett förhållande mellan orsak och verkan. Ett klassiskt exempel på samvariation är storkens ankomst och nativitet. Slutsatsen skulle då dras att storken anländer med de små barnen, men detta är ju casino online en felaktig slutsats om jag inte är helt felunderrättad. Ett annat klassiskt exempel på samvariation är skostorlek och intelligenskvot med slutsatsen att ju större skor personen bär desto högre intelligenskvot. Tänk vad många överdimensionerade skor det då skulle säljas.

Sanningen är ju i stället den att det är ålder och inte skostorlek i sig som påverkar intelligenskvoten, i exempelvis åldersspannet 10-20 år. Samvariation kan skenbart finnas utan att det föreligger någon egentlig koppling mellan variablerna genom att den ena variabeln förorsakar förändringen i den andra variabeln. En felaktig samvariation benämns skensamband. En konsekvens av Fölsters och Renstigs rapport borde då exempelvis vara att kommunen Södertälje med hög andel invandrare skulle hamna på ett lågt nummer i deras lista och kommunen Vellinge med låg andel invandrare hamna på ett högt nummer. Det omvända gäller emellertid.

Dessutom frågar jag mig varför man väljer att helt exkludera variabeln brottslighet, även om det kan stämma att denna kan innehålla en del missvisande information, men samtidigt inkluderar den obskyra variabeln sårbarhetsindex. Vad variabeln husprisindex tillför analysen är oklart, eftersom variabeln utflyttning finns. Dessa variabler torde mäta samma sak. Vid hög utflyttning från en ort sker ju självklart även en press nedåt på bostadspriser. Flera andra variabler i studien är mått på samma sak. I analyssammanhang brukar man exkludera variabler som mäter samma sak och endast inkludera den variabel som bäst mäter det man vill mäta. Detta brukar benämnas validitet.

Det är omtvistat om det är Mark Twain eller Benjamin Disraeli som myntade de bevingade orden ”There are three kinds of lies: lies, damned lies and statistics”, men de är dessvärre fortfarande gångbara.

Benjamin Disraeli, 1804-1881, brittisk premiärminister i omgångar från 1868, källa: www.ne.se, hämtat den 10 mars 2013

 

 

Publicerad 26 mars, 2013

Författare: Lars Vigerland

Senast publicerade inlägg

Mest lästa inlägg