Survival bias - Vad det är, definition och koncept

Survival bias är en bias som uppstår vid datainsamling när data utesluts från analysen eftersom de inte längre finns idag.

Denna partiskhet uppstår i en mängd olika sammanhang där vi bara fokuserar på dessa "överlevande" data. Ett exempel på detta ses när företag undersöker sina kunder om en av deras produkter. Men de lämnar sina icke-klienter, som i detta fall skulle vara de "icke-överlevande", i glömska.

I det här fallet skulle det vara fel att dra slutsatser från den studien. Eftersom resultaten endast skulle vara partiska för den "överlevande" befolkningen. Och de skulle inte vara representativa resultat.

Överlevnadsfördomar i praktiken

Ett tydligt exempel på denna partiskhet kan ses i studien av resultaten från investeringsfonder. Där de flesta databaser endast innehåller fonder som finns idag. Oavsett vilka fonder som fanns tidigare.

Anledningen till att de inte existerar idag är att deras prestationer har varit sämre än "överlevande". Eller till och med flera fonder har slagits samman till en. Därför genomförs analysen på de fonder som har bäst resultat. Och denna partiskhet tenderar att överskatta resultatet av urvalet av dessa medel.

Det största problemet med detta är inte längre bara överskattningen av fondens resultat. Snarare skulle det valda urvalet inte vara ett slumpmässigt urval av den totala populationen. Och därför kan resultaten av studien inte vara representativa för befolkningen. Att det i slutändan är vad vi letar efter när vi väljer ett slumpmässigt urval av befolkningen.

Lösning på överlevnadsfördomar

Låt oss föreställa oss att vi vill välja en investeringsfond att investera i, baserat på dess tidigare beteende. För att undvika denna överlevnadsbias och optimera det valet bör vi utföra följande steg:

  • Välj den tidshorisont som vi planerar att arbeta med. Till exempel tio, femton eller tjugo års historia.
  • Ta alla befintliga medel från början av tidshorisonten, oavsett om de existerar eller inte för närvarande.
  • Därifrån väljer du urvalet från den populationen för studier av beteende.

Tanken med detta är i slutändan att få det slumpmässiga urvalet av befolkningen. Och därifrån fick man slutsatserna om de skulle kunna vara representativa för den befolkningen.