Bias vid datainsamling

Datainsamlingsbias uppstår när vi felaktigt väljer de ämnen som ska tillhöra det slumpmässiga urvalet som analyseras.

Vi har problemet när detta val gör att slumpmässiga urval inte är representativt för den statistiska populationen. Och därför är alla resultat som vi får från urvalet partiska, och vi kunde inte bekräfta att det uppfylldes i den analyserade populationen. Inom denna bias kan vi skilja på olika typer, vilket vi kommer att förklara nedan.

Överlevnadsfördomar

Uppstår när data utesluts från analysen eftersom de inte längre existerar vid tidpunkten för analysen.

Med andra ord fokuserar vi bara på de data som finns och kasserar de som tidigare fanns i befolkningen. I praktiken finns det många exempel på denna typ av partiskhet. En av dem är att bara utföra undersökningar till ett företags kunder och utesluta potentiella kunder. Ett annat skulle vara att utvärdera beteendet hos aktieindex genom att eliminera de företag som fanns och inte längre finns i indexet.

Lösningen på denna förspänning är mycket enkel. Genomför studien med alla data, befintliga och tidigare befintliga.

Förutseende fördomar

Det inträffar när en analys utförs med hjälp av data som inte är tillgängliga vid tidpunkten för analysen. Ett exempel kan vara att göra en analys av förhållandet mellan priset på en aktie och någon variabel i den finansiella balansen. Aktiekursen är en dynamisk variabel, om vi har korrekt information vid tidpunkten för analysen. De variabler som fastställs i balansräkningen är dock statiska och därför bör vi vänta på publiceringen av finansiella rapporter för denna analys.

Anta att vi vill studera förhållandet mellan pris och eget kapital för ett antal företag i slutet av räkenskapsåret. I det här fallet kommer vi inte att ha nettovärdedata förrän offentliggörandet av bokslutet. Offentliggörande som vanligtvis ges ett par månader efter räkenskapsårets slut.

Därför är en lösning på denna partiskhet att vänta på publiceringen av bokslutet. Och utför analysen med publicerade data tillsammans med priset vid tidpunkten för publiceringen.

Tidsperiod bias

Denna bias uppstår när den valda perioden för data är för kort eller för lång. Om den är för kort kan analysen återspegla specifika resultat som endast uppfylls för den perioden. Det vill säga att de inte skulle vara representativa under en längre tid.

Föreställ dig en femårsperiod där små företag har överträffat större företag på aktiemarknaden. Av detta kan vi dra slutsatsen att små företag i framtiden alltid kommer att överträffa stora företag. Men under så kort tid kan inga slutsatser dras. Detta beror främst på att situationen kan förändras under längre perioder. Därför är de erhållna resultaten förspända till denna reducerade tidsperiod.