Central Limit Theorem (TCL)

Innehållsförteckning:

Central Limit Theorem (TCL)
Central Limit Theorem (TCL)
Anonim

The Central Limit Theorem (TCL) är en statistisk teori som säger att, med tanke på ett tillräckligt stort slumpmässigt urval av befolkningen, kommer fördelningen av provmedlet att följa en normalfördelning.

Dessutom anger TCL att när provstorleken ökar kommer medelvärdet av provet att komma närmare befolkningens medelvärde. Därför kan vi med hjälp av TCL definiera fördelningen av provmedlet för en viss population med en känd varians. Så fördelningen följer en normalfördelning om provstorleken är tillräckligt stor.

Huvudegenskaper för den centrala gränssatsen

Den centrala gränssatsen har en serie mycket användbara egenskaper inom det statistiska och probabilistiska området. De viktigaste är:

  • Om provstorleken är tillräckligt stor följer fördelningen av provmedlet ungefär en normalfördelning. TCL betraktar ett prov som stort när dess storlek är större än 30. Därför, om provet är större än 30, kommer provets medelvärde att ha en fördelningsfunktion nära en normal. Och detta gäller oavsett vilken distributionsform vi arbetar med.
  • Populationens medelvärde och urvalsmedlet kommer att vara desamma. Det vill säga medelvärdet av fördelningen av alla provmedlen kommer att vara lika med medelvärdet av den totala befolkningen.
  • Variansen i fördelningen av provmedlet är σ² / n. Vilken är variationen i populationen dividerat med urvalets storlek.

Att fördelningen av provmedlet liknar en normal är oerhört användbart. Eftersom normalfördelningen är mycket lätt att använda för att utföra hypotesprov och konstruktion av konfidensintervall. I statistik att en distribution är normal är det ganska viktigt, eftersom många statistik kräver denna typ av distribution. Dessutom kommer TCL att tillåta oss att dra slutsatser om befolkningens medelvärde genom provmedelvärdet. Och detta är mycket användbart när vi på grund av brist på medel inte kan samla in data från en hel befolkning.

Exempel på den centrala gränssatsen

Låt oss föreställa oss att vi vill analysera den historiska genomsnittliga avkastningen för S&P 500-indexet, som som vi vet har cirka 500 företag inom sig. Men vi har inte tillräckligt med information för att analysera alla 500 företag i indexet. I detta fall skulle den genomsnittliga lönsamheten för S&P 500 vara befolkningsgenomsnittet.

Nu, efter TCL, kan vi ta ett urval av dessa 500 företag för att genomföra analysen. Den enda begränsningen vi har är att i urvalet måste det finnas mer än 30 företag för att satsen ska kunna uppfyllas. Så låt oss föreställa oss att vi slumpmässigt väljer 50 företag från indexet och upprepar processen flera gånger. Stegen att följa i exemplet skulle vara följande:

  • Vi väljer urvalet av cirka 50 företag och får den genomsnittliga lönsamheten för hela urvalet.
  • Vi väljer kontinuerligt 50 företag och uppnår den genomsnittliga lönsamheten.
  • Fördelningen av alla genomsnittliga avkastningar för alla valda prover kommer att approximera en normalfördelning.
  • Den genomsnittliga avkastningen för alla valda prover kommer att approximera genomsnittet för det totala indexet. Som framgår av Central Limit Theorem.

Därför kan vi genom slutsats från provets genomsnittliga avkastning närma sig indexets genomsnittliga avkastning.