Konfidensintervall - Vad är det, definition och koncept

Innehållsförteckning:

Anonim

Ett konfidensintervall är en uppskattningsteknik som används vid statistisk slutsats som gör det möjligt att begränsa ett par eller flera par värden, inom vilka den önskade punktuppskattningen kommer att hittas (med en viss sannolikhet).

Ett konfidensintervall gör det möjligt för oss att beräkna två värden runt ett medelvärde (en övre och en nedre). Dessa värden begränsar ett intervall inom vilket med en viss sannolikhet befolkningsparametern kommer att lokaliseras.

Konfidensintervall = medelvärde + - felmarginal

Att känna till den sanna befolkningen är i allmänhet något mycket komplicerat. Tänk på en befolkning på 4 miljoner människor. Kan vi veta de genomsnittliga konsumtionskostnaderna per hushåll i denna befolkning? I princip ja. Vi måste helt enkelt undersöka alla hushåll och beräkna medelvärdet. Att följa den processen skulle dock vara extremt mödosam och göra studien ganska komplicerad.

I sådana situationer är det mer genomförbart att välja ett statistiskt urval. Till exempel 500 personer. Och beräkna medelvärdet på nämnda prov. Även om vi fortfarande inte skulle känna till det verkliga populationsvärdet, kan vi anta att det kommer att vara nära provvärdet. För det betyder vi lägga till felmarginalen och vi har ett konfidensintervallvärde. Å andra sidan subtraherar vi den felmarginalen från medelvärdet och vi får ett annat värde. Mellan dessa två värden kommer befolkningens medelvärde att vara.

Sammanfattningsvis tjänar konfidensintervallet inte till att ge en poänguppskattning av befolkningsparametern, om det kommer att hjälpa oss att få en ungefärlig uppfattning om vilken som kan vara den sanna. Det gör att vi kan begränsa mellan två värden där befolkningens medelvärde kommer att hittas.

variationskoefficientKumulativa frekvensen

Faktorer som ett konfidensintervall beror på

Beräkningen av ett konfidensintervall beror främst på följande faktorer:

  • Vald provstorlek: Beroende på mängden data som har använts för att beräkna provvärdet kommer det att vara mer eller mindre nära den sanna populationsparametern.
  • Självförtroendenivå: Den kommer att informera oss i vilken procentandel av fallen vår uppskattning är korrekt. De vanliga nivåerna är 95% och 99%.
  • Felmarginal för vår uppskattning: Detta kallas alfa och informerar oss om sannolikheten att befolkningsvärdet ligger utanför vårt intervall.
  • Uppskattningen i urvalet (medelvärde, varians, medelskillnad …): Pivotstatistiken för beräkning av intervallet beror på detta.

Exempel på konfidensintervall för medelvärdet, förutsatt normalitet och känd standardavvikelse

Pivotstatistiken som används för beräkningen skulle vara följande:

Det resulterande intervallet skulle vara följande:

Vi ser hur vi i intervallet till vänster och höger om ojämlikheten har den nedre respektive övre gränsen. Därför säger uttrycket oss att sannolikheten för att befolkningens medelvärde ligger mellan dessa värden är 1-alfa (konfidensnivå).

Låt oss ta en bättre titt på ovanstående med en övning löst som ett exempel.

Du vill uppskatta den genomsnittliga tid som en löpare tar för att slutföra ett maraton. För detta har 10 maratonpassats och ett genomsnitt på 4 timmar med en standardavvikelse på 33 minuter (0,55 timmar) har erhållits. Du vill få ett konfidensintervall på 95%.

För att få intervallet skulle vi bara behöva ersätta data i intervallformeln.

Konfidensintervallet skulle vara den del av distributionen som är skuggad i blått. De två värden som begränsas av detta skulle vara de som motsvarar de två röda linjerna. Den centrala linjen som delar fördelningen i 2 skulle vara det verkliga befolkningsvärdet.

Det är viktigt att notera att i detta fall, med tanke på att densitetsfunktionen för fördelningen N (0,1) ger oss den kumulativa sannolikheten (från vänster till det kritiska värdet), måste vi hitta det värde som lämnar oss 0,975 på vänster% (detta är 1,96).