P-värde - Vad är det, definition och koncept

Innehållsförteckning:

Anonim

P-värdet, från engelska, p-värde, är den minsta icke-godtyckliga signifikansnivån med vilken vi kan avvisa nollhypotesen (H0) givet en fördelningsfunktion och en teststatistik.

Med andra ord är p-värdet den minsta sannolikheten som definieras av fördelningen med vilken vi kan avvisa nollhypotesen (H0) utan att behöva definiera a priori signifikansnivån för kontrasten.

Om du kommer ihåg kommer du ihåg att området under kurvan för fördelningsfunktionen är en sannolikhet. Så ur denna synvinkel kommer p-värdet att vara sannolikheten att observera en sådan extrem teststatistik för att nullhypotesen ska vara sant.

Domän

Eftersom p-värdet är en sannolikhet kommer detta värde att vara mellan 0 och 1.

Inte godtyckligt

Till skillnad från signifikansnivåerna som vi är mer vana vid att se, såsom 1%, 5% och 10%, beror p-värdet på den distributionsfunktion som teststatistiken har. Så nivåerna 1%, 5% och 10% bestäms i början av kontrasten. Detta val kallas godtyckligt.

P-värdeformel

P-värdet är inte ett enda värde som det kritiska värdet, utan beror på statistiken. För olika värden i teststatistiken kommer det kritiska värdet att vara detsamma. Å andra sidan, för olika värden i teststatistiken, kommer p-värdet också att vara annorlunda, eftersom p-värdet beror på det värde som teststatistiken tar.

Var,

  • D, är en slumpmässig variabel som följer en viss fördelning.
  • d, är värdet på teststatistiken.

Beräkning

Det är möjligt att beräkna p-värdet för hand men du måste ha mycket exakta fördelningstabeller, det vill säga med många decimaler eftersom p-värdet tenderar att vara litet. De flesta statistiska program har redan införlivat p-värdet och det visas normalt i resultatet av uppskattningsresultaten med vanliga minsta kvadrater (OLS). Det kan verka svårt att använda men med övning är det ett mycket användbart verktyg.

För att beräkna p-värdet behöver vi:

  • Kontraststatistik.
  • Fördelningen av kontraststatistiken och att känna till dess parametrar.

Avvisningsregel

Om p-värde < signifikansnivå => H0-avslag.

Om p-värde > signifikansnivå => Inget avslag H0.

Representation

När det gäller en student t-fördelning med 2 frihetsgrader och en kontraststatistik lika med 3 är sannolikheten att hitta en sådan extrem statistik när nollhypotesen (H0) är sann 4,77%.

Med andra ord, om nollhypotesen (H0) var sant, skulle en statistik så stor som 3 endast observeras 4,77% av tiden.

Varför kallas det p-värde?

Namnet på p-värdet har sitt ursprung i definitionen som refererar till att vara området under kurvan för fördelningsfunktionen utanför konfidensintervallet. Eftersom detta område är den minsta sannolikheten för att avvisa nollhypotesen hänvisar "p" för p-värdet till sannolikhet. Och eftersom p-värdet motsvarar ett tal och därmed ett värde tillskrivs ordet "värde" för p-värde den numeriska figuren. I vissa böcker kan vi hitta "sannolikhetsvärde" som hänvisar till p-värdet. Att kanske säga "minsta sannolikhet att avvisa nollhypotesen" var för lång och innehöll inget mysterium för studenterna …