P-värdet, från engelska, p-värde, är den minsta icke-godtyckliga signifikansnivån med vilken vi kan avvisa nollhypotesen (H0) givet en fördelningsfunktion och en teststatistik.
Med andra ord är p-värdet den minsta sannolikheten som definieras av fördelningen med vilken vi kan avvisa nollhypotesen (H0) utan att behöva definiera a priori signifikansnivån för kontrasten.
Om du kommer ihåg kommer du ihåg att området under kurvan för fördelningsfunktionen är en sannolikhet. Så ur denna synvinkel kommer p-värdet att vara sannolikheten att observera en sådan extrem teststatistik för att nullhypotesen ska vara sant.
Domän
Eftersom p-värdet är en sannolikhet kommer detta värde att vara mellan 0 och 1.
Inte godtyckligt
Till skillnad från signifikansnivåerna som vi är mer vana vid att se, såsom 1%, 5% och 10%, beror p-värdet på den distributionsfunktion som teststatistiken har. Så nivåerna 1%, 5% och 10% bestäms i början av kontrasten. Detta val kallas godtyckligt.
P-värdeformel
P-värdet är inte ett enda värde som det kritiska värdet, utan beror på statistiken. För olika värden i teststatistiken kommer det kritiska värdet att vara detsamma. Å andra sidan, för olika värden i teststatistiken, kommer p-värdet också att vara annorlunda, eftersom p-värdet beror på det värde som teststatistiken tar.
Var,
- D, är en slumpmässig variabel som följer en viss fördelning.
- d, är värdet på teststatistiken.
Beräkning
Det är möjligt att beräkna p-värdet för hand men du måste ha mycket exakta fördelningstabeller, det vill säga med många decimaler eftersom p-värdet tenderar att vara litet. De flesta statistiska program har redan införlivat p-värdet och det visas normalt i resultatet av uppskattningsresultaten med vanliga minsta kvadrater (OLS). Det kan verka svårt att använda men med övning är det ett mycket användbart verktyg.
För att beräkna p-värdet behöver vi:
- Kontraststatistik.
- Fördelningen av kontraststatistiken och att känna till dess parametrar.
Avvisningsregel
Om p-värde < signifikansnivå => H0-avslag.
Om p-värde > signifikansnivå => Inget avslag H0.
Representation
När det gäller en student t-fördelning med 2 frihetsgrader och en kontraststatistik lika med 3 är sannolikheten att hitta en sådan extrem statistik när nollhypotesen (H0) är sann 4,77%.
Med andra ord, om nollhypotesen (H0) var sant, skulle en statistik så stor som 3 endast observeras 4,77% av tiden.
Varför kallas det p-värde?
Namnet på p-värdet har sitt ursprung i definitionen som refererar till att vara området under kurvan för fördelningsfunktionen utanför konfidensintervallet. Eftersom detta område är den minsta sannolikheten för att avvisa nollhypotesen hänvisar "p" för p-värdet till sannolikhet. Och eftersom p-värdet motsvarar ett tal och därmed ett värde tillskrivs ordet "värde" för p-värde den numeriska figuren. I vissa böcker kan vi hitta "sannolikhetsvärde" som hänvisar till p-värdet. Att kanske säga "minsta sannolikhet att avvisa nollhypotesen" var för lång och innehöll inget mysterium för studenterna …