Normalfördelningen är en teoretisk modell som på ett tillfredsställande sätt kan approximera värdet av en slumpmässig variabel till en ideal situation.
Med andra ord passar normalfördelningen en slumpmässig variabel till en funktion som beror på medelvärdet och standardavvikelsen. Funktionen och den slumpmässiga variabeln kommer att ha samma representation men med små skillnader.
En kontinuerlig slumpmässig variabel kan ta vilket riktigt tal som helst. Till exempel är aktiereturer, testresultat, IQ och standardfel kontinuerliga slumpmässiga variabler.
En diskret slumpmässig variabel tar naturliga värden. Till exempel antalet studenter på ett universitet.
Den normala fördelningen är grunden för andra distributioner såsom Studentens t-distribution, chi-kvadratdistribution, Fishers F-distribution och andra distributioner.
Formel för normalfördelning
Med tanke på en slumpmässig variabel X säger vi att frekvensen för dess observationer kan approximeras tillfredsställande till en normalfördelning så att:
Om fördelningens parametrar är medelvärdet eller det centrala värdet och standardavvikelsen:
Med andra ord säger vi att frekvensen för en slumpmässig variabel X kan representeras av en normalfördelning.
Representation
Sannolikhetsdensitetsfunktion för en slumpmässig variabel som följer en normalfördelning.
Egenskaper
- Det är en symmetrisk fördelning. Värdet av medelvärdet, medianen och läget sammanfaller. Matematiskt,
Medel = Median = Läge
- Unimodal distribution. Värdena som är vanligare eller som är mer benägna att visas ligger runt medelvärdet. Med andra ord, när vi går bort från medelvärdet minskar sannolikheten för att värdena dyker upp och deras frekvens minskar.
Vad behöver vi för att representera en normalfördelning?
- En slumpmässig variabel.
- Beräkna medelvärdet.
- Beräkna standardavvikelsen.
- Bestäm vilken funktion vi vill representera: sannolikhetsdensitetsfunktion eller distributionsfunktion.
Teoretiskt exempel
Vi antar att vi vill veta om resultaten av ett test tillfredsställande kan approximera en normalfördelning.
Vi vet att 476 studenter deltar i detta test och att resultaten kan variera från 0 till 10. Vi beräknar medelvärdet och standardavvikelsen från observationerna (testresultat).
Så vi definierar den slumpmässiga variabeln X som testresultaten som beror på varje enskilt resultat. Matematiskt,
Varje elevs poäng registreras i en tabell. På detta sätt kommer vi att få en global vision om resultaten och deras frekvens.
Resultat | Frekvens |
0 | 20 |
1 | 31 |
2 | 44 |
3 | 56 |
4 | 64 |
5 | 66 |
6 | 62 |
7 | 51 |
8 | 39 |
9 | 26 |
10 | 16 |
TOTAL | 476 |
När tabellen är gjord representerar vi resultaten av undersökningen och frekvenserna. Om diagrammet ser ut som den föregående bilden och uppfyller egenskaperna, kan testresultatvariabeln på ett tillfredsställande sätt approximeras till en normalfördelning av medel 4,8 och standardavvikelse 3,09.
Kan testresultaten uppskatta en normalfördelning?
Anledningar till att anse att testresultatvariabeln följer en normalfördelning:
- Symmetrisk fördelning. Det vill säga det finns samma antal observationer både till höger och till vänster om det centrala värdet. Dessutom att medelvärde, median och läge har samma värde.
Medel = Median = Läge = 5
- Observationerna med mest frekvens eller sannolikhet ligger runt det centrala värdet. Med andra ord är observationerna med mindre frekvens eller sannolikhet långt ifrån det centrala värdet.
Normalfördelningen beskriver den slumpmässiga variabeln med en approximation som ger standardfel (staplarna ovanför varje kolumn). Dessa fel är skillnaden mellan de faktiska observationerna (resultat) och densitetsfunktionen (normalfördelning).