Studentens t-fördelning eller t-fördelning är en teoretisk modell som används för att approximera första ordningstillfället för en normalfördelad population när urvalsstorleken är liten och standardavvikelsen är okänd.
Med andra ord är t-fördelningen en sannolikhetsfördelning som uppskattar värdet av medelvärdet för ett litet urval från en population som följer en normalfördelning och för vilken vi inte känner till dess standardavvikelse.
Rekommenderade artiklar: frihetsgrader, frihetsgrader (exempel) och normalfördelning.
Studentens t-fördelningsformel
Med en kontinuerlig slumpmässig variabel L säger vi att frekvensen för dess observationer kan tillfredsställas tillfredsställande till en t-fördelning med g frihetsgrader så att:
Representation av studentens t-distribution
Densitetsfunktion för en t-fördelning med 3 frihetsgrader (df).
Som vi kan se ser representationen av t-fördelningen mycket ut som normalfördelningen förutom att normalfördelningen har bredare svansar och är mer stödd. Med andra ord bör vi lägga till mer frihetsgrader i t-fördelningen så att fördelningen "växer" och ser mer ut som normalfördelningen.
Specialitet
Och … Varför är t-distributionen så speciell?
Tja, för till skillnad från normalfördelningen som beror på medelvärdet och variansen beror t-fördelningen bara på frihetsgraderna från engelska, grader av frihet (df). Med andra ord, genom att kontrollera frihetsgraderna, kontrollerar vi fördelningen.
Studentens ansökan
T-fördelningen används när:
- Vi vill uppskatta medelvärdet av en normalfördelad population från ett litet urval.
- Provstorleken är mindre än 30 artiklar, det vill säga n <30.
Från 30 observationer liknar t-fördelningen nära normalfördelningen, så vi kommer att använda normalfördelningen.
- Standardpopulationens avvikelse är inte känd och måste uppskattas från observationerna i urvalet.
Exempel
Vi antar att vi har 28 observationer av en slumpmässig variabel G som följer en elevs t-fördelning med 27 frihetsgrader (df).
Matematiskt,
Eftersom vi arbetar med riktiga data kommer det alltid att finnas ett approximationsfel mellan data och distribution. Med andra ord kommer medelvärdet, medianen och läget inte alltid att vara noll (0) eller exakt samma.
Vi representerar frekvensen för varje observation av variabel G med hjälp av ett histogram.
Kan den slumpmässiga variabeln G approximera en t-fördelning?
Anledningar att tänka på att variabeln G följer en t-fördelning:
- Fördelningen är symmetrisk. Det vill säga det finns samma antal observationer både till höger och till vänster om det centrala värdet. Dessutom att medelvärdet och medianen tenderar att vara nära samma värde. Medelvärdet är ungefär noll, medelvärde = 0,016.
- Observationerna med mest frekvens eller sannolikhet ligger runt det centrala värdet. Observationer med mindre frekvens eller sannolikhet är långt ifrån det centrala värdet.