En tillräcklig statistik för en parameter Θ är en som kan samla eller sammanfatta all information som provet av en slumpmässig variabel X innehåller.
Vi vet att en statistik är en verklig funktion av urvalet. Det vill säga det tar verkliga värden som ingår i provet. Därifrån, som vi har sett i artikeln där begreppet statistik definieras, måste vi se till att statistikern har vissa egenskaper. Varför kräva sådana fastigheter? För att säkerställa att statistiken är användbar för våra ändamål.
Tillräcklighet är en av dessa egenskaper. På ett mycket enklare sätt kommer vi att säga att en statistik är tillräcklig om den använder all information som finns i provet.
Hur vet jag om en statistik räcker?
Logiskt sett är frågan som uppstår: Hur kan jag veta om en T-statistik uppfyller egenskapen tillräcklighet? Eller hur kan jag hitta, om den finns, en statistik som uppfyller egenskapen tillräcklighet. Svaret på dessa två frågor finns i två satser:
- Fisher-Neyman faktoriseringskriterium: Detta kriterium anger att med tanke på en statistik T, om den uppfyller vissa villkor, kommer den att vara en tillräcklig statistik.
- Darmois sats: Denna teorem svarar på den andra frågan. Det innebär att det gör att vi kan hitta en tillräcklig statistik genom en serie procedurer.
Exempel på tillräcklig statistik
Antag att vi vill beräkna den genomsnittliga årliga inkomsten för familjer som bor i Chile. För att göra detta följer vi följande process:
- Samla information (exempel): Eftersom vi inte kan fråga var och en av de familjer som bor i Chile hur mycket de tjänar årligen, kommer vi att ta ett representativt urval av till exempel 1000 familjer.
- Identifiera den slumpmässiga variabeln som studeras: Den slumpmässiga variabeln som studeras är familjens inkomst. Således: X → Familjeinkomst
- Välj rätt statistik: Den lämpliga statistiken för att beräkna medelinkomsten är ingen annan än förväntningen på X. Med andra ord är provmedlet av X.
- Hur kan jag veta om provets medelstatistik är tillräcklig? Eftersom vi redan har det matematiska uttrycket för statistiken kommer vi att använda Fisher-Neyman factoring-kriteriet. Eller Darmois-satsen. De är formler som skapats för detta ändamål.
Efter att ha tillämpat rätt beräkningar drar vi slutsatsen att provets medelstatistik uppfyller kravet eller egenskapen för tillräcklighet. Genom att säkerställa att den uppfyller detta krav säkerställer vi att denna (statistiska) funktion, som gör det möjligt för oss att syntetisera informationen (medelinkomst), använder all information som finns i urvalet (de 1000 familjerna).
Varför är det viktigt att jag använder all information i provet?
Nu när vi vet att medelvärdet för provet är en tillräcklig statistik, låt oss anta ett fall. Vilken mening vore det att vilja beräkna den genomsnittliga inkomsten utifrån de 1000 chilenska familjerna och att vi bara använder 500-familjes data?
Naturligtvis skulle det inte vara vettigt. Vi vill ha en sammanfattning av all information. Det vill säga vad vi har definierat som tillräcklig statistik.