Ett statistiskt urval är en delmängd av data som tillhör en population av data. Statistiskt sett måste den bestå av ett visst antal observationer som tillräckligt representerar den totala informationen.
Statistik, som en gren av matematik, ansvarar för att samla in data, beställa och analysera det. Med andra ord, när vi vill studera ett visst fenomen vänder vi oss till statistik. Ett bra exempel på ett fenomen som studerats av statistik är medellönen för medborgarna i ett land
I den meningen kan vi av tidsskäl och kostnad inte samla in alla uppgif.webpter. Denna totala data är vad som kallas en datapopulation eller helt enkelt en befolkning.
Varför arbetar du med statistiska urval?
För att förklara varför ett statistiskt urval används istället för den totala befolkningen kommer vi att använda exemplet ovan.
Antag att vi vill studera något fenomen. I vårt fall är detta fenomen medellönen för medborgarna i ett land. Datapopulationen består av varje arbetare i landet. Naturligtvis skulle det av tids- och kostnadskäl vara omöjligt att fråga varje arbetare vad deras årslön är. Det skulle ta lång tid eller vi skulle behöva mycket resurser.
Vid denna tidpunkt visas begreppet statistiskt urval. Istället för att fråga miljontals arbetare i ett land eller en region samlar vi bara in en liten mängd data. Vi frågade till exempel 100 000 personer. Denna uppgif.webpt är fortfarande komplicerad, men det är mycket billigare att fråga 100 000 människor än att fråga 30 miljoner.
Denna lilla mängd data måste vara representativ. Det vill säga det måste representera befolkningen på ett adekvat sätt. Om de 100 000 personer vi frågar är koncentrerade till rika stadsdelar får vi uppgif.webpter som inte är representativa. Genomsnittslönen skulle vara mycket högre än den egentligen är.
Kännetecken för ett representativt statistiskt urval
Om du vill göra bra forskning är kvaliteten på det statistiska urvalet viktigt. Det är värdelöst att utföra de mest komplexa statistiska mätvärdena med de mest sofistikerade modellerna om det statistiska urvalet är partiskt. Det vill säga om provet inte är representativt.
När man får ett representativt urval finns det vissa aspekter som forskaren måste veta i förväg. Bland dessa aspekter är egenskaperna hos ett representativt urval. Kännetecknen för ett representativt urval är som följer:
- Stor nog: När vi arbetar med prover arbetar vi normalt med en mängd data som är mindre än befolkningen. För att ett statistiskt urval ska vara representativt måste det dock vara tillräckligt stort för att anses vara representativt. Till exempel, om vår befolkning består av 10 miljoner data och vi väljer 10, är det svårt för den att vara representativ. Ju större provet är naturligtvis inte alltid mer representativt.
- Slumpmässighet: Valet av data från ett statistiskt urval måste vara slumpmässigt. Det måste vara helt slumpmässigt. Om vi istället för att göra det slumpmässigt genomför vi en planerad datavalningsprocess introducerar vi en bias till datainsamlingen. Därför måste vi göra ett slumpmässigt urval för att undvika att provet är partiskt och därför för att göra det till ett representativt urval.
Statistisk slutsats
När vi väl har fått det representativa provet är det nödvändigt att dra slutsatser om vissa mätvärden. Ofta är vi intresserade av att känna till ett visst mått på en variabel. I det första exemplet skulle variabeln vara lönen för medborgarna i ett land. I denna mening är det värde som vi vill analysera medellönen för medborgarna i ett land.
Med andra ord har vi en datapopulation som består av alla arbetare i Mexiko. Från denna befolkning får vi en variabel, det vill säga årslönen. Med hjälp av lämpliga tekniker får vi ett representativt prov. Och slutligen, när vi väl har en datamängd som vi kan arbeta med, använder vi statistiska slutsatsstekniker för att beräkna medellönen.
Naturligtvis, när vi väl har datamängden, kan vi dra slutsatser om andra åtgärder. Till exempel hur lönen fördelas, hur stor andel arbetstagare som ligger under en viss lön eller hur stor löneklyftan är.
Exempel på statistiskt exempel
Antag att vi vill genomföra en studie om de genomsnittliga utgif.webpterna för colombianska familjer under januari månad. För detta har vi två alternativ:
- Ange bankkonton för alla familjer i Colombia
- Fråga ett representativt antal personer
Det första alternativet är inte genomförbart av flera skäl. För det första att familjerna inte kommer att ge upp sina uppgif.webpter och för det andra att vi inte heller kan gå familj för familj och titta på uppgif.webpterna. Främst eftersom befolkningen i Colombia är nära 50 miljoner. Under tiden är det andra alternativet att samla in ett statistiskt urval.
Vad vi kommer att göra, enligt ovanstående egenskaper, är att fråga 100 000 familjer. Det är något komplicerat men mycket lättare än att fråga 50 miljoner colombianer. Skillnaden är stor. Baserat på det urvalet på 100 000 familjer kommer vi att försöka beräkna de genomsnittliga utgif.webpterna för familjer i januari.
De extraherade uppgif.webpterna är mer eller mindre tillförlitliga enligt en serie mätvärden som beaktas i statistiska undersökningar. Naturligtvis är dessa typer av mätvärden mer avancerade och därför kommer vi inte att diskutera dem här.