Standardna odstupanja i standardna pogreška

Anonim

Uvod

Standard D zrakoplovstvo (SD) i S tandard E rror (SE) naizgled su slične terminologije; međutim, oni su konceptualno tako raznovrsni da se oni koriste gotovo zamjenjivo u statistici književnosti. Obje pojmove obično prethode oznakom plus-minus (+/-) što ukazuje na činjenicu da oni definiraju simetričnu vrijednost ili predstavljaju raspon vrijednosti. Nepromjenjivo se oba pojma pojavljuju s prosječnim (srednjim) skupom izmjerenih vrijednosti.

Zanimljivo je da SE nema nikakve veze s standardima, s pogreškama ili s komunikacijom znanstvenih podataka.

Detaljan pogled na podrijetlo i objašnjenje SD i SE će otkriti, zašto profesionalni statističari i oni koji ga koriste kursorno, oboje sklanjaju pogrešku.

Standardna odstupanja (SD)

SD je a opisni statistika koja opisuje širenje distribucije. Kao mjerni podatak korisno je kada se podaci normalno distribuiraju. Međutim, to je manje korisno kada su podaci jako iskrivljeni ili bimodalni jer ne opisuju vrlo dobro oblik distribucije. Obično upotrebljavamo SD pri prijavi značajki uzorka, jer namjeravamo opisati koliko se podaci razlikuju po sredini. Ostale korisne statistike za opisivanje širenja podataka su interkartinski raspon, 25. i 75. percentil, te raspon podataka.

Slika 1. SD je mjera širenja podataka. Kada su podaci uzorak od normalno distribuirane distribucije, očekuje se da dvije trećine podataka leže unutar 1 standardne devijacije srednje vrijednosti.

Variancija je a opisni statistika također, a definirana je kao kvadrat standardne devijacije. Obično se ne opisuje kada se opisuju rezultati, ali je matematički obrađena formula (npr. Zbroj kvadratnih odstupanja) i igra ulogu u izračunavanju statističkih podataka.

Na primjer, ako imamo dvije statistike P & P s poznatim varijancijama var (P) & var (Q) , zatim varijanta zbroja P + Q jednak je zbroju varijancija: var (P) + var (Q) , Sada je jasno zašto statističari žele razgovarati o varijancijama.

Ali standardna odstupanja nose značajan značenje za širenje, osobito kada se podaci normalno distribuiraju: Interval je srednji +/- 1 SD Očekuje se da će zarobiti 2/3 uzorka, a interval znači + - 2 SD Očekuje se da će prikupiti 95% uzorka.

SD daje pokazatelj koliko daleko individualni odgovori na pitanje razlikuju ili "odstupaju" od srednje vrijednosti. SD kaže istraživačima kako su širili odgovore - jesu li koncentrirani oko sredine, ili raspršeni daleko i široko? Jesu li svi vaši ispitanici ocjenjivali vaš proizvod u sredini vaše ljestvice, ili su ga neki odobrili, a neki ga odbacuju?

Razmislite o eksperimentu u kojem se od ispitanika traži da ocjenjuju proizvod na nizu atributa na skali od 5 točaka. Srednja vrijednost za skupinu od deset ispitanika (označena s "A" prema "J" ispod) za "dobru vrijednost za novac" bila je 3,2 s SD od 0,4, a srednja vrijednost za "pouzdanost proizvoda" bila je 3,4 s SD od 2,1.

Na prvi pogled (gledajući samo sredstva), čini se da je pouzdanost ocijenjena veća od vrijednosti. No, veći SD za pouzdanost može pokazati (kao što je prikazano u raspodjeli u nastavku) da su odgovori bili vrlo polarizirani, gdje većina ispitanika nije imala probleme pouzdanosti (ocijenila je atribut "5"), ali manji, ali važan segment ispitanika problem pouzdanosti i ocijenio je atribut "1". Gledajući samu sredinu govori samo dio priče, međutim, češće nego ne, to je ono na što se istraživači usredotočuju. Distribucija odgovora je važna za razmatranje, a SD pruža vrijednu opisnu mjeru.

tuženik Dobra vrijednost za novac Pouzdanost proizvoda
3 1
B 3 1
C 3 1
D 3 1
E 4 5
F 4 5
G 3 5
H 3 5
ja 3 5
J 3 5
značiti 3.2 3.4
Std. Dev. 0.4 2.1

Prva anketa: Ispitanici ocjenjuju proizvod na skali od 5 točaka

Dvije vrlo različite raspodjele odgovora na skalu ocjenjivanja od 5 točaka mogu dati istu srednju vrijednost. Razmotrite sljedeći primjer koji prikazuje vrijednosti odgovora za dvije različite ocjene.

U prvom primjeru (Ocjena "A"), SD je nula, jer su svi odgovori bili točno srednja vrijednost. Pojedinačni odgovori uopće nisu odstupali od srednje vrijednosti.

U ocjeni "B", iako je srednja vrijednost grupe jednaka (3.0) kao i prva distribucija, standardna devijacija je veća. Standardna devijacija od 1.15 pokazuje da su pojedinačni odgovori, u prosjeku *, bili nešto više od 1 bod od srednje vrijednosti.

tuženik Ocjena "A" Ocjena "B"
3 1
B 3 2
C 3 2
D 3 3
E 3 3
F 3 3
G 3 3
H 3 4
ja 3 4
J 3 5
značiti 3.0 3.0
Std. Dev. 0.00 1.15

Drugo istraživanje: Ispitanici ocjenjuju proizvod na skali od 5 točaka

Drugi način gledanja na SD je prikazivanje distribucije kao histograma odgovora. Distribucija s niskom SD prikazat će se kao visoki uski oblik, dok će veliki SD biti označen širem formom.

SD općenito ne pokazuje "pravo ili krivo" ili "bolje ili lošije" - niži SD nije nužno poželjniji. Koristi se isključivo kao deskriptivna statistika. Opisuje distribuciju u odnosu na prosjek.

T echnical disclaimer koji se odnosi na SD

Razmišljanje o SD-u kao "prekomjerno odstupanje" izvrstan je način konceptualnog razumijevanja njegovog značenja. Međutim, to zapravo nije izračunato kao prosjek (ako je to bilo, nazvali bismo ga "prosječnom devijacijom"). Umjesto toga, riječ je o standardiziranoj, nešto složenoj metodi računanja vrijednosti pomoću zbroja kvadrata.

U praktične svrhe računanje nije važno. Većina tabulacijskih programa, proračunskih tablica ili drugih alata za upravljanje podacima izračunat će SD za vas. Važnije je razumjeti što statistika prenosi.

Standardna pogreška

Standardna pogreška je zaključni veznik statistika koja se koristi prilikom uspoređivanja sredstava uzorka (prosjeka) među populacijama. To je mjera preciznost srednjeg uzorka. Srednja vrijednost uzorka je statistička izvedba izvedena iz podataka koji imaju temeljnu distribuciju. Možemo je vizualizirati na isti način kao i podaci, budući da smo izveli jedan eksperiment i imali samo jednu vrijednost. Statistička teorija nam govori da je uzorak značajan (za veliki, gotovo "uzorak" i pod nekoliko uvjeta redovitosti) otprilike normalno raspoređen. Standardna devijacija ove normalne distribucije je ono što nazivamo standardnom pogreškom.

Slika 2. Distribucija na dnu repre distribucija podataka, dok je distribucija na vrhu teorijska razdioba srednje vrijednosti uzorka. SD od 20 je mjera širenja podataka, dok je SE od 5 mjerna nesigurnost oko uzorka uzorka.

Kada želimo usporediti sredstva ishoda s dva uzorka eksperimenta tretmana A prema tretmanu B, tada moramo procijeniti koliko točno izmjerili smo sredstva.

Zapravo, zanima nas koliko točno izmjerili smo razliku između dva sredstva. Ta mjera nazivamo standardnom pogreškom razlike. Nećete biti iznenađeni kada saznate da standardna pogreška razlike u uzorku znači funkciju standardnih pogrešaka sredstava:

Sada kada ste shvatili da su standardna pogreška srednje (SE) i standardna devijacija distribucije (SD) dvije različite zvijeri, možda se pitate kako su se prvo zbunili. Dok se razlikuju konceptualno, imaju matematički jednostavan odnos:

, gdje je n broj točaka podataka.

Primijetite da standardna pogreška ovisi o dvije komponente: standardnoj devijaciji uzorka i veličini uzorka n , To čini intuitivnim smislom: što je veća standardna devijacija uzorka, to je manje precizno što možemo biti o našoj procjeni prave sredine.

Također, velika veličina uzorka, više informacija o stanovništvu i točnije možemo procijeniti istinsku sredinu.

SE je pokazatelj pouzdanosti srednje vrijednosti. Mali SE je pokazatelj da je uzorak značenje točniji odraz stvarnog stanovništva znači. Veća veličina uzorka obično će rezultirati manjim SE (dok SD ne utječe izravno veličinom uzorka).

Većina istraživanja obuhvaća crtanje uzorka iz populacije. Zatim zaključujemo o populaciji iz rezultata dobivenih iz tog uzorka. Ako je uzet drugi uzorak, vjerojatno se rezultati ne mogu točno podudarati s prvim uzorkom. Ako je srednja vrijednost za atribut ocjenjivanja bila 3,2 za jedan uzorak, može biti 3,4 za drugi uzorak iste veličine. Ako bismo unijeli beskonačni broj uzoraka (jednake veličine) iz naše populacije, mogli bismo prikazati promatrana sredstva kao distribuciju. Tada možemo izračunati prosjek svih naših uzoraka. Ta sredina bi bila jednaka pravi prosjek stanovništva. Također možemo izračunati SD raspodjele sredstava uzorka. SD ove distribucije uzorka znači SE od svakog pojedinačnog uzorka uzorka.

Mi imamo naša najznačajnija promatranja: SE je SD od prosjeka stanovništva.

Uzorak značiti
1. 3.2
2. 3.4
3. 3.3
4. 3.2
5. 3.1
…. ….
…. ….
…. ….
…. ….
…. ….
značiti 3.3
Std. Dev. 0.13

Tablica koja prikazuje odnos između SD i SE

Sada je jasno da ako SD ove raspodjele pomaže da shvatimo koliko je srednja vrijednost uzorka od prave prosječne populacije, onda možemo to upotrijebiti da bismo razumjeli koliko je točan bilo koji pojedinačni uzorak u odnosu na pravi prosjek. To je bit SE.

U stvari, izvučemo samo jedan uzorak iz naše populacije, ali možemo upotrijebiti ovaj rezultat kako bismo dobili procjenu pouzdanosti našeg promatranog uzorka.

Zapravo, SE nam govori da možemo biti 95% sigurni da je naš promatrani uzorak plus ili minus skoro 2 (zapravo 1,96) standardnih pogrešaka iz populacije.

U nastavku je prikazana distribucija odgovora iz našeg prvog (i samo) uzorka koji se koristi za naše istraživanje. SE od 0,13, relativno malen, daje nam pokazatelj da je naša sredina relativno blizu stvarnog srednje vrijednosti naše cjelokupne populacije. Granica pogreške (na 95% pouzdanosti) za našu srednju vrijednost je (otprilike) dva puta veća od te vrijednosti (+/- 0.26), govoreći nam da je pravi prosjek najvjerojatnije između 2.94 i 3.46.

tuženik Ocjena
3
B 3
C 3
D 3
E 4
F 4
G 3
H 3
ja 3
J 3
značiti 3.2
Std. pogriješiti 0.13

Sažetak

Mnogi istraživači ne razumiju razliku između standardne devijacije i standardne pogreške, iako su uobičajeno uključeni u analizu podataka. Dok stvarni izračuni standardne devijacije i standardne pogreške izgledaju vrlo slični, oni predstavljaju dvije vrlo različite, ali komplementarne, mjere. SD nam govori o obliku naše distribucije, koliko su bliske pojedinačne vrijednosti podataka iz srednje vrijednosti. SE nam govori koliko je blizu naš uzorak značenje istinske sredine cjelokupne populacije.Zajedno, oni pomažu da daju potpuniju sliku nego što nas srednja vrijednost može reći.