T-TEST i ANOVA

Anonim

T-TEST vs ANOVA

Prikupljanje i izračunavanje statističkih podataka za stjecanje srednje vrijednosti često je dug i zamoran proces. T-test i jednosmjerna analiza varijance (ANOVA) su dva najčešća ispitivanja koja se koriste u tu svrhu.

T-test je statistička hipoteza gdje test statistika slijedi studentsku t distribuciju ako je nula hipoteza podržana. Taj se test primjenjuje kada test statistika slijedi normalnu raspodjelu i vrijednost termina skaliranja u ispitnoj statistici je poznata. Ako je termin skaliranja nepoznat, tada se zamjenjuje procjena koja se temelji na dostupnim podacima. Ispitna statistika slijedit će Studentsku t-distribuciju.

William Sealy Gosset uveo je t-statistiku 1908. godine. Gosset je bio kemičar za Guinness pivovaru u Dublinu, Irska. Pivovara u Guinnessu imala je politiku zapošljavanja najboljih diplomanata iz Oxforda i Cambridgea, odabirući od onih koji bi mogli davati aplikacije biokemije i statistike osnovanim industrijskim procesima tvrtke. William Sealy Gosset bio je takav diplomant. U tom procesu, William Sealy Gosset osmislio je t-test, koji je prvobitno bio zamišljen kao način praćenja kvalitete jakog piva (pivo koje piva proizvodi) na ekonomičan način. Gosset je objavio test pod imenom "Student" u Biometriku, oko 1908. godine. Razlog za ime olovke bio je Guinnessova inzistiranje, budući da je tvrtka htjela zadržati svoju politiku o korištenju statistike kao dio njihove "poslovne tajne".

Statistika T-testa općenito slijedi obrazac T = Z / s, gdje su Z i s funkcije podataka. Z varijabla je dizajnirana da bude osjetljiva na alternativnu hipotezu; učinkovito, veličina Z varijable je veća kada je alternativna hipoteza istinita. U međuvremenu, 's' je parametar skaliranja koji omogućuje raspodjelu T-a. Pretpostavke temeljene na t-testu su da a) Z slijedi standardnu ​​normalnu distribuciju pod nul-hipotezom; b) ps2 slijedi razdiobu Ï ‡ 2 s p stupnjeva slobode pod nultom hipotezom (gdje je p pozitivna konstanta); i c) vrijednost Z i vrijednost s neovisna su. U određenoj vrsti t-testa, ti su uvjeti posljedice proučavane populacije, kao i način na koji se podaci uzimaju u obzir.

S druge strane, analiza varijance (ANOVA) je skup statističkih modela. Dok su načela ANOVA već dugo korištena od strane istraživača i statističara, do 1918. Sir Ronald Fisher je predložio formaliziranje analize varijance u članku pod naslovom "Korelacija među rođacima na pretpostavci Mendelovog nasljeđivanja", Od tada, ANOVA je proširena u svom djelokrugu i primjeni. ANOVA je zapravo pogrešan naziv, jer nije izveden iz razlika u varijanci, nego iz razlika među sredstvima skupina. Uključuje pridružene postupke u kojima je promatrana varijancija određene varijable podijeljena u komponente koje se mogu pripisati različitim izvorima varijacija.

U osnovi, ANOVA daje statističko ispitivanje da bi se utvrdilo jesu li sredstva različitih grupa jednaka i, kao rezultat, generalizira t-test na više od dvije skupine. ANOVA može biti korisnija od dva uzorka t-testa jer ima manju šansu za počinjenje pogreške tipa I. Na primjer, višestruko testiranje dvostrukog uzorka imalo bi veće šanse da se izvrši pogreška nego ANOVA istih varijabli koji su uključeni kako bi se dobila srednja vrijednost. Model je isti i testni statistički omjer F. Jednostavnije rečeno, t-testovi su samo poseban slučaj ANOVA: rad ANOVA-e imat će isti rezultat višestrukih t-testova. Postoje tri vrste ANOVA modela: a) Modeli s fiksnim efektima koji pretpostavljaju da podaci dolaze iz normalnih populacija, razlikujući se samo njihovim sredstvima; b) Modeli slučajnim efektima koji prethode podacima opisuju hijerarhiju različitih populacija čije su razlike ograničene hijerarhijom; i, c) modeli s mješovitim efektima koji su situacije u kojima su prisutni i fiksni i slučajni efekti.

Sažetak:

  1. T-test se koristi pri određivanju da li su dva prosjeka ili sredstva jednaka ili različita. ANOVA je poželjna kada se uspoređuju tri ili više srednjih vrijednosti ili sredstava.
  2. T-test ima više vjerojatnosti da se izvrši pogreška, što znači da se više sredstava koristi, pa se ANOVA koristi za uspoređivanje dvaju ili više sredstava.