Statistiliste hüpoteeside kontrollimise kriteeriumid ja meetodid, näited

Sisukord:

Statistiliste hüpoteeside kontrollimise kriteeriumid ja meetodid, näited
Statistiliste hüpoteeside kontrollimise kriteeriumid ja meetodid, näited
Anonim

Hüpoteesi testimine on statistikas vajalik protseduur. Hüpoteesitestis hinnatakse kahte üksteist välistavat väidet, et teha kindlaks, millist väidet näidisandmed kõige paremini toetavad. Kui leid on statistiliselt oluline, on see tingitud hüpoteesi testist.

Kinnitusmeetodid

Statistiliste hüpoteeside kontrollimise meetodid on statistilise analüüsi meetodid. Tavaliselt võrreldakse kahte statistikakomplekti või valimiga andmekogumit idealiseeritud mudeli sünteetilise andmekogumiga. Andmeid tuleb tõlgendada nii, et need lisaksid uusi tähendusi. Saate neid tõlgendada, eeldades lõpptulemuse teatud struktuuri ja kasutades oletuse kinnitamiseks või ümberlükkamiseks statistilisi meetodeid. Eeldust nimetatakse hüpoteesiks ja sellel eesmärgil kasutatavaid statistilisi teste nimetatakse statistilisteks hüpoteesideks.

H0 ja H1 hüpoteesid

Seal on kaks peamisthüpoteeside statistilise testimise mõisted - nn "põhi- ehk nullhüpotees" ja " alternatiivne hüpotees". Neid nimetatakse ka Neymani-Pearsoni hüpoteesideks. Statistilise testi eeldust nimetatakse nullhüpoteesiks, põhihüpoteesiks või lühid alt H0. Seda nimetatakse sageli vaikeeelduseks või eelduseks, et midagi pole muutunud. Testi eelduse rikkumist nimetatakse sageli esimeseks hüpoteesiks, alternatiivseks hüpoteesiks või H1-ks. H1 on mõne teise hüpoteesi lühene, sest me teame selle kohta vaid seda, et H0-andmed võib kõrvale jätta.

nullhüpoteesi test
nullhüpoteesi test

Enne nullhüpoteesi tagasilükkamist või mittelükkamist tuleb testi tulemust tõlgendada. Võrdlust loetakse statistiliselt oluliseks, kui andmestike vaheline seos ei ole tõenäoliselt nullhüpoteesi realiseerimine vastav alt lävitõenäosusele – olulisuse tasemele. Statistiliste hüpoteeside testimiseks on olemas ka sobivuse kriteeriumid. See on hüpoteesi testimise kriteeriumi nimi, mis on seotud tundmatu jaotuse oletatava seadusega. See on empiirilise ja teoreetilise jaotuse lahknevuse numbriline mõõt.

Statistiliste hüpoteeside kontrollimise protseduur ja kriteeriumid

Levinud hüpoteeside valikumeetodid põhinevad kas Akaike teabekriteeriumil või Bayesi koefitsiendil. Statistiliste hüpoteeside testimine on nii järelduste kui ka Bayesi järelduste põhitehnika, kuigi neil kahel tüübil on märkimisväärsed erinevused. Statistilised hüpoteeside testiddefineerida protseduur, mis kontrollib ekslikult vale vaikimisi või nullhüpoteesi üle otsustamise tõenäosust. Protseduur põhineb selle toimimise tõenäosusel. See vale otsuse tegemise tõenäosus on ebatõenäosus, et nullhüpotees vastab tõele ja et mingit konkreetset alternatiivset hüpoteesi ei eksisteeri. Test ei saa näidata, kas see on tõene või vale.

Statistiliste hüpoteeside kontrollimise meetodid
Statistiliste hüpoteeside kontrollimise meetodid

Otsusteooria alternatiivsed meetodid

Otsustusteooria alternatiivsed meetodid on olemas, mille puhul null- ja esimest hüpoteesi käsitletakse võrdsem alt. Teised otsustusviisid, nagu Bayesi teooria, püüavad tasakaalustada halbade otsuste tagajärgi kõigi võimaluste vahel, selle asemel, et keskenduda ühele nullhüpoteesile. Andmetel põhinevad mitmed muud lähenemisviisid otsustamaks, milline hüpotees on õige, ja millistel neist on soovitud omadused. Kuid hüpoteeside testimine on paljudes teadusvaldkondades domineeriv andmeanalüüsi lähenemisviis.

Statistilise hüpoteesi testimine

Kui üks tulemuste komplekt erineb teisest komplektist, tuleb tugineda statistiliste hüpoteeside või statistiliste hüpoteeside testidele. Nende tõlgendamine nõuab p-väärtuste ja kriitiliste väärtuste õiget mõistmist. Samuti on oluline mõista, et olenemata olulisuse tasemest võivad testid siiski sisaldada vigu. Seetõttu ei pruugi järeldus olla õige.

Testimisprotsess koosnebmitu sammu:

  1. Uurimiseks luuakse esialgne hüpotees.
  2. Märgitud on asjakohased null- ja alternatiivsed hüpoteesid.
  3. Selgitab statistilisi eeldusi testi valimi kohta.
  4. Sobiva testi kindlaksmääramine.
  5. Valige olulisuse tase ja tõenäosuslävi, millest allpool nullhüpotees tagasi lükatakse.
  6. Nullhüpoteesi testimise statistika jaotus näitab võimalikke väärtusi, mille korral nullhüpoteesi tagasi lükatakse.
  7. Arvestus on pooleli.
  8. Otsustatakse nullhüpoteesi tagasilükkamine või aktsepteerimine alternatiivi kasuks.

On olemas alternatiiv, mis kasutab p-väärtust.

Näited statistiliste hüpoteeside kontrollimiseks
Näited statistiliste hüpoteeside kontrollimiseks

Olulisuse testid

Puhastel andmetel pole ilma tõlgendamiseta praktilist kasu. Statistikas kasutatakse andmete kohta küsimuste esitamisel ja tulemuste tõlgendamisel statistilisi meetodeid, et tagada vastuste täpsus või tõenäosus. Statistiliste hüpoteeside kontrollimisel nimetatakse seda meetodite klassi statistiliseks testimiseks ehk olulisuse testideks. Mõiste “hüpotees” meenutab teaduslikke meetodeid, mille käigus uuritakse hüpoteese ja teooriaid. Statistikas annab hüpoteesi testi tulemuseks koguse, mis on antud eeldusel. See võimaldab teil tõlgendada, kas oletus vastab tõele või on rikutud.

Testide statistiline tõlgendamine

Hüpoteesi testidkasutatakse selleks, et teha kindlaks, millised uurimistulemused viivad nullhüpoteesi tagasilükkamiseni etteantud olulisuse tasemel. Statistilise hüpoteesi testi tulemusi tuleb tõlgendada nii, et sellega saaks edasi töötada. Statistiliste hüpoteeside testimise kriteeriumidel on kaks levinud vormi. Need on p-väärtus ja kriitilised väärtused. Olenev alt valitud kriteeriumist tuleb saadud tulemusi tõlgendada erinev alt.

Mis on p-väärtus

Väljundit kirjeldatakse p-väärtuse tõlgendamisel statistiliselt olulisena. Tegelikult tähendab see näitaja vea tõenäosust nullhüpoteesi tagasilükkamisel. Teisisõnu, seda saab kasutada väärtuse nimetamiseks, mille abil saab tõlgendada või kvantifitseerida testi tulemust, ja määrata vea tõenäosust nullhüpoteesi tagasilükkamisel. Näiteks saate teha andmete valimiga normaalsuse testi ja leida, et kõrvalekallete tõenäosus on väike. Siiski ei pea nullhüpoteesi tagasi lükkama. Statistilise hüpoteesi test võib anda p-väärtuse. Selleks võrreldakse p väärtust ettemääratud läviväärtusega, mida nimetatakse olulisuse tasemeks.

Nullhüpoteeside statistiline testimine
Nullhüpoteeside statistiline testimine

Olulisuse tase

Olulisuse tase kirjutatakse sageli kreeka väikese tähega "alfa". Alfa puhul kasutatav üldine väärtus on 5% ehk 0,05. Väiksem alfa väärtus viitab nullhüpoteesi usaldusväärsemale tõlgendusele. P-väärtust võrreldakseeelvalitud alfa väärtus. Tulemus on statistiliselt oluline, kui p-väärtus on väiksem kui alfa. Olulisuse taseme saab ümber pöörata, lahutades selle ühest. Seda tehakse selleks, et määrata kindlaks hüpoteesi usaldustase vaadeldud näidisandmete põhjal. Selle statistiliste hüpoteeside kontrollimise meetodi kasutamisel on P-väärtus tõenäosuslik. See tähendab, et statistilise testi tulemuse tõlgendamise käigus ei teata, mis on õige või vale.

Statistika hüpoteeside testimise teooria

Nullhüpoteesi tagasilükkamine tähendab, et on piisav alt statistilisi tõendeid selle kohta, et see näib tõenäoline. Vastasel juhul tähendab see, et selle ümberlükkamiseks pole piisav alt statistikat. Statistilisi teste võib mõelda nullhüpoteesi tagasilükkamise ja aktsepteerimise dihhotoomia alusel. Nullhüpoteesi statistilise testimise oht on see, et kui see aktsepteeritakse, võib see tunduda tõene. Selle asemel oleks õigem öelda, et nullhüpoteesi ei lükata tagasi, kuna selle ümberlükkamiseks pole piisav alt statistilisi tõendeid.

Statistiline hüpotees, mis testib sobivuskriteeriumide headust
Statistiline hüpotees, mis testib sobivuskriteeriumide headust

See hetk ajab algajad lisad sageli segadusse. Sellisel juhul on oluline endale meelde tuletada, et tulemus on tõenäosuslik ja et isegi nullhüpoteesiga nõustumisel on siiski väike eksimise võimalus.

Tõene või vale nullhüpotees

P väärtuse tõlgendamine ei tähenda seda nullihüpotees on õige või vale. See tähendab, et empiiriliste andmete ja valitud statistilise testi põhjal on tehtud valik nullhüpoteesi tagasilükkamise või mittelükkamise kohta teatud statistilise olulisuse tasemel. Seetõttu võib p-väärtust pidada statistilistesse testidesse sisestatud etteantud eeldusel antud andmete tõenäosuseks. P-väärtus näitab, kui tõenäoline on andmevalimi vaatlemine, kui nullhüpotees on tõene.

Kriitiliste väärtuste tõlgendamine

Mõned testid ei tagasta lk. Selle asemel võivad nad tagastada kriitiliste väärtuste loendi. Sellise uuringu tulemusi tõlgendatakse sarnaselt. Selle asemel, et võrrelda ühte p-väärtust ettemääratud olulisuse tasemega, võrreldakse testi statistikat kriitilise väärtusega. Kui see osutub väiksemaks, tähendab see, et nullhüpoteesi ei olnud võimalik ümber lükata. Kui see on suurem või võrdne, tuleb nullhüpotees tagasi lükata. Statistilise hüpoteesi testimise algoritmi tähendus ja selle tulemuse tõlgendamine on sarnane p-väärtusega. Valitud olulisuse tase on tõenäosuslik otsus lükata tagasi või mitte lükata tagasi andmete alusel põhitesti eeldus.

Vead statistilistes testides

Statistilise hüpoteesi testi tõlgendus on tõenäosuslik. Statistiliste hüpoteeside kontrollimise ülesanne ei ole leida õiget või vale väidet. Testi tõendid võivad olla ekslikud. Näiteks kui alfa oli 5%, tähendab see, et enamasti 1 20-stnullhüpotees lükatakse kogemata tagasi. Või ei juhtu seda andmevalimis esineva statistilise müra tõttu. Seda punkti arvestades võib väike p väärtus nullhüpoteesi tagasilükkamiseks tähendada, et see on vale või on tehtud viga. Kui seda tüüpi viga tehakse, nimetatakse tulemust valepositiivseks. Ja selline viga on statistiliste hüpoteeside kontrollimisel esimest tüüpi viga. Teisest küljest, kui p-väärtus on piisav alt suur, et tähendada nullhüpoteesi tagasilükkamist, võib see tähendada, et see on tõsi. Või ei ole õige ja toimus mõni ebatõenäoline sündmus, mille tõttu viga tehti. Seda tüüpi viga nimetatakse valenegatiivseks.

Nullhüpoteeside statistiline testimine
Nullhüpoteeside statistiline testimine

Vigade tõenäosus

Statistiliste hüpoteeside testimisel on endiselt võimalus teha seda tüüpi vigu. Valed andmed või valed järeldused on üsna tõenäolised. Ideaalis tuleks valida olulisuse tase, mis minimeerib ühe sellise vea tõenäosust. Näiteks nullhüpoteeside statistilisel testimisel võib olla väga madal olulisuse tase. Kuigi olulisuse tasemed, nagu 0,05 ja 0,01, on levinud paljudes teadusvaldkondades, on kõige sagedamini kasutatav olulisuse tase 310^-7 ehk 0,0000003. Seda nimetatakse sageli 5-sigmaks. See tähendab, et järeldus oli juhuslik, tõenäosusega 1 3,5 miljonist katsete sõltumatust kordusest. Statistiliste hüpoteeside testimise näited sisaldavad sageli selliseid vigu. See on ka põhjus, miks on oluline saada sõltumatuid tulemusi.kinnitamine.

Näited statistilise kontrolli kasutamise kohta

Hüpoteeside testimise praktikas on mitu levinud näidet. Üks populaarsemaid on tuntud kui tee degusteerimine. Biomeetria asutaja Robert Fisheri kolleeg dr Muriel Bristol väitis, et oskab kindl alt öelda, kas see lisati esm alt tassi teele või piimale. Fisher pakkus, et annab talle juhuslikult kaheksa tassi (neli igast sordist). Testi statistika oli lihtne: lugedes korda, kui palju õnnestusid karika valikul. Kriitiline piirkond oli 4-st ainus õnnestumine, mis põhines tõenäoliselt tavalisel tõenäosuskriteeriumil (< 5%; 1:70 ≈ 1,4%). Fisher väitis, et alternatiivset hüpoteesi pole vaja. Daam tuvastas iga tassi õigesti, mida peeti statistiliselt oluliseks tulemuseks. See kogemus viis Fisheri raamatuni Statistilised meetodid teadlastele.

Kostja näide

Statistiline kohtumenetlus on võrreldav kriminaalkohtuga, kus süüdistatavat peetakse süütuks seni, kuni tema süü pole tõestatud. Prokurör püüab kohtualuse süüd tõendada. Kostja saab süüdi tunnistada ainult siis, kui süüdistuse esitamiseks on piisav alt tõendeid. Menetluse alguses on kaks hüpoteesi: "Kostja ei ole süüdi" ja "Kostja on süüdi". Süütuse hüpoteesi saab tagasi lükata ainult siis, kui eksimine on väga ebatõenäoline, kuna ei taheta süütut süüdistatavat süüdi mõista. Sellist viga nimetatakse I tüüpi veaks ja selle esinemistharva kontrollitud. Sellise asümmeetrilise käitumise tagajärjel esineb sagedamini II tüüpi viga, st kurjategija õigeksmõistmist.

Statistilise valideerimise näited
Statistilise valideerimise näited

Statistika on kasulik suurte andmemahtude analüüsimisel. See kehtib ka hüpoteeside kontrollimise kohta, mis võivad järeldusi õigustada isegi siis, kui teaduslikku teooriat ei eksisteeri. Teemaitsmise näite puhul oli "ilmne", et ei olnud vahet, kas valada teesse piima või valada tee piima.

Hüpoteeside testimise tegelik praktiline rakendus hõlmab järgmist:

  • testimine, kas mehed näevad õudusunenägusid rohkem kui naised;
  • dokumendi omistamine;
  • Täiskuu mõju hindamine käitumisele;
  • vahemiku määramine, millest nahkhiir suudab putukat kaja abil tuvastada;
  • parimate vahendite valimine suitsetamisest loobumiseks;
  • Kontrollimine, kas kaitseraua kleebised peegeldavad autoomaniku käitumist.

Statistiliste hüpoteeside testimine mängib statistikas üldiselt ja statistiliste järelduste tegemisel olulist rolli. Väärtustestimist kasutatakse teadusliku meetodi keskmes traditsioonilise prognoositud väärtuse ja katsetulemuste võrdlemise asendajana. Kui teooria on võimeline ennustama ainult seose märki, saab suunatud hüpoteesi testid konfigureerida nii, et ainult statistiliselt oluline tulemus toetab teooriat. See hindamisteooria vorm on kõige jäigemkriitika hüpoteeside testimise kasutamise kohta.

Soovitan: