Statistiline mudel: meetodi olemus, konstrueerimine ja analüüs

Sisukord:

Statistiline mudel: meetodi olemus, konstrueerimine ja analüüs
Statistiline mudel: meetodi olemus, konstrueerimine ja analüüs
Anonim

Statistiline mudel on matemaatiline projektsioon, mis sisaldab erinevaid eeldusi mõningate näidisandmete genereerimise kohta. Seda terminit esitatakse sageli idealiseeritud kujul.

Statistilises mudelis väljendatud eeldused näitavad tõenäosusjaotuste kogumit. Paljud neist on mõeldud konkreetse teabe kogumi jaotuse õigeks lähendamiseks. Statistilistele mudelitele omased tõenäosusjaotused eristavad projektsiooni teistest matemaatilistest modifikatsioonidest.

Üldprojektsioon

statistilised protsessimudelid
statistilised protsessimudelid

Matemaatiline mudel on süsteemi kirjeldus, kasutades teatud mõisteid ja keelt. Need kehtivad loodusteadustes (nagu füüsika, bioloogia, maateadus, keemia) ja inseneriteadustes (nagu arvutiteadus, elektrotehnika), aga ka sotsia alteadustes (nt majandus, psühholoogia, sotsioloogia, politoloogia).

Mudel võib aidata selgitada süsteemi jauurige erinevate komponentide mõju ja ennustage käitumist.

Matemaatilistel mudelitel võib olla palju vorme, sealhulgas dünaamilisi süsteeme, statistilisi projektsioone, diferentsiaalvõrrandeid või mänguteoreetilisi parameetreid. Need ja muud tüübid võivad kattuda ning see mudel sisaldab palju abstraktseid struktuure. Üldiselt võivad matemaatilised projektsioonid sisaldada ka loogilisi komponente. Paljudel juhtudel sõltub teadusvaldkonna kvaliteet sellest, kui hästi on teoreetiliselt välja töötatud matemaatilised mudelid korduvate katsete tulemustega kooskõlas. Kooskõla puudumine teoreetiliste protsesside ja eksperimentaalsete mõõtmiste vahel viib sageli oluliste edusammudeni paremate teooriate väljatöötamisel.

Füüsikalistes teadustes sisaldab traditsiooniline matemaatiline mudel suurt hulka järgmisi elemente:

  • Juhtvõrrandid.
  • Täiendavad alammudelid.
  • Defineerige võrrandid.
  • Koostisvõrrandid.
  • Eeldused ja piirangud.
  • Alg- ja piirtingimused.
  • Klassikalised piirangud ja kinemaatilised võrrandid.

Valem

Statistiline mudel määratakse reeglina matemaatiliste võrranditega, mis ühendavad ühte või mitut juhuslikku muutujat ja võimalusel ka muid looduslikult esinevaid muutujaid. Sarnaselt peetakse projektsiooni "kontseptsiooni formaalseks kontseptsiooniks".

Kõik statistiliste hüpoteeside testimised ja statistilised hinnangud saadakse matemaatilistest mudelitest.

Sissejuhatus

statistilised matemaatilised mudelid
statistilised matemaatilised mudelid

Mitteametlikult võib statistilist mudelit vaadelda kui kindla omadusega oletust (või eelduste kogumit): see võimaldab arvutada mis tahes sündmuse tõenäosust. Vaatleme näiteks tavalist kuuepoolset täringut. Luu kohta tuleb uurida kahte erinevat statistilist eeldust.

Esimene eeldus on:

Iga täringu puhul on tõenäosus saada üks arvudest (1, 2, 3, 4, 5 ja 6): 1/6.

Sellest eeldusest lähtudes saame arvutada mõlema täringu tõenäosuse: 1:1/6×1/6=1/36.

Üldisem alt saate arvutada mis tahes sündmuse tõenäosuse. Siiski tuleb mõista, et ühegi teise mittetriviaalse sündmuse tõenäosust on võimatu arvutada.

Ainult esimene arvamus kogub statistilise matemaatilise mudeli: tänu sellele, et ainult ühe eeldusega on võimalik määrata iga tegevuse tõenäosus.

Ül altoodud näidises esialgse loaga on sündmuse võimalikkust lihtne kindlaks teha. Mõne muu näite puhul võib arvutamine osutuda keeruliseks või isegi ebareaalseks (näiteks võib see nõuda mitu aastat arvutusi). Statistilise analüüsi mudelit koostava inimese jaoks peetakse sellist keerukust vastuvõetamatuks: arvutuste teostamine ei tohiks olla praktiliselt võimatu ja teoreetiliselt võimatu.

Ametlik määratlus

Matemaatikas vaadeldakse süsteemi statistilist mudelit tavaliselt paarina (S, P), kus S onvõimalike vaatluste hulk, st valimiruum, ja P on tõenäosusjaotuste kogum S.

Selle määratluse intuitsioon on järgmine. Eeldatakse, et teatud andmeid genereeriv protsess on "tõeline" tõenäosusjaotus.

Set

Tema määrab mudeli parameetrid. Parameetrite määramine nõuab üldiselt erinevaid väärtusi, et saada erinevad jaotused, st

Mudeli tagajärg
Mudeli tagajärg

peab hoidma (teisisõnu, see peab olema süstiv). Nõudele vastavat parameetrit peetakse tuvastatavaks.

Näide

Statistika graafik
Statistika graafik

Oletame, et on teatud hulk erinevas vanuses õpilasi. Lapse pikkus on stohhastiliselt seotud sünniaastaga: näiteks kui koolipoiss on 7-aastane, mõjutab see kasvu tõenäosust, ainult nii, et inimene on pikem kui 3 sentimeetrit.

Selle lähenemisviisi saate vormistada sirgjooneliseks regressioonimudeliks, näiteks järgmiselt: kõrgus i=b 0 + b 1agei + εi, kus b 0 on ristmik, b 1 on parameeter, mille võrra vanus kõrgusseire hankimisel korrutatakse. See on veatermin. See tähendab, et see eeldab, et pikkus ennustatakse vanuse järgi teatud veaga.

Kehtiv vorm peab ühtima kõigi teabepunktidega. Seega ei ole sirgjooneline suund (tase i=b 0 + b 1agei) võimeline olema andmemudeli võrrand - kui see ei vasta selgelt absoluutselt kõigile punktidele. Steranditult on kogu teave veatult paigas. Veapiir εi tuleb võrrandisse sisestada nii, et vorm ühtiks absoluutselt kõigi andmetega.

Statistilise järelduse tegemiseks peame esm alt eeldama ε i tõenäosusjaotust. Näiteks võib eeldada, et ε i jaotustel on Gaussi kuju, mille keskmine väärtus on null. Sel juhul on mudelil 3 parameetrit: b 0, b 1 ja Gaussi jaotuse dispersioon.

Võite formaalselt määrata mudeli kujul (S, P).

Selles näites määratletakse mudel S-i määramisega ja seega saab P kohta teha mõned eeldused. On kaks võimalust:

Seda kasvu saab ligikaudselt hinnata vanuse lineaarse funktsiooniga;

Et lähenduse vead jaotuvad nagu Gaussi sees.

Üldised märkused

Mudelite statistilised parameetrid on matemaatilise projektsiooni eriklass. Mille poolest üks liik teisest erineb? Seega on statistiline mudel mittedeterministlik. Seega pole selles erinev alt matemaatilistest võrranditest teatud muutujatel kindlaid väärtusi, vaid neil on võimaluste jaotus. See tähendab, et üksikuid muutujaid peetakse stohhastilisteks. Ül altoodud näites on ε stohhastiline muutuja. Ilma selleta oleks projektsioon deterministlik.

Tihti kasutatakse statistilise mudeli koostamist, isegi kui materjali protsessi peetakse deterministlikuks. Näiteks müntide loopimine on põhimõtteliselt ettemäärav tegevus. Siiski on see enamikul juhtudel ikkagi modelleeritud stohhastiliseks (Bernoulli protsessi kaudu).

Konishi ja Kitagawa sõnul on statistilisel mudelil kolm eesmärki:

  • Ennustused.
  • Teabe kaevandamine.
  • Stohhastiliste struktuuride kirjeldus.

Projitsatsiooni suurus

Oletame, et on olemas statistiline ennustusmudel, Mudelit nimetatakse parameetriliseks, kui O-l on lõplik mõõde. Lahenduses peate kirjutama, et

Mudeli erinevus
Mudeli erinevus

kus k on positiivne täisarv (R tähistab mis tahes reaalarve). Siin nimetatakse k-d mudeli mõõtmeks.

Näiteks võime eeldada, et kõik andmed pärinevad ühemuutujast Gaussi jaotusest:

Statistika valem
Statistika valem

Selles näites on k mõõde 2.

Ja veel ühe näitena võib eeldada, et andmed koosnevad (x, y) punktidest, mis eeldatakse olevat jaotatud sirgjooneliselt Gaussi jääkidega (null keskmisega). Siis on statistilise majandusmudeli dimensioon võrdne 3-ga: sirge lõikekoht, selle kalle ja jääkide jaotuse dispersioon. Tuleb märkida, et geomeetrias on sirge mõõde 1.

Kuigi ül altoodud väärtus on tehniliselt ainus parameeter, millel on dimensioon k, arvatakse mõnikord, et see sisaldab k erinevat väärtust. Näiteks ühemõõtmelise Gaussi jaotuse korral on O ainus parameeter, mille suurus on 2, kuid mõnikord peetakse seda kaheks.individuaalne parameeter – keskmine väärtus ja standardhälve.

Statistiline protsessimudel on mitteparameetriline, kui O väärtuste hulk on lõpmatu mõõtmega. See on ka poolparameetriline, kui sellel on nii lõpliku kui ka lõpmatu mõõtmega parameetrid. Formaalselt, kui k on O dimensioon ja n on valimite arv, on poolparameetrilistel ja mitteparameetrilistel mudelitel

Mudel valem
Mudel valem

siis on mudel poolparameetriline. Vastasel juhul on projektsioon mitteparameetriline.

Parameetrilised mudelid on kõige sagedamini kasutatav statistika. Poolparameetriliste ja mitteparameetriliste projektsioonide kohta ütles Sir David Cox:

"Tavaliselt sisaldavad need kõige vähem hüpoteese tekstuuri ja jaotuskuju kohta, kuid sisaldavad võimsaid teooriaid iseseisvuse kohta."

Pesastatud mudelid

Ärge ajage neid segamini mitmetasandiliste projektsioonidega.

Kaks statistilist mudelit on pesastatud, kui esimese saab teisendada teiseks, kehtestades esimese parameetritele piirangud. Näiteks kõigi Gaussi jaotuste komplektil on pesastatud nullkeskmiste jaotuste kogum:

See tähendab, et nullkeskmise jaotuse saamiseks peate piirama kõigi Gaussi jaotuste hulga keskmist. Teise näitena on ruutmudelil y=b 0 + b 1 x + b 2 x 2 + ε, ε ~N (0, σ 2) manustatud lineaarne mudel y=b 0 + b 1 x + ε, ε ~ N (0,σ 2) – st parameeter b2 võrdub 0.

Mõlemas näites on esimesel mudelil suurem mõõtmed kui teisel mudelil. See on sageli, kuid mitte alati nii. Teine näide on positiivse keskmisega Gaussi jaotuste kogum, mille mõõde on 2.

Mudelite võrdlus

statistiline mudel
statistiline mudel

Eeldatakse, et vaadeldud andmete aluseks on "tõene" tõenäosusjaotus, mille on esile kutsunud selle genereerinud protsess.

Ja ka mudeleid saab omavahel võrrelda, kasutades uurimuslikku analüüsi või kinnitavat. Uurimusliku analüüsi käigus formuleeritakse erinevad mudelid ja antakse hinnang, kui hästi igaüks neist andmeid kirjeldab. Kinnitusanalüüsis võrreldakse eelnev alt sõnastatud hüpoteesi algse hüpoteesiga. Selle ühised kriteeriumid on P 2, Bayesi tegur ja suhteline tõenäosus.

Konishi ja Kitagawa mõte

„Enamik probleeme statistilises matemaatilises mudelis võib käsitleda ennustavate küsimustena. Need on tavaliselt sõnastatud mitme teguri võrdlusena.”

Lisaks ütles Sir David Cox: "Teema tõlkes on statistilise mudeli probleem sageli analüüsi kõige olulisem osa."

Soovitan: