Bayesi võrgud: määratlused, näited ja nende tööpõhimõte

2026 Autor: Angel Austin | [email protected]. Viimati modifitseeritud: 2025-01-23 12:24:19

Uskumus, otsustusvõrgustik, Bayesi (ian) mudel või tõenäosuslikult juhitud atsüklilise graafi mudel on variantskeem (statistilise mudeli tüüp), mis esindab muutujate kogumit ja nende tingimuslikke sõltuvusi suunatud atsüklilise graafiku (DAG) kaudu.).

Näiteks Bayesi võrk võib kujutada tõenäosuslikke seoseid haiguste ja sümptomite vahel. Arvestades viimast, saab võrku kasutada erinevate haiguste esinemise võimaluse arvutamiseks. Allolevas videos näete näidet Bayesi uskumuste võrgustikust koos arvutustega.

Tõhusus

Tõhusad algoritmid võivad Bayesi võrkudes teha järeldusi ja õppida. Võrke, mis modelleerivad muutujaid (nagu kõnesignaalid või valgujärjestused), nimetatakse dünaamilisteks võrkudeks. Bayesi võrkude üldistusi, mis suudavad esitada ja lahendada probleeme määramatuse tingimustes, nimetatakse mõjudiagrammideks.

Essence

AmetlikultBayesi võrgud on DAG-id, mille sõlmed esindavad muutujaid Bayesi tähenduses: need võivad olla vaadeldavad väärtused, peidetud muutujad, tundmatud parameetrid või hüpoteesid. Sest see on väga huvitav.

Bayesi võrgu näide

Kaks sündmust võivad põhjustada muru märjaks saamist: aktiivne vihm või vihm. Vihm mõjutab otseselt vihmuti kasutamist (nimelt see, et kui sajab, on vihm tavaliselt passiivne). Seda olukorda saab modelleerida Bayesi võrgu abil.

Simulatsioon

Kuna Bayesi võrk on oma muutujate ja nende suhete täielik mudel, saab seda kasutada nende kohta esitatavatele tõenäosuspäringutele vastamiseks. Näiteks saab seda kasutada teadmiste värskendamiseks muutujate alamhulga oleku kohta, kui vaadeldakse muid andmeid (tõendusmuutujaid). Seda huvitavat protsessi nimetatakse tõenäosuslikuks järelduseks.

A posteriori annab muutujate alamhulga väärtuste valimisel avastusrakenduste jaoks universaalselt piisava statistika. Seega võib seda algoritmi pidada mehhanismiks Bayesi teoreemi automaatseks rakendamiseks keerukatele probleemidele. Artiklis olevatel piltidel näete näiteid Bayesi uskumuste võrgustikest.

Väljundmeetodid

Kõige levinumad täpsed järeldamismeetodid on: muutuja elimineerimine, mis kõrvaldab (integreerimise või summeerimise teel) mittejälgitavamittepäringu parameetrid ükshaaval, määrates tootele summa.

Klõpsake arvutuste vahemällu salvestava "puu" levitamist, nii et päringuid saab teha paljude muutujate kohta korraga ja uusi tõestusi kiiresti levitada; ja rekursiivne sobitamine ja/või otsing, mis võimaldavad kompromisse ruumi ja aja vahel ning vastavad muutujate elimineerimise efektiivsusele, kui kasutatakse piisav alt ruumi.

Kõigil neil meetoditel on eriline keerukus, mis sõltub eksponentsiaalselt võrgu pikkusest. Kõige tavalisemad ligikaudsed järeldusalgoritmid on minisegmendi elimineerimine, tsükliline uskumuste levitamine, üldistatud uskumuste levitamine ja variatsioonimeetodid.

Võrgundus

Bayesi võrgu täielikuks täpsustamiseks ja seega ühise tõenäosusjaotuse täielikuks esitamiseks on vaja iga sõlme X jaoks määrata X tõenäosusjaotus, mis tuleneb X vanematest.

X-i tingimuslik jaotus vanemate poolt võib olla mis tahes kujul. Diskreetsete või Gaussi jaotustega töötamine on tavaline, kuna see lihtsustab arvutusi. Mõnikord on teada ainult levitamispiirangud. Seejärel saate entroopia abil määrata üksiku jaotuse, millel on piiranguid arvestades suurim entroopia.

Samamoodi dünaamilise Bayesi võrgu spetsiifilises kontekstis on latentse võrgustiku ajalise arengu tingimuslik jaotusolek seatakse tavaliselt eeldatud juhusliku protsessi entroopiakiiruse maksimeerimiseks.

Tõenäosuse (või tagumise tõenäosuse) otsene maksimeerimine on jälgimata muutujate olemasolu tõttu sageli keeruline. See kehtib eriti Bayesi otsustusvõrgustiku kohta.

Klassikaline lähenemine

Selle probleemi klassikaline lähenemine on ootuste maksimeerimise algoritm, mis vaheldumisi arvutab vaadeldavatest andmetest sõltuvate jälgimata muutujate eeldatavad väärtused kogu tõenäosuse (või tagumise väärtuse) maksimeerimisega, eeldades, et eelnev alt arvutatud eeldatav väärtused on õiged. Mõõduka regulaarsuse tingimustes läheneb see protsess parameetrite maksimaalsetele (või maksimaalsetele a posteriori) väärtustele.

Täielikum Bayesi lähenemine parameetritele on käsitleda neid täiendavate mittevaatlevate muutujatena ja arvutada vaadeldud andmete põhjal kõigi sõlmede täielik tagumine jaotus ning seejärel integreerida parameetrid. Selline lähenemine võib olla kulukas ja tulemuseks on suured mudelid, mis muudab klassikalise parameetrite häälestamise lähenemisviisid kättesaadavamaks.

Lihtsamal juhul määrab ekspert Bayesi võrgu ja seda kasutatakse seejärel järelduste tegemiseks. Teistes rakendustes on määramisülesanne inimese jaoks liiga raske. Sel juhul tuleb andmete hulgast õppida Bayesi närvivõrgu struktuur ja lokaalsete jaotuste parameetrid.

Alternatiivne meetod

Struktureeritud õppe alternatiivne meetod kasutab optimeerimisotsingut. See eeldab hindamisfunktsiooni ja otsingustrateegia rakendamist. Levinud hindamisalgoritm on treeningandmete, näiteks BIC või BDeu, struktuuri tagumine tõenäosus.

Aeg, mis kulub ammendava otsingu jaoks, mis tagastab skoori maksimeeriva struktuuri, on muutujate arvu poolest ülieksponentsiaalne. Kohaliku otsingu strateegia teeb struktuurihinnangu parandamiseks järkjärgulisi muudatusi. Friedman ja tema kolleegid kaalusid soovitud struktuuri leidmiseks muutujate vahelise vastastikuse teabe kasutamist. Need piiravad vanemakandidaatide komplekti k sõlmega ja otsivad neid põhjalikult.

Eriti kiire meetod BN-i täpseks uurimiseks on kujutada probleemi ette optimeerimisülesandena ja lahendada see täisarvprogrammeerimise abil. Atsüklilisuse piirangud lisatakse täisarvuprogrammile (IP) lahendamise käigus lõiketasandite kujul. Selline meetod suudab lahendada probleeme kuni 100 muutujaga.

Probleemi lahendamine

Tuhandete muutujatega probleemide lahendamiseks on vaja teistsugust lähenemist. Üks on kõigepe alt valida üks tellimus ja seejärel leida selle tellimuse jaoks optimaalne BN-struktuur. See eeldab töötamist võimaliku järjestuse otsinguruumis, mis on mugav, kuna on võrgustruktuuride ruumist väiksem. Seejärel valitakse välja ja hinnatakse mitu tellimust. See meetod osutusparim kirjandusest saadaolev, kui muutujate arv on tohutu.

Teine meetod on keskenduda lagunevate mudelite alamklassile, mille jaoks MLE-d on suletud. Seejärel leiate sadade muutujate jaoks ühtse struktuuri.

Täpse ja tõlgendatava järelduse tegemiseks on vajalik Bayesi võrkude uurimine piiratud laiusega kolme joonega, kuna viimase halvimal juhul on keerukus puu pikkuses k eksponentsiaalne (vastav alt eksponentsiaalse aja hüpoteesile). Graafiku globaalse omadusena suurendab see aga oluliselt õppeprotsessi keerukust. Selles kontekstis saab K-puud kasutada tõhusaks õppimiseks.

Arendus

Bayesi usaldusvõrgu arendamine algab sageli DAG G loomisega, nii et X rahuldab G suhtes kohalikku Markovi omadust. Mõnikord on see põhjuslik DAG. Hinnatakse iga muutuja tingimuslikke tõenäosusjaotusi tema vanemate vahel G. Paljudel juhtudel, eriti kui muutujad on diskreetsed, kui X ühisjaotus on nende tingimusjaotuste korrutis, muutub X Bayesi võrguks. G.

Markovi "sõlmetekk" on sõlmede komplekt. Markovi tekk muudab sõlme sõltumatuks samanimelise sõlme ülejäänud toorikust ja on piisavad teadmised selle jaotuse arvutamiseks. X on Bayesi võrk G suhtes, kui iga sõlm on tinglikult sõltumatu kõigist teistest sõlmedest, arvestades selle Markovitekk.