Bayesian ქსელები: განმარტება, მაგალითები და როგორ მუშაობს ისინი

Სარჩევი:

Bayesian ქსელები: განმარტება, მაგალითები და როგორ მუშაობს ისინი
Bayesian ქსელები: განმარტება, მაგალითები და როგორ მუშაობს ისინი
Anonim

რწმენა, გადაწყვეტილების ქსელი, ბაიესის (იან) მოდელი ან ალბათობით მართული აციკლური გრაფიკის მოდელი არის ვარიანტის სქემა (სტატისტიკური მოდელის ტიპი), რომელიც წარმოადგენს ცვლადების ერთობლიობას და მათ პირობით დამოკიდებულებებს მიმართული აციკლური გრაფიკის (DAG) მეშვეობით.).

მაგალითად, ბაიესის ქსელს შეუძლია წარმოადგინოს ალბათური ურთიერთობა დაავადებებსა და სიმპტომებს შორის. ამ უკანასკნელის გათვალისწინებით, ქსელის გამოყენება შესაძლებელია სხვადასხვა დაავადების არსებობის შესაძლებლობის გამოსათვლელად. ქვემოთ მოცემულ ვიდეოში შეგიძლიათ იხილოთ ბაიესის რწმენის ქსელის მაგალითი გამოთვლებით.

Image
Image

ეფექტურობა

ეფექტურ ალგორითმებს შეუძლიათ შეასრულონ დასკვნა და სწავლა ბაიესის ქსელებზე. ქსელებს, რომლებიც აყალიბებენ ცვლადებს (როგორიცაა მეტყველების სიგნალები ან პროტეინის თანმიმდევრობა) დინამიური ქსელები ეწოდება. ბაიესის ქსელების განზოგადებებს, რომლებსაც შეუძლიათ პრობლემების წარმოდგენა და გადაჭრა გაურკვევლობის პირობებში, ეწოდება გავლენის დიაგრამები.

არსი

ფორმალურადBayesian ქსელები არის DAG-ები, რომელთა კვანძები წარმოადგენენ ცვლადებს ბაიესის გაგებით: ისინი შეიძლება იყოს დაკვირვებული მნიშვნელობები, ფარული ცვლადები, უცნობი პარამეტრები ან ჰიპოთეზები. იმიტომ რომ ძალიან საინტერესოა.

ბაიესის ქსელის მაგალითი

ორმა მოვლენამ შეიძლება გამოიწვიოს ბალახის დასველება: აქტიური გამფრქვევი ან წვიმა. წვიმა პირდაპირ გავლენას ახდენს სპრინკლერის გამოყენებაზე (კერძოდ, წვიმის დროს ის ჩვეულებრივ უმოქმედოა). ამ სიტუაციის მოდელირება შესაძლებელია ბაიესის ქსელის გამოყენებით.

ტიპიური ფორმულა
ტიპიური ფორმულა

სიმულაცია

იმის გამო, რომ ბაიესის ქსელი არის სრული მოდელი მისი ცვლადებისა და მათი ურთიერთობებისთვის, ის შეიძლება გამოყენებულ იქნას მათ შესახებ სავარაუდო შეკითხვებზე პასუხის გასაცემად. მაგალითად, ის შეიძლება გამოყენებულ იქნას ცვლადების ქვეჯგუფის მდგომარეობის შესახებ ცოდნის გასაახლებლად, როდესაც დაკვირვებულია სხვა მონაცემები (მტკიცებულების ცვლადები). ამ საინტერესო პროცესს ალბათობითი დასკვნა ეწოდება.

A posteriori იძლევა საყოველთაოდ საკმარის სტატისტიკას აღმოჩენის აპლიკაციებისთვის ცვლადების ქვეჯგუფისთვის მნიშვნელობების არჩევისას. ამრიგად, ეს ალგორითმი შეიძლება ჩაითვალოს ბეიზის თეორემის კომპლექსურ ამოცანებზე ავტომატურად გამოყენების მექანიზმად. სტატიის სურათებში შეგიძლიათ იხილოთ ბაიესის რწმენის ქსელების მაგალითები.

პრაქტიკული ბაიესის ქსელი
პრაქტიკული ბაიესის ქსელი

გამოტანის მეთოდები

ზუსტი დასკვნის ყველაზე გავრცელებული მეთოდებია: ცვლადის აღმოფხვრა, რომელიც გამორიცხავს (ინტეგრაციით ან შეჯამებით) დაუკვირვებადს.არა-მოკითხვის პარამეტრები სათითაოდ პროდუქტზე თანხის გამოყოფით.

დააწკაპუნეთ "ხის" გავრცელებაზე, რომელიც ქეშირებს გამოთვლებს ისე, რომ შესაძლებელი იყოს მრავალი ცვლადის მოთხოვნა ერთდროულად და ახალი მტკიცებულებების სწრაფად გავრცელება; და რეკურსიული შესატყვისი და/ან ძიება, რომელიც საშუალებას იძლევა გაცვლა სივრცესა და დროს შორის და ემთხვევა ცვლადის აღმოფხვრის ეფექტურობას, როდესაც საკმარისი სივრცეა გამოყენებული.

ყველა ამ მეთოდს აქვს განსაკუთრებული სირთულე, რომელიც ექსპონენტურად დამოკიდებულია ქსელის სიგრძეზე. ყველაზე გავრცელებული სავარაუდო დასკვნის ალგორითმებია მინი-სეგმენტის აღმოფხვრა, ციკლური რწმენის გავრცელება, განზოგადებული რწმენის გავრცელება და ვარიაციული მეთოდები.

ქსელების ტიპები
ქსელების ტიპები

ქსელი

ბეიესის ქსელის სრულად დასაზუსტებლად და ამგვარად ერთობლივი ალბათობის განაწილების სრულად წარმოსადგენად, აუცილებელია თითოეული კვანძისთვის X-ისთვის განისაზღვროს ალბათობის განაწილება X-ის მშობლების გამო.

X-ის განაწილებას მისი მშობლების მიერ პირობითად შეიძლება ჰქონდეს ნებისმიერი ფორმა. ჩვეულებრივია მუშაობა დისკრეტულ ან გაუსიან განაწილებებთან, რადგან ეს ამარტივებს გამოთვლებს. ზოგჯერ ცნობილია მხოლოდ განაწილების შეზღუდვები. შემდეგ შეგიძლიათ გამოიყენოთ ენტროპია ერთი განაწილების დასადგენად, რომელსაც აქვს უმაღლესი ენტროპია შეზღუდვების გათვალისწინებით.

ანალოგიურად, დინამიური ბაიესის ქსელის სპეციფიკურ კონტექსტში, პირობითი განაწილება ლატენტის დროებითი ევოლუციისთვისმდგომარეობა ჩვეულებრივ დაყენებულია ნაგულისხმევი შემთხვევითი პროცესის ენტროპიის სიჩქარის მაქსიმიზაციისთვის.

ნდობის ბაიესის ქსელი
ნდობის ბაიესის ქსელი

ალბათობის (ან უკანა ალბათობის) პირდაპირ მაქსიმიზაცია ხშირად სახიფათოა დაუკვირვებელი ცვლადების არსებობის გათვალისწინებით. ეს განსაკუთრებით ეხება ბაიესის გადაწყვეტილების ქსელს.

კლასიკური მიდგომა

ამ პრობლემისადმი კლასიკური მიდგომა არის მოლოდინის მაქსიმიზაციის ალგორითმი, რომელიც ალტერნატიულად აფასებს დაუკვირვებელი ცვლადების მოსალოდნელი მნიშვნელობების დაკვირვებას დაკვირვებულ მონაცემებზე დამოკიდებულს მთლიანი ალბათობის (ან შემდგომი მნიშვნელობის) მაქსიმიზებით, თუ ვივარაუდებთ, რომ ადრე გამოთვლილი მოსალოდნელია. ღირებულებები სწორია. ზომიერი კანონზომიერების პირობებში, ეს პროცესი კონვერგირდება პარამეტრების მაქსიმალურ (ან მაქსიმუმ უკანა) მნიშვნელობებში.

პარამეტრებისადმი უფრო სრულყოფილი ბაიესიანი მიდგომა არის მათი განხილვა, როგორც დამატებითი დაუკვირვებელი ცვლადები და გამოთვალოთ სრული უკანა განაწილება ყველა კვანძზე დაკვირვებული მონაცემების გათვალისწინებით და შემდეგ პარამეტრების ინტეგრირება. ეს მიდგომა შეიძლება იყოს ძვირი და გამოიწვიოს დიდი მოდელები, რაც უფრო ხელმისაწვდომს გახდის კლასიკურ პარამეტრებზე დარეგულირების მიდგომებს.

უმარტივეს შემთხვევაში, ბაიესის ქსელი განისაზღვრება ექსპერტის მიერ და შემდეგ გამოიყენება დასკვნის შესასრულებლად. სხვა აპლიკაციებში, დადგენის ამოცანა ძალიან რთულია ადამიანისთვის. ამ შემთხვევაში, ბაიესის ნერვული ქსელის სტრუქტურა და ლოკალური განაწილების პარამეტრები უნდა ვისწავლოთ მონაცემებს შორის.

ბაიესის ქსელები
ბაიესის ქსელები

ალტერნატიული მეთოდი

სტრუქტურირებული სწავლების ალტერნატიული მეთოდი იყენებს ოპტიმიზაციის ძიებას. ეს მოითხოვს შეფასების ფუნქციისა და ძიების სტრატეგიის გამოყენებას. საერთო შეფასების ალგორითმი არის სტრუქტურის უკანა ალბათობა, მოცემული სასწავლო მონაცემების, როგორიცაა BIC ან BDeu.

დრო, რომელიც საჭიროა ამომწურავი ძიებისთვის, სტრუქტურის დასაბრუნებლად, რომელიც მაქსიმალურ ქულას იძლევა, არის სუპერექსპონენციალური ცვლადების რაოდენობაში. ადგილობრივი ძიების სტრატეგია ცვლის დამატებით ცვლილებებს სტრუქტურის შეფასების გასაუმჯობესებლად. ფრიდმენმა და მისმა კოლეგებმა განიხილეს ცვლადებს შორის ურთიერთ ინფორმაციის გამოყენება სასურველი სტრუქტურის მოსაძებნად. ისინი ზღუდავენ მშობელთა კანდიდატების კომპლექტს k კვანძებით და ეძებენ მათ საფუძვლიანად.

BN ზუსტად შესწავლის განსაკუთრებით სწრაფი მეთოდია პრობლემის წარმოდგენა, როგორც ოპტიმიზაციის პრობლემა და მისი გადაჭრა მთელი რიცხვების პროგრამირების გამოყენებით. აციკლურობის შეზღუდვები ემატება მთელ პროგრამას (IP) ამოხსნის დროს ჭრის სიბრტყეების სახით. ასეთ მეთოდს შეუძლია 100 ცვლადამდე პრობლემების მოგვარება.

გრაფიკები და ქსელები
გრაფიკები და ქსელები

პრობლემის გადაჭრა

ათასობით ცვლადთან დაკავშირებული პრობლემების გადასაჭრელად საჭიროა განსხვავებული მიდგომა. ერთი არის ჯერ ერთი შეკვეთის არჩევა და შემდეგ ამ შეკვეთის მიმართ ოპტიმალური BN სტრუქტურის პოვნა. ეს გულისხმობს შესაძლო შეკვეთის საძიებო სივრცეში მუშაობას, რაც მოსახერხებელია, რადგან ის უფრო მცირეა ვიდრე ქსელის სტრუქტურების სივრცე. შემდეგ შეირჩევა და ფასდება რამდენიმე შეკვეთა. ეს მეთოდი აღმოჩნდასაუკეთესო ხელმისაწვდომია ლიტერატურაში, როდესაც ცვლადების რაოდენობა დიდია.

მეორე მეთოდი არის ფოკუსირება რღვევადი მოდელების ქვეკლასზე, რომლებისთვისაც MLE დახურულია. შემდეგ შეგიძლიათ იპოვოთ თანმიმდევრული სტრუქტურა ასობით ცვლადისთვის.

სამი ხაზის შეზღუდული სიგანის მქონე ბაიესის ქსელების შესწავლა აუცილებელია ზუსტი, ინტერპრეტაციადი დასკვნის უზრუნველსაყოფად, რადგან ამ უკანასკნელის ყველაზე უარესი სირთულე არის ექსპონენციალური ხის სიგრძეში k (ექსპონენციალური დროის ჰიპოთეზის მიხედვით). თუმცა, როგორც გრაფიკის გლობალური თვისება, ის მნიშვნელოვნად ზრდის სასწავლო პროცესის სირთულეს. ამ კონტექსტში, K-ხის გამოყენება შესაძლებელია ეფექტური სწავლისთვის.

მოკლე ქსელი
მოკლე ქსელი

განვითარება

ნდობის ბაიესის ქსელის განვითარება ხშირად იწყება DAG G-ის შექმნით ისე, რომ X აკმაყოფილებს ლოკალურ მარკოვის თვისებას G-თან მიმართებაში. ზოგჯერ ეს არის მიზეზობრივი DAG. შეფასებულია თითოეული ცვლადის პირობითი ალბათობის განაწილება მის მშობლებზე G-ში. ხშირ შემთხვევაში, განსაკუთრებით, როდესაც ცვლადები დისკრეტულია, თუ X-ის ერთობლივი განაწილება არის ამ პირობითი განაწილების პროდუქტი, მაშინ X ხდება ბაიესის ქსელი მიმართებაში. გ.

მარკოვის "კვანძის საბანი" არის კვანძების ნაკრები. მარკოვის ქვილთი კვანძს დამოუკიდებლად აქცევს იმავე სახელწოდების კვანძის დანარჩენი ცარიელი ნაწილისგან და საკმარისი ცოდნაა მისი განაწილების გამოსათვლელად. X არის ბაიესური ქსელი G-სთან მიმართებაში, თუ თითოეული კვანძი პირობითად დამოუკიდებელია ყველა სხვა კვანძისგან, მისი მარკოვიანის გათვალისწინებით.საბანი.

გირჩევთ: