ლოგისტიკური რეგრესია: მოდელი და მეთოდები

Სარჩევი:

ლოგისტიკური რეგრესია: მოდელი და მეთოდები
ლოგისტიკური რეგრესია: მოდელი და მეთოდები
Anonim

ლოგისტიკური რეგრესიისა და დისკრიმინაციული ანალიზის მეთოდები გამოიყენება, როდესაც აუცილებელია რესპონდენტთა მკაფიოდ დიფერენცირება სამიზნე კატეგორიების მიხედვით. ამ შემთხვევაში, თავად ჯგუფები წარმოდგენილია ერთი ცალვარიანტი პარამეტრის დონეებით. მოდით უფრო ახლოს მივხედოთ ლოგისტიკური რეგრესიის მოდელს და გავარკვიოთ, რატომ არის ეს საჭირო.

ლოგისტიკური რეგრესია
ლოგისტიკური რეგრესია

ზოგადი ინფორმაცია

პრობლემის მაგალითი, რომელშიც გამოიყენება ლოგისტიკური რეგრესია, არის რესპონდენტთა კლასიფიკაცია ჯგუფებად, რომლებიც ყიდულობენ და არ ყიდულობენ მდოგვის. დიფერენციაცია ტარდება სოციალურ-დემოგრაფიული მახასიათებლების შესაბამისად. ეს მოიცავს, კერძოდ, ასაკს, სქესს, ნათესავების რაოდენობას, შემოსავალს და ა.შ. ოპერაციებში არსებობს დიფერენცირების კრიტერიუმები და ცვლადი. ეს უკანასკნელი შიფრავს სამიზნე კატეგორიებს, რომლებშიც, ფაქტობრივად, უნდა დაიყოს რესპონდენტები.

ნიუანსები

უნდა ითქვას, რომ შემთხვევების დიაპაზონი, რომლებშიც გამოიყენება ლოგისტიკური რეგრესია, გაცილებით ვიწროა, ვიდრე დისკრიმინაციული ანალიზისთვის. ამასთან დაკავშირებით განიხილება ამ უკანასკნელის, როგორც დიფერენციაციის უნივერსალური მეთოდის გამოყენებაუფრო სასურველია. უფრო მეტიც, ექსპერტები გვირჩევენ კლასიფიკაციის კვლევების დაწყებას დისკრიმინაციული ანალიზით. და მხოლოდ შედეგების შესახებ გაურკვევლობის შემთხვევაში, შეგიძლიათ გამოიყენოთ ლოგისტიკური რეგრესია. ეს საჭიროება გამოწვეულია რამდენიმე ფაქტორით. ლოგისტიკური რეგრესია გამოიყენება მაშინ, როდესაც მკაფიოდ არის გააზრებული დამოუკიდებელი და დამოკიდებული ცვლადების ტიპი. შესაბამისად, შეირჩევა 3 შესაძლო პროცედურისგან ერთ-ერთი. დისკრიმინაციული ანალიზის დროს მკვლევარი ყოველთვის ეხება ერთ სტატიკურ ოპერაციას. იგი მოიცავს ერთ დამოკიდებულ და რამდენიმე დამოუკიდებელ კატეგორიულ ცვლადს ნებისმიერი ტიპის მასშტაბით.

ნახვები

სტატისტიკური კვლევის ამოცანა, რომელიც იყენებს ლოგისტიკური რეგრესიას, არის იმის განსაზღვრა, თუ რა ალბათობა იქნება კონკრეტული რესპონდენტი კონკრეტულ ჯგუფში. დიფერენციაცია ხორციელდება გარკვეული პარამეტრების მიხედვით. პრაქტიკაში, ერთი ან მეტი დამოუკიდებელი ფაქტორის მნიშვნელობების მიხედვით, შესაძლებელია რესპონდენტების ორ ჯგუფად დაყოფა. ამ შემთხვევაში ხდება ბინარული ლოგისტიკური რეგრესია. ასევე, მითითებული პარამეტრები შეიძლება გამოყენებულ იქნას ორზე მეტ ჯგუფებად დაყოფისას. ასეთ სიტუაციაში ხდება მულტინომიალური ლოგისტიკური რეგრესია. მიღებული ჯგუფები გამოიხატება ერთი ცვლადის დონეზე.

ლოგისტიკური რეგრესია
ლოგისტიკური რეგრესია

მაგალითი

ვთქვათ, არის რესპონდენტთა პასუხები კითხვაზე, დაინტერესებულნი არიან თუ არა მოსკოვის გარეუბანში მიწის ნაკვეთის შესყიდვის შეთავაზებით. ვარიანტები არის "არა"და კი. აუცილებელია გაირკვეს, თუ რომელი ფაქტორები ახდენს უპირატეს გავლენას პოტენციური მყიდველების გადაწყვეტილებაზე. ამისათვის რესპონდენტებს უსვამენ კითხვებს ტერიტორიის ინფრასტრუქტურის, დედაქალაქამდე მანძილის, ტერიტორიის ფართობის, საცხოვრებელი კორპუსის არსებობა/არარსებობის შესახებ და ა.შ. ბინარული რეგრესიის გამოყენებით შესაძლებელია განაწილება. რესპონდენტები ორ ჯგუფად. პირველში მოხვდებიან ისინი, ვინც დაინტერესებულია შესყიდვით - პოტენციური მყიდველები და მეორეში, შესაბამისად, ვინც არ არის დაინტერესებული ასეთი შეთავაზებით. გარდა ამისა, თითოეული რესპონდენტისთვის გამოითვლება ამა თუ იმ კატეგორიაში მიკუთვნების ალბათობა.

შედარებითი მახასიათებლები

სხვაობა ზემოთ მოცემული ორი ვარიანტისგან არის ჯგუფების განსხვავებული რაოდენობა და დამოკიდებული და დამოუკიდებელი ცვლადების ტიპი. მაგალითად, ბინარულ რეგრესიაში შესწავლილია დიქოტომიური ფაქტორის დამოკიდებულება ერთ ან რამდენიმე დამოუკიდებელ პირობაზე. უფრო მეტიც, ამ უკანასკნელს შეიძლება ჰქონდეს ნებისმიერი ტიპის მასშტაბი. მრავალწევრი რეგრესია ითვლება ამ კლასიფიკაციის ვარიანტის ვარიაციად. მასში 2-ზე მეტი ჯგუფი ეკუთვნის დამოკიდებულ ცვლადს. დამოუკიდებელ ფაქტორებს უნდა ჰქონდეთ რიგითი ან ნომინალური მასშტაბი.

ლოგისტიკური რეგრესია spss-ში

11-12 სტატისტიკურ პაკეტში დაინერგა ანალიზის ახალი ვერსია - რიგითი. ეს მეთოდი გამოიყენება მაშინ, როდესაც დამოკიდებული ფაქტორი ეკუთვნის იმავე სახელწოდების (რიგობით) სკალას. ამ შემთხვევაში დამოუკიდებელი ცვლადები შეირჩევა ერთი კონკრეტული ტიპისგან. ისინი უნდა იყოს რიგითი ან ნომინალური. კლასიფიკაცია რამდენიმე კატეგორიად ითვლება ყველაზე მეტადუნივერსალური. ეს მეთოდი შეიძლება გამოყენებულ იქნას ყველა კვლევაში, რომელიც იყენებს ლოგისტიკურ რეგრესიას. თუმცა, მოდელის ხარისხის გაუმჯობესების ერთადერთი გზა სამივე ტექნიკის გამოყენებაა.

ადეკვატურობის ხარისხის შემოწმება და ლოგისტიკური რეგრესია
ადეკვატურობის ხარისხის შემოწმება და ლოგისტიკური რეგრესია

რიგი კლასიფიკაცია

უნდა ითქვას, რომ ადრე სტატისტიკურ პაკეტში არ არსებობდა სპეციალიზებული ანალიზის ჩატარების ტიპიური შესაძლებლობა დამოკიდებულ ფაქტორებზე რიგითი მასშტაბით. 2-ზე მეტი ჯგუფის მქონე ყველა ცვლადისთვის გამოყენებული იყო მრავალნომინალური ვარიანტი. შედარებით ცოტა ხნის წინ დანერგილ რიგით ანალიზს აქვს მთელი რიგი მახასიათებლები. ისინი ითვალისწინებენ მასშტაბის სპეციფიკას. იმავდროულად, სასწავლო ინსტრუმენტებში, რიგითი ლოგისტიკური რეგრესია ხშირად არ განიხილება, როგორც ცალკე ტექნიკა. ეს გამოწვეულია შემდეგი ფაქტორებით: რიგით ანალიზს არ აქვს რაიმე მნიშვნელოვანი უპირატესობა მრავალწევრებთან შედარებით. მკვლევარმა შეიძლება გამოიყენოს ეს უკანასკნელი როგორც რიგითი, ისე ნომინალური დამოკიდებული ცვლადის თანდასწრებით. ამავდროულად, თავად კლასიფიკაციის პროცესები თითქმის არ განსხვავდება ერთმანეთისგან. ეს ნიშნავს, რომ რიგითი ანალიზის ჩატარება არ გამოიწვევს რაიმე სირთულეს.

ანალიზის ვარიანტი

მოდით განვიხილოთ მარტივი შემთხვევა - ბინარული რეგრესია. დავუშვათ, მარკეტინგული კვლევის პროცესში ფასდება მოთხოვნა ამა თუ იმ მეტროპოლიტენის კურსდამთავრებულებზე. კითხვარში რესპონდენტებს დაუსვეს კითხვები, მათ შორის:

  1. დასაქმებული ხართ? (ql).
  2. შეიყვანეთ დამთავრების წელი (q 21).
  3. რა არის საშუალოგამოსაშვები ქულა (საშუალო).
  4. სქესი (q22).

ლოგისტიკური რეგრესია შეაფასებს დამოუკიდებელი ფაქტორების ზემოქმედებას, q 21 და q 22 ცვლადზე ql. მარტივად რომ ვთქვათ, ანალიზის მიზანი იქნება კურსდამთავრებულთა სავარაუდო დასაქმების დადგენა დარგის, გამოსაშვები წლის და GPA-ის შესახებ ინფორმაციის საფუძველზე.

ლოგისტიკური სიგმოიდური რეგრესიის მაჩვენებელი
ლოგისტიკური სიგმოიდური რეგრესიის მაჩვენებელი

ლოგისტიკური რეგრესია

ორობითი რეგრესიის გამოყენებით პარამეტრების დასაყენებლად გამოიყენეთ Analyze►Regression►Binary Logistic მენიუ. Logistic Regression ფანჯარაში აირჩიეთ დამოკიდებული ფაქტორი მარცხნივ არსებული ცვლადების სიიდან. ეს არის ql. ეს ცვლადი უნდა განთავსდეს Dependent ველში. ამის შემდეგ აუცილებელია დამოუკიდებელი ფაქტორების შეყვანა კოვარიატების ნაკვეთში - q 21, q 22, aver. შემდეგ თქვენ უნდა აირჩიოთ, თუ როგორ შეიტანოთ ისინი თქვენს ანალიზში. თუ დამოუკიდებელი ფაქტორების რაოდენობა 2-ზე მეტია, მაშინ გამოიყენება ნაგულისხმევად დაყენებული ყველა ცვლადის ერთდროული შეყვანის მეთოდი, მაგრამ ეტაპობრივად. ყველაზე პოპულარული გზაა Backward:LR. არჩევის ღილაკის გამოყენებით შეგიძლიათ კვლევაში ჩართოთ არა ყველა რესპონდენტი, არამედ მხოლოდ კონკრეტული სამიზნე კატეგორია.

განსაზღვრეთ კატეგორიული ცვლადები

კატეგორიული ღილაკი უნდა იყოს გამოყენებული, როდესაც ერთ-ერთი დამოუკიდებელი ცვლადი ნომინალურია 2-ზე მეტი კატეგორიით. ამ სიტუაციაში, Define Categorical Variables ფანჯარაში, სწორედ ასეთი პარამეტრი მოთავსებულია კატეგორიული კოვარიატების განყოფილებაში. ამ მაგალითში ასეთი ცვლადი არ არის. ამის შემდეგ, ჩამოსაშლელ სიაში კონტრასტი მოჰყვებააირჩიეთ Deviation ელემენტი და დააჭირეთ ღილაკს შეცვლა. შედეგად, თითოეული ნომინალური ფაქტორიდან რამდენიმე დამოკიდებული ცვლადი ჩამოყალიბდება. მათი რიცხვი შეესაბამება საწყისი მდგომარეობის კატეგორიების რაოდენობას.

ახალი ცვლადების შენახვა

შენახვის ღილაკის გამოყენებით კვლევის მთავარ დიალოგურ ფანჯარაში დაყენებულია ახალი პარამეტრების შექმნა. ისინი შეიცავენ რეგრესიის პროცესში გამოთვლილ მაჩვენებლებს. კერძოდ, შეგიძლიათ შექმნათ ცვლადები, რომლებიც განსაზღვრავენ:

  1. მიკუთვნება კონკრეტულ კლასიფიკაციის კატეგორიას (ჯგუფის წევრობა).
  2. თითოეულ სასწავლო ჯგუფში რესპონდენტის მინიჭების ალბათობა (ალბათობები).

ღილაკის ოფციების გამოყენებისას მკვლევარი არ იღებს რაიმე მნიშვნელოვან ვარიანტს. შესაბამისად, მისი იგნორირება შეიძლება. ღილაკზე "OK" დაჭერის შემდეგ, ანალიზის შედეგები გამოჩნდება მთავარ ფანჯარაში.

ლოგისტიკური რეგრესიის კოეფიციენტი
ლოგისტიკური რეგრესიის კოეფიციენტი

ხარისხის შემოწმება ადეკვატურობისა და ლოგისტიკური რეგრესიისთვის

გაითვალისწინეთ ომნიბუსის ტესტების მოდელის კოეფიციენტების ცხრილი. ის აჩვენებს მოდელის მიახლოების ხარისხის ანალიზის შედეგებს. გამომდინარე იქიდან, რომ დაყენებულია ნაბიჯ-ნაბიჯ ვარიანტი, თქვენ უნდა გადახედოთ ბოლო ეტაპის შედეგებს (ნაბიჯი 2). დადებითი შედეგი ჩაითვლება, თუ ჩი-კვადრატის ინდიკატორის ზრდა დაფიქსირდა მნიშვნელობის მაღალი ხარისხით შემდეგ ეტაპზე გადასვლისას (Sig. < 0.05). მოდელის ხარისხი ფასდება მოდელის ხაზში. თუ უარყოფითი მნიშვნელობა მიიღება, მაგრამ ის არ ითვლება მნიშვნელოვნად მოდელის საერთო მაღალი მატერიალურობით, ეს უკანასკნელიშეიძლება ჩაითვალოს პრაქტიკულად შესაფერისად.

მაგიდები

მოდელის შეჯამება შესაძლებელს ხდის შეფასდეს მთლიანი დისპერსიული ინდექსი, რომელიც აღწერილია აგებული მოდელით (R Square ინდექსი). რეკომენდირებულია ნაგელკერის მნიშვნელობის გამოყენება. Nagelkerke R Square პარამეტრი შეიძლება ჩაითვალოს დადებით ინდიკატორად, თუ ის 0.50-ზე მეტია. ამის შემდეგ ხდება კლასიფიკაციის შედეგების შეფასება, რომელშიც შედარებულია შესწავლილი ამა თუ იმ კატეგორიის კუთვნილების რეალური მაჩვენებლები რეგრესიული მოდელის საფუძველზე პროგნოზირებულებთან. ამისათვის გამოიყენება კლასიფიკაციის ცხრილი. ის ასევე გვაძლევს საშუალებას გამოვიტანოთ დასკვნები დიფერენციაციის სისწორის შესახებ თითოეული განხილული ჯგუფისთვის.

ლოგისტიკური რეგრესიის მოდელი
ლოგისტიკური რეგრესიის მოდელი

შემდეგი ცხრილი იძლევა შესაძლებლობას გაირკვეს ანალიზში შეტანილი დამოუკიდებელი ფაქტორების სტატისტიკური მნიშვნელოვნება, აგრეთვე თითოეული არასტანდარტიზებული ლოგისტიკური რეგრესიის კოეფიციენტი. ამ ინდიკატორებზე დაყრდნობით შესაძლებელია გამოვთვალოთ შერჩევის თითოეული რესპონდენტის კუთვნილება კონკრეტულ ჯგუფში. Save ღილაკის გამოყენებით შეგიძლიათ შეიყვანოთ ახალი ცვლადები. ისინი შეიცავს ინფორმაციას კონკრეტულ კლასიფიკაციის კატეგორიაში მიკუთვნების შესახებ (პროგნოზირებული კატეგორია) და ამ ჯგუფებში მოხვედრის ალბათობაზე (პროგნოზირებული ალბათობების წევრობა). „OK“-ზე დაწკაპუნების შემდეგ, გამოთვლის შედეგები გამოჩნდება მრავალწევრიანი ლოგისტიკური რეგრესიის მთავარ ფანჯარაში.

პირველი ცხრილი, რომელიც შეიცავს მკვლევარისთვის მნიშვნელოვან ინდიკატორებს, არის მოდელის მორგების ინფორმაცია. სტატისტიკური მნიშვნელოვნების მაღალი დონე მიუთითებს მაღალ ხარისხზე დამოდელის გამოყენების ვარგისიანობა პრაქტიკული პრობლემების გადაჭრაში. კიდევ ერთი მნიშვნელოვანი ცხრილი არის Pseudo R-Square. ის საშუალებას გაძლევთ შეაფასოთ მთლიანი დისპერსიის პროპორცია დამოკიდებული ფაქტორში, რომელიც განისაზღვრება ანალიზისთვის შერჩეული დამოუკიდებელი ცვლადებით. Likelihood Ratio Tests ცხრილის მიხედვით შეგვიძლია გამოვიტანოთ დასკვნები ამ უკანასკნელის სტატისტიკური მნიშვნელობის შესახებ. პარამეტრის შეფასებები ასახავს არასტანდარტულ კოეფიციენტებს. ისინი გამოიყენება განტოლების მშენებლობაში. გარდა ამისა, ცვლადების თითოეული კომბინაციისთვის განისაზღვრა მათი ზემოქმედების სტატისტიკური მნიშვნელობა დამოკიდებულ ფაქტორზე. იმავდროულად, მარკეტინგული კვლევისას ხშირად ხდება საჭირო რესპონდენტების დიფერენცირება კატეგორიების მიხედვით არა ინდივიდუალურად, არამედ როგორც სამიზნე ჯგუფის ნაწილი. ამისთვის გამოიყენება დაკვირვებული და პროგნოზირებული სიხშირეების ცხრილი.

პრაქტიკული აპლიკაცია

ანალიზის განხილული მეთოდი ფართოდ გამოიყენება ტრეიდერების მუშაობაში. 1991 წელს შეიქმნა ლოგისტიკური სიგმოიდური რეგრესიის მაჩვენებელი. ეს არის ადვილად გამოსაყენებელი და ეფექტური ინსტრუმენტი სავარაუდო ფასების პროგნოზირებისთვის, სანამ ისინი "გახურდებიან". ინდიკატორი ნაჩვენებია სქემაზე, როგორც არხი, რომელიც ჩამოყალიბებულია ორი პარალელური ხაზით. ისინი თანაბრად არიან დაშორებული ტენდენციისგან. დერეფნის სიგანე დამოკიდებული იქნება მხოლოდ ვადაზე. ინდიკატორი გამოიყენება თითქმის ყველა აქტივთან მუშაობისას - სავალუტო წყვილებიდან ძვირფას ლითონებამდე.

ლოგისტიკური რეგრესია spss-ში
ლოგისტიკური რეგრესია spss-ში

პრაქტიკაში შემუშავებულია ინსტრუმენტის გამოყენების 2 ძირითადი სტრატეგია: გარღვევისთვის დამოსახვევისთვის. ამ უკანასკნელ შემთხვევაში, ტრეიდერი ყურადღებას გაამახვილებს არხის შიგნით ფასების ცვლილების დინამიკაზე. როდესაც მნიშვნელობა უახლოვდება მხარდაჭერის ან წინააღმდეგობის ხაზს, ფსონი იდება იმის ალბათობაზე, რომ მოძრაობა დაიწყება საპირისპირო მიმართულებით. თუ ფასი უახლოვდება ზედა საზღვარს, მაშინ შეგიძლიათ მოიცილოთ აქტივი. თუ ის ქვედა ზღვარზეა, მაშინ უნდა იფიქროთ შეძენაზე. გარღვევის სტრატეგია მოიცავს შეკვეთების გამოყენებას. ისინი დამონტაჟებულია საზღვრებს გარეთ შედარებით მცირე მანძილზე. იმის გათვალისწინებით, რომ ფასი ზოგიერთ შემთხვევაში არღვევს მათ მცირე ხნით, უნდა ითამაშო უსაფრთხოდ და დააყენო სტოპ ლოსი. ამავდროულად, რა თქმა უნდა, არჩეული სტრატეგიის მიუხედავად, ტრეიდერმა უნდა აღიქვას და შეაფასოს ბაზარზე შექმნილი სიტუაცია რაც შეიძლება მშვიდად.

დასკვნა

ამგვარად, ლოგისტიკური რეგრესიის გამოყენება საშუალებას გაძლევთ სწრაფად და მარტივად დაახარისხოთ რესპონდენტები მოცემული პარამეტრების მიხედვით კატეგორიებად. ანალიზის დროს შეგიძლიათ გამოიყენოთ ნებისმიერი კონკრეტული მეთოდი. კერძოდ, მრავალწევრი რეგრესია უნივერსალურია. თუმცა, ექსპერტები გვირჩევენ გამოიყენოთ ყველა ზემოთ აღწერილი მეთოდის კომბინაციაში. ეს გამოწვეულია იმით, რომ ამ შემთხვევაში მოდელის ხარისხი საგრძნობლად მაღალი იქნება. ეს, თავის მხრივ, გააფართოვებს მისი გამოყენების დიაპაზონს.

გირჩევთ: