მათემატიკური სტატისტიკა არის მეთოდოლოგია, რომელიც საშუალებას გაძლევთ მიიღოთ ინფორმირებული გადაწყვეტილებები გაურკვეველი პირობების პირობებში. მონაცემთა შეგროვებისა და სისტემატიზაციის მეთოდების შესწავლა, ექსპერიმენტებისა და ექსპერიმენტების საბოლოო შედეგების მასობრივი შემთხვევითობით დამუშავება და ნებისმიერი შაბლონის აღმოჩენა არის ის, რასაც აკეთებს მათემატიკის ეს ფილიალი. განვიხილოთ მათემატიკური სტატისტიკის ძირითადი ცნებები.
სხვაობა ალბათობის თეორიასთან
მათემატიკური სტატისტიკის მეთოდები მჭიდროდ იკვეთება ალბათობის თეორიასთან. მათემატიკის ორივე დარგი მრავალი შემთხვევითი ფენომენის შესწავლას ეხება. ორი დისციპლინა დაკავშირებულია ლიმიტის თეორემებით. თუმცა ამ მეცნიერებებს შორის დიდი განსხვავებაა. თუ ალბათობის თეორია მათემატიკური მოდელის საფუძველზე განსაზღვრავს პროცესის მახასიათებლებს რეალურ სამყაროში, მაშინ მათემატიკური სტატისტიკა საპირისპიროს აკეთებს - ის ადგენს მოდელის თვისებებს.დაკვირვებული ინფორმაციის საფუძველზე.
ნაბიჯები
მათემატიკური სტატისტიკის გამოყენება შეიძლება განხორციელდეს მხოლოდ შემთხვევით მოვლენებთან ან პროცესებთან, უფრო სწორად, მათზე დაკვირვებით მიღებულ მონაცემებთან მიმართებაში. და ეს ხდება რამდენიმე ეტაპად. პირველ რიგში, ექსპერიმენტებისა და ექსპერიმენტების მონაცემები გარკვეულ დამუშავებას განიცდის. ისინი შეკვეთილია სიცხადისთვის და ანალიზის სიმარტივისთვის. შემდეგ ხდება დაკვირვებული შემთხვევითი პროცესის საჭირო პარამეტრების ზუსტი ან სავარაუდო შეფასება. ისინი შეიძლება იყოს:
- მოვლენის ალბათობის შეფასება (მისი ალბათობა თავდაპირველად უცნობია);
- შესწავლა განუსაზღვრელი განაწილების ფუნქციის ქცევა;
- მოლოდინის შეფასება;
- ვარიაციის შეფასება
- და ა.შ.
მესამე ეტაპი არის ანალიზამდე დაყენებული ნებისმიერი ჰიპოთეზის გადამოწმება, ანუ პასუხის მიღება კითხვაზე, თუ რამდენად შეესაბამება ექსპერიმენტების შედეგები თეორიულ გამოთვლებს. სინამდვილეში, ეს არის მათემატიკური სტატისტიკის მთავარი ეტაპი. მაგალითი იქნება იმის გათვალისწინება, არის თუ არა დაკვირვებული შემთხვევითი პროცესის ქცევა ნორმალურ განაწილების ფარგლებში.
მოსახლეობა
მათემატიკური სტატისტიკის ძირითადი ცნებები მოიცავს ზოგად და სანიმუშო პოპულაციებს. ეს დისციპლინა ეხება გარკვეული ობიექტების კომპლექტის შესწავლას გარკვეული საკუთრების მიმართ. მაგალითია ტაქსის მძღოლის მუშაობა.განვიხილოთ ეს შემთხვევითი ცვლადები:
- დატვირთვა ან მომხმარებელთა რაოდენობა: დღეში, ლანჩამდე, ლანჩის შემდეგ, …;
- მოგზაურობის საშუალო დრო;
- შესული აპლიკაციების რაოდენობა ან მათი მიმაგრება ქალაქის რაიონებში და მრავალი სხვა.
ასევე აღსანიშნავია, რომ შესაძლებელია მსგავსი შემთხვევითი პროცესების სიმრავლის შესწავლა, რომელიც ასევე იქნება შემთხვევითი ცვლადი, რომლის დაკვირვებაც შესაძლებელია.
ასე რომ, მათემატიკური სტატისტიკის მეთოდებში, შესწავლილი ობიექტების მთელ კომპლექსს ან სხვადასხვა დაკვირვების შედეგებს, რომლებიც ერთსა და იმავე პირობებში ხორციელდება მოცემულ ობიექტზე, ეწოდება ზოგადი პოპულაცია. სხვა სიტყვებით რომ ვთქვათ, მათემატიკურად უფრო მკაცრად, ეს არის შემთხვევითი ცვლადი, რომელიც განისაზღვრება ელემენტარული მოვლენების სივრცეში, მასში მითითებულია ქვესიმრავლეების კლასი, რომელთა ელემენტებს აქვთ ცნობილი ალბათობა.
ნიმუშის პოპულაცია
არის შემთხვევები, როცა რაიმე მიზეზის გამო (ღირებულება, დრო) შეუძლებელია ან არაპრაქტიკულია თითოეული ობიექტის შესასწავლად უწყვეტი კვლევის ჩატარება. მაგალითად, დალუქული ჯემის ყოველი ქილის გახსნა მისი ხარისხის შესამოწმებლად საეჭვო გადაწყვეტილებაა და ჰაერის თითოეული მოლეკულის ტრაექტორიის კუბურ მეტრში შეფასება შეუძლებელია. ასეთ შემთხვევებში გამოიყენება შერჩევითი დაკვირვების მეთოდი: ზოგადი პოპულაციისგან ირჩევა (ჩვეულებრივ შემთხვევითი წესით) გარკვეული რაოდენობის ობიექტები და ექვემდებარება მათ ანალიზს.
ეს ცნებები თავიდან შეიძლება რთული ჩანდეს. ამიტომ, თემის სრულად გასაგებად, თქვენ უნდა შეისწავლოთ ვ.ე.გმურმანის სახელმძღვანელო "ალბათობის თეორია და მათემატიკური სტატისტიკა". ამრიგად, შერჩევის ნაკრები ან ნიმუში არის ობიექტების სერია, რომელიც შემთხვევით შერჩეულია ზოგადი ნაკრებიდან. მკაცრი მათემატიკური თვალსაზრისით, ეს არის დამოუკიდებელი, თანაბრად განაწილებული შემთხვევითი ცვლადების თანმიმდევრობა, რომელთაგან თითოეულისთვის განაწილება ემთხვევა ზოგადი შემთხვევითი ცვლადის მითითებულს.
ძირითადი ცნებები
მოდით მოკლედ განვიხილოთ მათემატიკური სტატისტიკის სხვა ძირითადი ცნებები. ობიექტების რაოდენობას საერთო პოპულაციაში ან ნიმუშში ეწოდება მოცულობა. ნიმუშის მნიშვნელობებს, რომლებიც მიიღება ექსპერიმენტის დროს, ეწოდება ნიმუშის რეალიზაცია. იმისთვის, რომ შერჩევის საფუძველზე ზოგადი პოპულაციის შეფასება იყოს სანდო, მნიშვნელოვანია ე.წ. წარმომადგენლობითი ან წარმომადგენლობითი ნიმუში. ეს ნიშნავს, რომ ნიმუში სრულად უნდა წარმოადგენდეს პოპულაციას. ამის მიღწევა შესაძლებელია მხოლოდ იმ შემთხვევაში, თუ პოპულაციის ყველა ელემენტს აქვს ნიმუშში ყოფნის თანაბარი ალბათობა.
ნიმუშები განასხვავებენ დაბრუნებულ და დაუბრუნებელ. პირველ შემთხვევაში, ნიმუშის შინაარსში, განმეორებითი ელემენტი უბრუნდება ზოგად კომპლექტს, მეორე შემთხვევაში - არა. ჩვეულებრივ, პრაქტიკაში, სინჯის აღება გამოიყენება ჩანაცვლების გარეშე. აქვე უნდა აღინიშნოს, რომ საერთო პოპულაციის ზომა ყოველთვის მნიშვნელოვნად აღემატება შერჩევის ზომას. არსებობსშერჩევის პროცესის მრავალი ვარიანტი:
- მარტივი - ნივთები შემთხვევით შეირჩევა ერთ ჯერზე;
- აკრეფილი - საერთო პოპულაცია იყოფა ტიპებად და კეთდება არჩევანი თითოეულიდან; მაგალითია მაცხოვრებლების გამოკითხვა: კაცები და ქალები ცალ-ცალკე;
- მექანიკური - მაგალითად, აირჩიეთ ყოველი მე-10 ელემენტი;
- სერიული - შერჩევა ხდება ელემენტების სერიით.
სტატისტიკური განაწილება
გმურმანის მიხედვით, ალბათობის თეორია და მათემატიკური სტატისტიკა უაღრესად მნიშვნელოვანი დისციპლინებია სამეცნიერო სამყაროში, განსაკუთრებით მის პრაქტიკულ ნაწილში. განვიხილოთ ნიმუშის სტატისტიკური განაწილება.
დავუშვათ, რომ გვყავს მოსწავლეთა ჯგუფი, რომლებიც ტესტირებულნი იყვნენ მათემატიკაში. შედეგად, ჩვენ გვაქვს შეფასებების ნაკრები: 5, 3, 1, 4, 3, 4, 2, 5, 4, 4, 5 - ეს არის ჩვენი პირველადი სტატისტიკური მასალა.
უპირველეს ყოვლისა, ჩვენ უნდა დავახარისხოთ ის, ან შევასრულოთ რანგის ოპერაცია: 1, 2, 3, 3, 4, 4, 4, 4, 5, 5, 5 - და ამით მივიღოთ ვარიაციის სერია. თითოეული შეფასების გამეორების რაოდენობას ეწოდება შეფასების სიხშირე, ხოლო მათ შეფარდებას შერჩევის ზომასთან - ფარდობითი სიხშირე. მოდით გავაკეთოთ ნიმუშის სტატისტიკური განაწილების ცხრილი, ან უბრალოდ სტატისტიკური სერია:
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1 | 1 | 2 | 4 | 3 |
ან
ai | 1 | 2 | 3 | 4 | 5 |
pi | 1/11 | 1/11 | 2/11 | 4/11 | 3/11 |
მოდით, გვქონდეს შემთხვევითი ცვლადი, რომელზეც ჩავატარებთ ექსპერიმენტების სერიას და ვნახოთ, რა მნიშვნელობას იღებს ეს ცვლადი. დავუშვათ, მან აიღო მნიშვნელობა a1 - m1-ჯერ; a2 - m2 ჯერ და ა.შ. ამ ნიმუშის ზომა იქნება m1 + … + mk=m. ნაკრები ai, სადაც i ვარირებს 1-დან k-მდე, არის სტატისტიკური სერია.
ინტერვალის განაწილება
ვ.ე გმურმანის წიგნში "ალბათობის თეორია და მათემატიკური სტატისტიკა" ასევე წარმოდგენილია ინტერვალური სტატისტიკური სერია. მისი შედგენა შესაძლებელია, როდესაც შესასწავლი ფუნქციის მნიშვნელობა არის უწყვეტი გარკვეული ინტერვალით, ხოლო მნიშვნელობების რაოდენობა დიდია. განვიხილოთ სტუდენტების ჯგუფი, უფრო სწორად, მათი სიმაღლე: 163, 180, 185, 172, 161, 171, 189, 157, 165, 174, 180, 181, 175, 182, 167, 159,14,17. 179, 160, 180, 166, 178, 156, 180, 189, 173, 174, 175 - სულ 30 მოსწავლე. ცხადია, ადამიანის სიმაღლე უწყვეტი მნიშვნელობაა. ჩვენ უნდა განვსაზღვროთ ინტერვალის ნაბიჯი. ამისთვის გამოიყენება Sturges-ის ფორმულა.
სთ= | მაქს - მინ. | = | 190 - 156 | = | 33 | = | 5, 59 |
1+log2მ | 1+log230 | 5, 9 |
ამგვარად, 6-ის მნიშვნელობა შეიძლება მივიღოთ როგორც ინტერვალის ზომა. ასევე უნდა ითქვას, რომ მნიშვნელობა 1+log2m არის ფორმულა.ინტერვალების რაოდენობის განსაზღვრა (რა თქმა უნდა დამრგვალებით). ამრიგად, ფორმულების მიხედვით, მიიღება 6 ინტერვალი, რომელთაგან თითოეულს აქვს ზომა 6. და საწყისი ინტერვალის პირველი მნიშვნელობა იქნება ფორმულით განსაზღვრული რიცხვი: min - h / 2=156 - 6/2=153. შევადგინოთ ცხრილი, რომელიც შეიცავს ინტერვალებს და იმ მოსწავლეთა რაოდენობას, რომელთა ზრდა გარკვეულ ინტერვალში ჩავარდა.
H | [153; 159) | [159; 165) | [165; 171) | [171; 177) | [177; 183) | [183; 189) |
P | 2 | 5 | 3 | 9 | 8 | 3 |
P | 0, 06 | 0, 17 | 0, 1 | 0, 3 | 0, 27 | 0, 1 |
რა თქმა უნდა, ეს ყველაფერი არ არის, რადგან მათემატიკურ სტატისტიკაში გაცილებით მეტი ფორმულაა. ჩვენ განვიხილეთ მხოლოდ რამდენიმე ძირითადი კონცეფცია.
გავრცელების განრიგი
მათემატიკური სტატისტიკის ძირითადი ცნებები ასევე მოიცავს განაწილების გრაფიკულ წარმოდგენას, რომელიც გამოირჩევა სიცხადით. არსებობს ორი ტიპის გრაფიკი: მრავალკუთხედი და ჰისტოგრამა. პირველი გამოიყენება დისკრეტული სტატისტიკური სერიებისთვის. და უწყვეტი განაწილებისთვის, შესაბამისად, მეორე.