დროის სერიების ანალიზი და პროგნოზირება

Სარჩევი:

დროის სერიების ანალიზი და პროგნოზირება
დროის სერიების ანალიზი და პროგნოზირება
Anonim

მრავალი წლის განმავლობაში ადამიანები წინასწარმეტყველებდნენ ამინდის პირობებს, ეკონომიკურ და პოლიტიკურ მოვლენებს და სპორტულ შედეგებს, ახლახან ეს ვრცელი სია კრიპტოვალუტებით შეივსო. მრავალმხრივი მოვლენების პროგნოზირებისთვის, პროგნოზების შემუშავების მრავალი გზა არსებობს. მაგალითად, ინტუიცია, ექსპერტთა მოსაზრებები, წარსული შედეგების გამოყენება ტრადიციულ სტატისტიკასთან შესადარებლად და დროის სერიების პროგნოზირება მხოლოდ ერთ-ერთი მათგანია, ხოლო ყველაზე თანამედროვე და ზუსტი ტიპის პროგნოზები აპლიკაციების ფართო სპექტრით.

დროის სერიის მეთოდი

დროის სერიების მეთოდი
დროის სერიების მეთოდი

დროის სერიის (TS) მეთოდი არის მონაცემთა ნაკრები, რომელიც აგროვებს ინფორმაციას გარკვეული პერიოდის განმავლობაში. ამ ტიპის ამოღების სპეციალური მეთოდები არსებობს:

  • წრფივი და არაწრფივი;
  • პარამეტრული და არაპარამეტრული;
  • ერთგანზომილებიანი და მრავალგანზომილებიანი.

პროგნოზის დროსერიას მოაქვს უნიკალური შესაძლებლობები დღევანდელი გამოწვევების დასაძლევად. მოდელირება ეყრდნობა მონაცემთა ცვლილების მამოძრავებელი ძალის დადგენას. პროცესი მოდის გრძელვადიანი ტენდენციებიდან, სეზონური ეფექტებიდან ან არარეგულარული რყევებიდან, რომლებიც დამახასიათებელია TS-სთვის და არ ჩანს სხვა ტიპის ანალიზში.

მანქანური სწავლება არის კომპიუტერული მეცნიერების ფილიალი, სადაც ალგორითმები შედგენილია მონაცემებიდან და მოიცავს ხელოვნურ ნერვულ ქსელებს, ღრმა სწავლებას, ასოციაციის წესებს, გადაწყვეტილების ხეებს, განმტკიცების სწავლებას და ბაიესის ქსელებს. სხვადასხვა ალგორითმები იძლევა პრობლემების გადაჭრის ვარიანტებს და თითოეულს აქვს საკუთარი მოთხოვნები და კომპეტენცია მონაცემთა შეყვანის, სიჩქარისა და შედეგების სიზუსტის თვალსაზრისით. ეს, საბოლოო პროგნოზების სიზუსტესთან ერთად, შეწონილი იქნება, როდესაც მომხმარებელი გადაწყვეტს, რომელი ალგორითმი იმუშავებს საუკეთესოდ შესასწავლი სიტუაციისთვის.

დროის სერიების პროგნოზირება სესხულობს სტატისტიკის სფეროდან, მაგრამ იძლევა პრობლემის მოდელირების ახალ მიდგომებს. მანქანური სწავლისა და დროის სერიების მთავარი პრობლემა იგივეა - ახალი შედეგების წინასწარმეტყველება ადრე ცნობილ მონაცემებზე დაყრდნობით.

პროგნოზირებადი მოდელის სამიზნე

პროგნოზირების მოდელის დანიშნულება
პროგნოზირების მოდელის დანიშნულება

TS არის მონაცემთა პუნქტების ნაკრები, რომლებიც შეგროვებულია რეგულარული ინტერვალებით. მათი ანალიზი ხდება გრძელვადიანი ტენდენციის დასადგენად, მომავლის პროგნოზირებისთვის ან სხვა ტიპის ანალიზის ჩასატარებლად. არსებობს 2 რამ, რაც განასხვავებს TS-ს ჩვეულებრივი რეგრესიის პრობლემისგან:

  1. ისინი დროზეა დამოკიდებული. Ისეხაზოვანი რეგრესიის მოდელის ძირითადი დაშვება, რომ დაკვირვებები დამოუკიდებელია, ამ შემთხვევაში არ მოქმედებს.
  2. მზარდი ან კლების ტენდენციასთან ერთად, TS-ების უმეტესობას აქვს სეზონურობის გარკვეული ფორმა, ანუ ცვლილებები, რომლებიც სპეციფიკურია გარკვეული პერიოდისთვის.

დროის სერიების პროგნოზირების მოდელის მიზანია ზუსტი პროგნოზის მიცემა მოთხოვნისამებრ. დროის სერიას აქვს დრო (t), როგორც დამოუკიდებელი ცვლადი და სამიზნე დამოკიდებული ცვლადი. უმეტეს შემთხვევაში, პროგნოზი არის კონკრეტული შედეგი, მაგალითად, სახლის გასაყიდი ფასი, შეჯიბრის სპორტული შედეგი, ბირჟაზე ვაჭრობის შედეგები. პროგნოზი წარმოადგენს მედიანას და საშუალოს და მოიცავს ნდობის ინტერვალს, რომელიც გამოხატავს ნდობის დონეს 80-95% დიაპაზონში. როდესაც ისინი ჩაიწერება რეგულარული ინტერვალებით, პროცესებს უწოდებენ დროის სერიებს და გამოიხატება ორი გზით:

  • ერთგანზომილებიანი დროის ინდექსით, რომელიც ქმნის იმპლიციტურ წესრიგს;
  • კომპლექტი ორი განზომილებით: დრო დამოუკიდებელი ცვლადით და სხვა დამოკიდებული ცვლადი.

ფუნქციების შექმნა ერთ-ერთი ყველაზე მნიშვნელოვანი და შრომატევადი ამოცანაა გამოყენებითი მანქანათმცოდნეობაში. თუმცა, დროის სერიების პროგნოზირება არ ქმნის მახასიათებლებს, ყოველ შემთხვევაში, არა ტრადიციული გაგებით. ეს განსაკუთრებით ეხება მაშინ, როდესაც გსურთ შედეგის წინასწარმეტყველება რამდენიმე ნაბიჯით წინ, და არა მხოლოდ შემდეგი მნიშვნელობა.

ეს არ ნიშნავს, რომ ფუნქციები მთლიანად გამორთულია. ისინი მხოლოდ სიფრთხილით უნდა იქნას გამოყენებული შემდეგი მიზეზების გამო:

  1. გაურკვეველია, რა არის მომავალი რეალურიმნიშვნელობები იქნება ამ მახასიათებლებისთვის.
  2. თუ ობიექტები პროგნოზირებადია და აქვთ გარკვეული შაბლონები, შეგიძლიათ შექმნათ პროგნოზირებადი მოდელი თითოეული მათგანისთვის.

თუმცა, გაითვალისწინეთ, რომ პროგნოზირებადი მნიშვნელობების, როგორც მახასიათებლების გამოყენება, შეცდომას გაავრცელებს სამიზნე ცვლადში და გამოიწვევს შეცდომებს ან მიკერძოებულ პროგნოზებს.

დროის სერიების კომპონენტები

დროის სერიების კომპონენტები
დროის სერიების კომპონენტები

ტენდენცია არსებობს, როდესაც სერია იზრდება, მცირდება ან რჩება მუდმივ დონეზე დროთა განმავლობაში, ამიტომ იგი აღებულია როგორც ფუნქცია. სეზონურობა ეხება დროის სერიების თვისებას, რომელიც აჩვენებს პერიოდულ შაბლონებს, რომლებიც მეორდება მუდმივი სიხშირით (m), მაგალითად, m=12 ნიშნავს, რომ ნიმუში მეორდება ყოველ თორმეტ თვეში.

სეზონურობის მსგავსი ცვლადები შეიძლება დაემატოს ორობით ფუნქციად. შეგიძლიათ, მაგალითად, გაითვალისწინოთ არდადეგები, სპეციალური ღონისძიებები, მარკეტინგული კამპანიები, მიუხედავად იმისა, ღირებულება უცხოა თუ არა. თუმცა, უნდა გახსოვდეთ, რომ ამ ცვლადებს უნდა ჰქონდეს გარკვეული შაბლონები. თუმცა, დღეების რაოდენობა ადვილად შეიძლება გამოითვალოს მომავალ პერიოდებშიც კი და გავლენა მოახდინოს დროის სერიების პროგნოზირებაზე, განსაკუთრებით ფინანსურ სფეროში.

ციკლები არის სეზონები, რომლებიც არ ხდება ფიქსირებული სიჩქარით. მაგალითად, კანადური ფოცხვერის წლიური გამრავლების ატრიბუტები ასახავს სეზონურ და ციკლურ ნიმუშებს. ისინი არ მეორდება რეგულარული ინტერვალებით და შეიძლება მოხდეს მაშინაც კი, თუ სიხშირე არის 1 (მ=1).

ჩარჩენილი მნიშვნელობები -ცვლადის ჩამორჩენილი მნიშვნელობები შეიძლება ჩართული იყოს როგორც პროგნოზირება. ზოგიერთი მოდელი, როგორიცაა ARIMA, ვექტორული ავტორეგრესია (VAR) ან ავტორეგრესიული ნერვული ქსელები (NNAR), მუშაობს ამ გზით.

საინტერესო ცვლადის კომპონენტები ძალიან მნიშვნელოვანია დროის სერიების ანალიზისა და პროგნოზირებისთვის, მათი ქცევის, შაბლონების გასაგებად და შესაბამისი მოდელის არჩევისთვის.

მონაცემთა ნაკრების ატრიბუტები

მონაცემთა ნაკრების ატრიბუტები
მონაცემთა ნაკრების ატრიბუტები

შეიძლება იყოთ შეჩვეული ათასობით, მილიონობით და მილიარდობით მონაცემთა პუნქტის შეყვანას მანქანური სწავლის მოდელებში, მაგრამ ეს არ არის საჭირო დროის სერიებისთვის. ფაქტობრივად, შესაძლებელია მცირე და საშუალო TS-თან მუშაობა, რაც დამოკიდებულია ცვლადის სიხშირეზე და ტიპზე და ეს არ არის მეთოდის მინუსი. უფრო მეტიც, ამ მიდგომას რეალურად აქვს მრავალი უპირატესობა:

  1. ინფორმაციის ასეთი ნაკრები შეესაბამება სახლის კომპიუტერის შესაძლებლობებს.
  2. ზოგიერთ შემთხვევაში, შეასრულეთ დროის სერიების ანალიზი და პროგნოზირება მონაცემთა მთლიანი ნაკრების გამოყენებით და არა მხოლოდ ნიმუშის გამოყენებით.
  3. TS სიგრძე სასარგებლოა ანალიზირებული გრაფიკების შესაქმნელად. ეს არის ძალიან მნიშვნელოვანი წერტილი, რადგან პროგრამისტები ეყრდნობიან გრაფიკას ანალიზის ფაზაში. ეს არ ნიშნავს, რომ ისინი არ მუშაობენ უზარმაზარ დროის სერიებთან, მაგრამ თავდაპირველად მათ უნდა შეეძლოთ უფრო მცირე TS-ების მართვა.
  4. ნებისმიერი მონაცემთა ნაკრები, რომელიც შეიცავს დროსთან დაკავშირებულ ველს, შეუძლია ისარგებლოს დროის სერიების ანალიზით და პროგნოზით. თუმცა, თუ პროგრამისტს აქვს მონაცემთა უფრო დიდი ნაკრები, DB (TSDB)შეიძლება უფრო შესაფერისი იყოს.

ამ ნაკრებიდან ზოგიერთი მოდის დროის შტამპით, სისტემის ჟურნალებითა და ფინანსური მონაცემებით ჩაწერილი მოვლენებიდან. ვინაიდან TSDB მუშაობს ბუნებრივად დროის სერიებთან, ეს შესანიშნავი შესაძლებლობაა გამოიყენოს ეს ტექნიკა დიდი მასშტაბის მონაცემთა ნაკრებებზე.

მანქანის სწავლა

მანქანური სწავლება (ML) შეიძლება აღემატებოდეს დროის სერიების პროგნოზირების ტრადიციულ მეთოდებს. არსებობს უამრავი კვლევა, რომლებიც ადარებენ მანქანური სწავლების მეთოდებს უფრო კლასიკურ სტატისტიკურ მეთოდებთან TS მონაცემებზე. ნერვული ქსელები არის ერთ-ერთი ტექნოლოგია, რომელიც ფართოდ იქნა გამოკვლეული და იყენებს TS მიდგომებს. მანქანური სწავლების მეთოდები ლიდერობს მონაცემთა შეგროვების რეიტინგში დროის სერიებზე დაყრდნობით. ამ კომპლექტებმა დაამტკიცა, რომ ეფექტურია და აჯობებს სუფთა TS კომპლექტებს M3 ან Kaggle-ის წინააღმდეგ.

MO-ს აქვს თავისი სპეციფიკური პრობლემები. ფუნქციების შემუშავება ან მონაცემთა ნაკრებიდან ახალი პროგნოზირების გენერირება მნიშვნელოვანი ნაბიჯია მისთვის და შეიძლება ჰქონდეს დიდი გავლენა შესრულებაზე და იყოს აუცილებელი გზა TS მონაცემების ტენდენციისა და სეზონურობის საკითხების გადასაჭრელად. ასევე, ზოგიერთ მოდელს აქვს პრობლემები იმის თაობაზე, თუ რამდენად კარგად ერგება მონაცემებს და თუ არა, შესაძლოა გამოტოვონ მთავარი ტენდენცია.

დროის სერია და მანქანათმცოდნეობის მიდგომები არ უნდა არსებობდეს ერთმანეთისგან იზოლირებულად. მათი გაერთიანება შესაძლებელია თითოეული მიდგომის სარგებელის მისაცემად. პროგნოზირების მეთოდები და დროის სერიების ანალიზი კარგია მონაცემების ტრენდულ და სეზონურ მონაცემებად დაშლაში.ელემენტები. ეს ანალიზი შეიძლება გამოყენებულ იქნას, როგორც შემავალი ML მოდელისთვის, რომელსაც აქვს ტენდენციური და სეზონური ინფორმაცია თავის ალგორითმში, რაც იძლევა ორივე სამყაროს საუკეთესოს.

პრობლემის განცხადების გაგება

მაგალითად, განიხილეთ TS დაკავშირებული ახალ ჩქაროსნულ სარკინიგზო სერვისზე მგზავრების რაოდენობის პროგნოზირებასთან. მაგალითად, თქვენ გაქვთ 2 წლის მონაცემები (2016 წლის აგვისტო - 2018 წლის სექტემბერი) და ამ მონაცემებით თქვენ უნდა იწინასწარმეტყველოთ მგზავრების რაოდენობა მომდევნო 7 თვის განმავლობაში, გქონდეთ 2 წლის მონაცემები (2016-2018) საათობრივ დონეზე. მგზავრების რაოდენობა და აუცილებელია მათი რაოდენობის დადგენა მომავალში.

მონაცემთა ნაკრების ქვეჯგუფი პროგნოზირებისთვის დროის სერიებით:

  1. მატარებლის და ტესტის ფაილის შექმნა სიმულაციისთვის.
  2. პირველი 14 თვე (2016 წლის აგვისტო - 2017 წლის ოქტომბერი) გამოიყენება ტრენინგის მონაცემებად, ხოლო შემდეგი 2 თვე (2017 წლის ნოემბერი - 2017 წლის დეკემბერი) არის ტესტის მონაცემები.
  3. შეაგროვეთ მონაცემთა ბაზა ყოველდღიურად.
მონაცემთა ნაკრების აგრეგაცია
მონაცემთა ნაკრების აგრეგაცია

შეასრულეთ მონაცემთა ვიზუალიზაცია, რათა ნახოთ, როგორ იცვლება ის გარკვეული პერიოდის განმავლობაში.

მონაცემთა ვიზუალიზაცია
მონაცემთა ვიზუალიზაცია

გულუბრყვილო მიდგომის მშენებლობის მეთოდი

ბიბლიოთეკა, რომელიც გამოიყენება ამ შემთხვევაში TS პროგნოზირებისთვის არის statsmodels. ის უნდა იყოს დაინსტალირებული რომელიმე ამ მიდგომის გამოყენებამდე. შესაძლოა, statsmodels უკვე დაინსტალირებულია პითონის გარემოში, მაგრამ ის არ უჭერს მხარს მეთოდებსწინასწარმეტყველება, ამიტომ მოგიწევთ მისი კლონირება საცავიდან და დაინსტალირება წყაროდან.

თანმიმდევრობა
თანმიმდევრობა

ამ მაგალითისთვის, ეს ნიშნავს, რომ მონეტების მოგზაურობის ფასები სტაბილურია თავიდანვე და მთელი დროის განმავლობაში. ეს მეთოდი ვარაუდობს, რომ შემდეგი მოსალოდნელი წერტილი უდრის ბოლო დაკვირვებულ წერტილს და ეწოდება გულუბრყვილო მიდგომა.

გულუბრყვილო მეთოდი
გულუბრყვილო მეთოდი

ახლა გამოთვალეთ სტანდარტული გადახრა, რათა შეამოწმოთ მოდელის სიზუსტე ტესტის მონაცემთა ბაზაზე. RMSE მნიშვნელობიდან და ზემოთ მოცემული გრაფიკიდან შეგვიძლია დავასკვნათ, რომ Naive არ არის შესაფერისი მაღალი არასტაბილურობის ვარიანტებისთვის, მაგრამ გამოიყენება სტაბილურებისთვის.

მარტივი საშუალო სტილი

მეთოდის საჩვენებლად შედგენილია დიაგრამა, იმ ვარაუდით, რომ Y-ღერძი წარმოადგენს ფასს, ხოლო X-ღერძი წარმოადგენს დროს (დღეებს).

მარტივი საშუალო სტილი
მარტივი საშუალო სტილი

მისგან შეგვიძლია დავასკვნათ, რომ ფასი იზრდება და მცირდება შემთხვევით, მცირე ზღვრით, ისე რომ საშუალო მნიშვნელობა მუდმივი რჩება. ამ შემთხვევაში, შეგიძლიათ იწინასწარმეტყველოთ შემდეგი პერიოდის ფასი, ისევე როგორც ყველა გასული დღის საშუალო.

წინასწარ დაკვირვებული წერტილების მოსალოდნელი საშუალო პროგნოზის ამ მეთოდს ეწოდება მარტივი საშუალო მეთოდი.

ამ შემთხვევაში აღებულია ადრე ცნობილი მნიშვნელობები, გამოითვლება საშუალო და მიიღება შემდეგ მნიშვნელობად. რა თქმა უნდა, ეს არ იქნება ზუსტი, მაგრამ ეს საკმაოდ ახლოსაა და არის სიტუაციები, როდესაც ეს მეთოდი საუკეთესოდ მუშაობს.

მარტივი საშუალომეთოდი
მარტივი საშუალომეთოდი

გრაფიკაზე ნაჩვენები შედეგების საფუძველზე, ეს მეთოდი საუკეთესოდ მუშაობს, როდესაც საშუალო მნიშვნელობა ყოველი პერიოდის განმავლობაში უცვლელი რჩება. მართალია გულუბრყვილო მეთოდი საშუალოზე უკეთესია, მაგრამ არა ყველა მონაცემთა ნაკრებისთვის. რეკომენდირებულია ეტაპობრივად სცადოთ თითოეული მოდელი და ნახოთ, გააუმჯობესებს თუ არა შედეგს.

მოძრავი საშუალო მოდელი

მოძრავი საშუალო მოდელი
მოძრავი საშუალო მოდელი

ამ დიაგრამაზე დაყრდნობით შეგვიძლია დავასკვნათ, რომ ფასები წარსულში რამდენჯერმე გაიზარდა დიდი ზღვრით, მაგრამ ახლა სტაბილურია. წინა საშუალო მეთოდის გამოსაყენებლად, თქვენ უნდა აიღოთ ყველა წინა მონაცემის საშუალო. საწყისი პერიოდის ფასები ძლიერ გავლენას მოახდენს მომდევნო პერიოდის პროგნოზზე. ამიტომ, მარტივი საშუალოზე გაუმჯობესების სახით, აიღეთ ფასების საშუალო მხოლოდ დროის ბოლო რამდენიმე პერიოდისთვის.

ამ პროგნოზირების ტექნიკას უწოდებენ მოძრავი საშუალო ტექნიკას, რომელსაც ზოგჯერ უწოდებენ "n" ზომის "მოძრავ ფანჯარას". მარტივი მოდელის გამოყენებით, TS-ის შემდეგი მნიშვნელობა არის პროგნოზირებული მეთოდის სიზუსტის შესამოწმებლად. აშკარად გულუბრყვილო აჯობებს საშუალო და მოძრავი საშუალოს ამ მონაცემთა ნაკრებისთვის.

არსებობს პროგნოზის ვარიანტი მარტივი ექსპონენციალური დაგლუვების მეთოდით. მოძრავი საშუალო მეთოდით, წარსული "n" დაკვირვებები თანაბრად წონიან. ამ შემთხვევაში შეიძლება შეგხვდეთ სიტუაციები, როდესაც წარსულიდან ყოველი „n“თავისებურად იმოქმედებს პროგნოზზე. ამ ვარიაციას, რომელიც განსხვავებულად აწონასწორებს წარსულ დაკვირვებებს, ეწოდება მეთოდიშეწონილი მოძრავი საშუალო.

ნიმუშების ექსტრაპოლაცია

ერთ-ერთი ყველაზე მნიშვნელოვანი თვისება, რომელიც საჭიროა დროის სერიების პროგნოზირების ალგორითმების გასათვალისწინებლად არის შაბლონების ექსტრაპოლაციის შესაძლებლობა სასწავლო მონაცემთა დომენის გარეთ. ბევრ ML ალგორითმს არ აქვს ეს შესაძლებლობა, რადგან ისინი შემოიფარგლება მხოლოდ იმ რეგიონით, რომელიც განსაზღვრულია ტრენინგის მონაცემებით. ამიტომ, ისინი არ არიან შესაფერისი TS-სთვის, რომლის მიზანია შედეგის მომავალში პროექცია.

TS ალგორითმის კიდევ ერთი მნიშვნელოვანი თვისებაა სანდო ინტერვალების მიღების შესაძლებლობა. მიუხედავად იმისა, რომ ეს არის ნაგულისხმევი თვისება TS მოდელებისთვის, ML მოდელების უმეტესობას არ აქვს ეს შესაძლებლობა, რადგან ისინი ყველა არ არის დაფუძნებული სტატისტიკურ განაწილებაზე.

არ იფიქროთ, რომ მხოლოდ მარტივი სტატისტიკური მეთოდები გამოიყენება TS-ის პროგნოზირებისთვის. სულაც არ არის ასე. არსებობს მრავალი რთული მიდგომა, რომელიც შეიძლება ძალიან სასარგებლო იყოს განსაკუთრებულ შემთხვევებში. განზოგადებული ავტორეგრესიული პირობითი ჰეტეროსკედასტიურობა (GARCH), ბაიესიანი და VAR მხოლოდ რამდენიმე მათგანია.

ასევე არსებობს ნერვული ქსელის მოდელები, რომლებიც შეიძლება გამოყენებულ იქნას დროის სერიებზე, რომლებიც იყენებენ ჩამორჩენილ პროგნოზირებს და შეუძლიათ გაუმკლავდნენ ისეთ ფუნქციებს, როგორიცაა ნერვული ქსელის ავტორეგრესია (NNAR). არსებობს დროის სერიების მოდელებიც კი ნასესხები კომპლექსური სწავლებიდან, განსაკუთრებით განმეორებადი ნერვული ქსელების ოჯახში, როგორიცაა LSTM და GRU ქსელები.

შეფასების მეტრიკა და ნარჩენი დიაგნოსტიკა

ყველაზე გავრცელებული პროგნოზირების მეტრიკააrms ნიშნავს, რომელსაც ბევრი ადამიანი იყენებს რეგრესიის პრობლემების გადაჭრისას:

  • MAPE, რადგან ის არის მასშტაბისგან დამოუკიდებელი და წარმოადგენს შეცდომის თანაფარდობას რეალურ მნიშვნელობებთან პროცენტულად;
  • MASE, რომელიც აჩვენებს რამდენად კარგად მუშაობს პროგნოზი გულუბრყვილო საშუალო პროგნოზთან შედარებით.

როდესაც პროგნოზირების მეთოდი ადაპტირებულია, მნიშვნელოვანია შევაფასოთ რამდენად კარგად შეუძლია მას მოდელების აღება. მიუხედავად იმისა, რომ შეფასების მეტრიკა გვეხმარება იმის დადგენაში, თუ რამდენად ახლოს არის მნიშვნელობები რეალურ მნიშვნელობებთან, ისინი არ აფასებენ შეესაბამება თუ არა მოდელი TS-ს. ნარჩენები ამის შესაფასებლად კარგი საშუალებაა. ვინაიდან პროგრამისტი ცდილობს გამოიყენოს TS შაბლონები, მას შეუძლია მოელოდეს, რომ შეცდომები "თეთრი ხმაურის" მსგავსი იქნება, რადგან ისინი წარმოადგენენ რაღაცას, რისი აღქმაც შეუძლებელია მოდელის მიერ.

"თეთრ ხმაურს" უნდა ჰქონდეს შემდეგი თვისებები:

  1. ნარჩენები არაკორელირებული (Acf=0)
  2. ნარჩენები მიჰყვება ნორმალურ განაწილებას ნულოვანი საშუალო (მიკერძოებული) და მუდმივი დისპერსიით.
  3. თუ ორი თვისებიდან რომელიმე აკლია, მოდელის გაუმჯობესების ადგილია.
  4. ნულოვანი საშუალო თვისება მარტივად შეიძლება შემოწმდეს T-ტესტის გამოყენებით.
  5. ნორმალობისა და მუდმივი დისპერსიის თვისებები ვიზუალურად კონტროლდება ნარჩენების ჰისტოგრამის ან შესაბამისი ერთვარიანტული ნორმალურობის ტესტის გამოყენებით.

ARIMA მოდელი

ARIMA - ავტორეგრესიული ინტეგრირებული მოძრავი საშუალო მოდელი, არის ერთ-ერთი ყველაზე პოპულარული მეთოდი, რომელიც გამოიყენება TS პროგნოზირებაში, ძირითადად.მონაცემთა ავტოკორელაციის მეშვეობით მაღალი ხარისხის მოდელების შესაქმნელად.

ARIMA კოეფიციენტების შეფასებისას მთავარი ვარაუდია, რომ მონაცემები სტაციონარულია. ეს ნიშნავს, რომ ტენდენცია და სეზონურობა ვერ იმოქმედებს დისპერსიაზე. მოდელის ხარისხი შეიძლება შეფასდეს რეალური მნიშვნელობების დროის მონაკვეთის შედარებით პროგნოზირებულ მნიშვნელობებთან. თუ ორივე მრუდი ახლოსაა, მაშინ შეიძლება ვივარაუდოთ, რომ მოდელი ერგება გაანალიზებულ შემთხვევას. მან უნდა გაამჟღავნოს ნებისმიერი ტენდენცია და სეზონურობა, ასეთის არსებობის შემთხვევაში.

ნარჩენების ანალიზმა უნდა აჩვენოს, შეესაბამება თუ არა მოდელი: შემთხვევითი ნარჩენები ნიშნავს, რომ ის ზუსტია. ARIMA-ს პარამეტრებთან დაყენება (0, 1, 1) მისცემს იგივე შედეგებს, რაც ექსპონენციალური გლუვს, ხოლო პარამეტრების (0, 2, 2) გამოყენება ორმაგ ექსპონენციალურ დამარბილებელ შედეგებს.

დროის სერიის ალგორითმები SQL სერვერში
დროის სერიის ალგორითმები SQL სერვერში

შეგიძლიათ წვდომა ARIMA პარამეტრებზე Excel-ში:

  1. დაიწყეთ Excel.
  2. იპოვეთ XL MINER ინსტრუმენტთა პანელზე.
  3. ლენტზე აირჩიეთ ARIMA ჩამოსაშლელი მენიუდან.

ARIMA მოდელის შესაძლებლობების შეჯამება:

  1. ARIMA - ავტორეგრესიული ინტეგრირებული მოძრავი საშუალო.
  2. პროგნოზირების მოდელი გამოიყენება დროის სერიების ანალიზში.
  3. ARIMA პარამეტრის სინტაქსი: ARIMA (p, d, q) სადაც p=ავტორეგრესიული ტერმინების რაოდენობა, d=სეზონური სხვაობების რაოდენობა და q=მოძრავი საშუალო ტერმინების რაოდენობა.

ალგორითმები SQL Server-ში

ჯვარედინი პროგნოზის შესრულება ერთ-ერთი მნიშვნელოვანიადროის სერიების მახასიათებლები ფინანსური ამოცანების პროგნოზირებაში. თუ გამოყენებულია ორი დაკავშირებული სერია, შედეგად მიღებული მოდელი შეიძლება გამოყენებულ იქნას ერთი სერიის შედეგების პროგნოზირებისთვის, სხვების ქცევაზე დაყრდნობით.

SQL Server 2008-ს აქვს ახალი დროის სერიების მძლავრი ფუნქციები შესასწავლად და გამოსაყენებლად. ხელსაწყოს აქვს ადვილად ხელმისაწვდომი TS მონაცემები, ადვილად გამოსაყენებელი ინტერფეისი ალგორითმის ფუნქციების სიმულაციისა და რეპროდუცირებისთვის და ახსნა-განმარტების ფანჯარა სერვერის მხრიდან DMX მოთხოვნების ბმულით, რათა გაიგოთ რა ხდება შიგნით.

მარკეტის დროის სერიები ფართო სფეროა, სადაც ღრმა სწავლის მოდელები და ალგორითმები შეიძლება გამოყენებულ იქნას. ბანკები, ბროკერები და ფონდები ახლა ექსპერიმენტებს ატარებენ ინდექსების, გაცვლითი კურსის, ფიუჩერსების, კრიპტოვალუტის ფასების, სახელმწიფო აქციების და სხვათა ანალიზისა და პროგნოზირების შესახებ.

დროის სერიების პროგნოზირებისას, ნერვული ქსელი პოულობს პროგნოზირებად შაბლონებს ბაზრების სტრუქტურებისა და ტენდენციების შესწავლით და აძლევს რჩევებს ტრეიდერებს. ეს ქსელები ასევე დაგეხმარებათ ისეთი ანომალიების გამოვლენაში, როგორიცაა მოულოდნელი მწვერვალები, დაცემა, ტენდენციის ცვლილებები და დონის ცვლა. მრავალი ხელოვნური ინტელექტის მოდელი გამოიყენება ფინანსური პროგნოზებისთვის.

გირჩევთ: