ინფორმაციული ტექნოლოგიების განვითარებას მოაქვს პრაქტიკული შედეგები. მაგრამ ისეთი ამოცანები, როგორიცაა ინფორმაციის მოძიება, ანალიზი და გამოყენება, ჯერ არ მიუღია ეფექტური მაღალი ხარისხის ინსტრუმენტი. არსებობს ანალიტიკა და რაოდენობრივი ინსტრუმენტები, ისინი ნამდვილად მუშაობს. მაგრამ ხარისხობრივი რევოლუცია ინფორმაციის გამოყენებაში ჯერ არ მომხდარა.
კომპიუტერული ტექნოლოგიების გამოჩენამდე დიდი ხნით ადრე, ადამიანს სჭირდებოდა დიდი რაოდენობით ინფორმაციის დამუშავება და გაუმკლავდა ამას თავისი გამოცდილებით და არსებული ტექნიკური შესაძლებლობებით.
ცოდნისა და უნარების განვითარება ყოველთვის აკმაყოფილებდა რეალურ მოთხოვნილებებს და შეესაბამებოდა მიმდინარე ამოცანებს. მონაცემთა მოპოვება არის კოლექტიური სახელწოდება, რომელიც გამოიყენება მანამდე უცნობი, არატრივიალური, პრაქტიკულად სასარგებლო და ხელმისაწვდომი ცოდნის აღმოსაჩენად, რომელიც აუცილებელია ადამიანის საქმიანობის სხვადასხვა სფეროში გადაწყვეტილების მისაღებად.
ადამიანი, ინტელექტი, პროგრამირება
ადამიანმა ყოველთვის იცის როგორ მოიქცეს ნებისმიერ სიტუაციაში.უცოდინრობა ან უცნობი სიტუაცია ხელს არ უშლის მას გადაწყვეტილების მიღებაში. ნებისმიერი ადამიანის გადაწყვეტილების ობიექტურობა და გონივრულობა შეიძლება ეჭვქვეშ დადგეს, მაგრამ ის მიიღება.
ინტელექტი ემყარება: მემკვიდრეობით „მექანიზმს“, შეძენილ, აქტიურ ცოდნას. ცოდნა გამოიყენება ადამიანის წინაშე წამოჭრილი პრობლემების გადასაჭრელად.
- ინტელექტი არის ცოდნისა და უნარების უნიკალური ნაკრები: შესაძლებლობები და საფუძველი ადამიანის ცხოვრებისა და მუშაობისთვის.
- ინტელექტი მუდმივად ვითარდება და ადამიანის ქმედებები გავლენას ახდენს სხვა ადამიანებზე.
პროგრამირება არის მონაცემთა წარმოდგენის და ალგორითმების შექმნის პროცესის ფორმალიზების პირველი მცდელობა.
ხელოვნური ინტელექტი (AI) დროისა და რესურსების კარგვაა, მაგრამ AI-ის სფეროში გასული საუკუნის წარუმატებელი მცდელობების შედეგები მეხსიერებაში დარჩა, გამოიყენეს სხვადასხვა ექსპერტულ (ინტელექტუალურ) სისტემაში და გარდაიქმნა, კერძოდ, ალგორითმებში (წესებში) და მათემატიკური (ლოგიკური) მონაცემთა ანალიზსა და მონაცემთა მოპოვებაში.
ინფორმაცია და გამოსავლის ჩვეულებრივი ძიება
ჩვეულებრივი ბიბლიოთეკა არის ცოდნის საცავი და დაბეჭდილმა სიტყვამ და გრაფიკამ ჯერ კიდევ არ მიუღია ხელი კომპიუტერულ ტექნოლოგიას. ფიზიკის, ქიმიის, თეორიული მექანიკის, დიზაინის, ბუნების ისტორიის, ფილოსოფიის, საბუნებისმეტყველო მეცნიერების, ბოტანიკის, სახელმძღვანელოები, მონოგრაფიები, მეცნიერთა ნაშრომები, საკონფერენციო მასალები, მოხსენებები განვითარების სამუშაოების შესახებ და ა.შ. ყოველთვის აქტუალური და საიმედოა.
ბიბლიოთეკა არის ბევრი განსხვავებული წყარო, რომელიც განსხვავდებამასალის პრეზენტაციის ფორმა, წარმოშობა, სტრუქტურა, შინაარსი, პრეზენტაციის სტილი და ა.შ.
გარეგნულად ყველაფერი ჩანს (იკითხებადი, ხელმისაწვდომი) გასაგებად და გამოსაყენებლად. თქვენ შეგიძლიათ გადაჭრათ ნებისმიერი პრობლემა, სწორად დააყენოთ დავალება, დაასაბუთოთ ამოხსნა, დაწეროთ ესე ან კურსი, შეარჩიოთ მასალა დიპლომატისთვის, გაანალიზოთ წყაროები დისერტაციის თემაზე ან სამეცნიერო და ანალიტიკური ანგარიში.
ნებისმიერი საინფორმაციო პრობლემის მოგვარება შესაძლებელია. სათანადო დაჟინებითა და ოსტატობით მიიღება ზუსტი და საიმედო შედეგი. ამ კონტექსტში მონაცემთა მოპოვება სრულიად განსხვავებული მიდგომაა.
შედეგის გარდა, ადამიანი იღებს „აქტიურ ბმულებს“ყველაფერთან, რაც ნახულობდა მიზნის მიღწევის პროცესში. ის წყაროები, რომლებიც მან პრობლემის გადაჭრაში გამოიყენა, შეიძლება დასახელდეს და წყაროს არსებობის ფაქტს არავინ დავობს. ეს არ არის ავთენტურობის გარანტია, მაგრამ ეს არის უტყუარი ჩვენება, ვისზეც არის „გამოწერილი“პასუხისმგებლობა ავთენტურობაზე. ამ თვალსაზრისით, მონაცემთა მოპოვება ნიშნავს დიდ ეჭვებს სანდოობასთან დაკავშირებით და არ არის „აქტიური“ბმულები.
რამდენიმე პრობლემის გადაჭრით ადამიანი იღებს შედეგებს და აფართოებს თავის ინტელექტუალურ პოტენციალს ბევრ „აქტიურ რგოლამდე“. თუ ახალი დავალება „ააქტიურებს“უკვე არსებულ ბმულს, ადამიანმა იცის როგორ გადაჭრას იგი: აღარ არის საჭირო რაიმეს ხელახლა ძებნა.
"აქტიური ბმული" არის ფიქსირებული ასოციაცია: როგორ და რა უნდა გააკეთოს კონკრეტულ შემთხვევაში. ადამიანის ტვინი ავტომატურად ახსოვს ყველაფერს, რაც მისთვის საინტერესო და სასარგებლო ჩანს.ან შესაძლოა საჭირო გახდეს მომავალში. მრავალი თვალსაზრისით, ეს ხდება ქვეცნობიერის დონეზე, მაგრამ როგორც კი ჩნდება დავალება, რომელიც შეიძლება ასოცირდებოდეს „აქტიურ ბმულთან“, ის მყისიერად ჩნდება გონებაში და გამოსავალი მიიღება ინფორმაციის დამატებითი ძიების გარეშე. მონაცემთა მოპოვება ყოველთვის არის ძიების ალგორითმის გამეორება და ეს ალგორითმი არ იცვლება.
რეგულარული ძებნა: "მხატვრული" პრობლემები
მათემატიკური ბიბლიოთეკა და მასში ინფორმაციის მოძიება შედარებით სუსტი ამოცანაა. ინტეგრალის ამოხსნის ამა თუ იმ ხერხის პოვნა, მატრიცის აგება ან ორი წარმოსახვითი რიცხვის დამატების მოქმედების შესრულება შრომატევადი, მაგრამ მარტივია. თქვენ უნდა დაალაგოთ რამდენიმე წიგნი, რომელთაგან ბევრი დაწერილია კონკრეტულ ენაზე, იპოვოთ სწორი ტექსტი, შეისწავლოთ და მიიღოთ საჭირო გადაწყვეტა.
დროთა განმავლობაში, ჩამოთვლა გახდება ნაცნობი და დაგროვილი გამოცდილება საშუალებას მოგცემთ ნავიგაცია მოახდინოთ ბიბლიოთეკის ინფორმაციაში და სხვა მათემატიკური ამოცანების შესახებ. ეს არის კითხვებისა და პასუხების შეზღუდული საინფორმაციო სივრცე. დამახასიათებელი თვისება: ინფორმაციის ასეთი ძიება აგროვებს ცოდნას მსგავსი პრობლემების გადასაჭრელად. ინფორმაციის ძიება ადამიანის მეხსიერებაში ტოვებს კვალს ("აქტიურ ბმულებს") სხვა პრობლემების შესაძლო გადაწყვეტის შესახებ.
მხატვრულ ლიტერატურაში იპოვეთ პასუხი კითხვაზე: "როგორ ცხოვრობდნენ ადამიანები 1248 წლის იანვარში?" ძალიან ძნელი. კიდევ უფრო რთულია პასუხის გაცემა კითხვაზე, რა იყო მაღაზიების თაროებზე და როგორ იყო ორგანიზებული საკვებით ვაჭრობა. თუნდაც რომელიმე მწერალმა გარკვევით და პირდაპირ დაწერა ამის შესახებ თავის რომანში, ამ მწერლის სახელი რომ მოიძებნოს, მაშინ ეჭვი ეპარება.მიღებული მონაცემების სანდოობა დარჩება. სანდოობა არის ნებისმიერი რაოდენობის ინფორმაციის კრიტიკული მახასიათებელი. მნიშვნელოვანია წყარო, ავტორი და მტკიცებულება, რომელიც გამორიცხავს შედეგის სიყალბეს.
კონკრეტული სიტუაციის ობიექტური გარემოებები
ადამიანი ხედავს, ესმის, გრძნობს. ზოგიერთი სპეციალისტი თავისუფლად ფლობს უნიკალურ გრძნობას - ინტუიციას. პრობლემის ჩამოყალიბება მოითხოვს ინფორმაციას, პრობლემის გადაჭრის პროცესს ყველაზე ხშირად თან ახლავს პრობლემის ფორმულის დახვეწა. ეს არის უმცირესი უბედურება, რაც მოდის კომპიუტერული სისტემის ნაწლავებში ინფორმაციის გადატანას.
ბიბლიოთეკა და სამუშაო კოლეგები არიან არაპირდაპირი მონაწილეები გადაწყვეტილების მიღების პროცესში. წიგნის დიზაინი (წყარო), გრაფიკა ტექსტში, ინფორმაციის სათაურებად დაყოფის თავისებურებები, სქოლიოები ფრაზებით, საგნის ინდექსი, პირველადი წყაროების სია - ყველაფერი იწვევს ადამიანში ასოციაციებს, რომლებიც ირიბად მოქმედებს ამოხსნის პროცესზე. პრობლემა.
პრობლემის მოგვარების დრო და ადგილი აუცილებელია. ადამიანი ისეა მოწყობილი, რომ პრობლემის გადაჭრის პროცესში უნებურად აქცევს ყურადღებას ყველაფერს, რაც გარშემორტყმულია. ეს შეიძლება იყოს ყურადღების გადატანის, ან შეიძლება იყოს მასტიმულირებელი. მონაცემთა მოპოვება ვერასდროს "გაიგებს".
ინფორმაცია ვირტუალურ სივრცეში
ადამიანს ყოველთვის აინტერესებდა მხოლოდ სანდო ინფორმაცია მოვლენის, ფენომენის, ობიექტის, პრობლემის გადაჭრის ალგორითმის შესახებ. ადამიანი ყოველთვის ზუსტად წარმოიდგენდა, როგორ შეუძლია მიაღწიოს სასურველ მიზანს.
კომპიუტერებისა და საინფორმაციო სისტემების გარეგნობა უნდა გაეადვილებინა ადამიანს ცხოვრება, მაგრამ ყველაფერი მხოლოდ უფრო გართულდა.ინფორმაცია გადავიდა კომპიუტერული სისტემების ნაწლავებში და გაქრა მხედველობიდან. საჭირო მონაცემების შესარჩევად, თქვენ უნდა შექმნათ სწორი ალგორითმი ან ჩამოაყალიბოთ მოთხოვნა მონაცემთა ბაზაში.
კითხვა სწორი უნდა იყოს. მხოლოდ ამის შემდეგ შეგიძლიათ მიიღოთ პასუხი. მაგრამ ავთენტურობის შესახებ ეჭვი რჩება. ამ თვალსაზრისით, მონაცემთა მოპოვება ნამდვილად არის „გათხრები“, ეს არის „ინფორმაციის მოპოვება“. ასე მოდურია ამ ფრაზის თარგმნა. რუსული ვერსია არის მონაცემთა მაინინგი ან მონაცემთა მოპოვების ტექნოლოგია.
ავტორიტეტული სპეციალისტების ნაშრომებში მონაცემთა მოპოვების ამოცანები მითითებულია შემდეგნაირად:
- კლასიფიკაცია;
- კლასტერირება;
- ასოციაცია;
- მიმდევრობა;
- პროგნოზირება.
პრაქტიკის თვალსაზრისით, რომელიც ხელმძღვანელობს ადამიანს ინფორმაციის ხელით დამუშავებაში, ყველა ეს პოზიცია სადავოა. ნებისმიერ შემთხვევაში, ადამიანი ამუშავებს ინფორმაციას ავტომატურად და არ ფიქრობს მონაცემთა კლასიფიკაციაზე, საგნების თემატური ჯგუფების შედგენაზე (კლასტერირებაზე), დროებითი შაბლონების (მიმდევრობის) ძიებაზე ან შედეგის პროგნოზირებაზე.
ადამიანის გონებაში ყველა ეს პოზიცია წარმოდგენილია აქტიური ცოდნით, რომელიც ფარავს მეტ პოზიციას და დინამიურად იყენებს საწყისი მონაცემების დამუშავების ლოგიკას. ადამიანის ქვეცნობიერი მნიშვნელოვან როლს ასრულებს, განსაკუთრებით მაშინ, როდესაც ის არის სპეციალისტი ცოდნის კონკრეტული დარგში.
მაგალითი: კომპიუტერული ტექნიკის საბითუმო ვაჭრობა
ამოცანა მარტივია. Არსებობს რამდენიმეკომპიუტერული ტექნიკისა და პერიფერიული მოწყობილობების ათობით მომწოდებელი. თითოეულს აქვს ფასების სია xls ფორმატში (Excel ფაილი), რომლის ჩამოტვირთვა შესაძლებელია მიმწოდებლის ოფიციალური ვებსაიტიდან. საჭიროა შეიქმნას ვებ რესურსი, რომელიც წაიკითხავს Excel ფაილებს, გარდაქმნის მათ მონაცემთა ბაზის ცხრილებად და საშუალებას აძლევს მომხმარებელს აირჩიოს სასურველი პროდუქტები ყველაზე დაბალ ფასად.
პრობლემები მაშინვე ჩნდება. თითოეული მიმწოდებელი გთავაზობთ xls ფაილის სტრუქტურისა და შინაარსის საკუთარ ვერსიას. თქვენ შეგიძლიათ მიიღოთ ფაილი მიმწოდებლის ვებ-გვერდიდან ჩამოტვირთვის, ელექტრონული ფოსტით შეკვეთით ან გადმოტვირთვის ბმულის მიღებით თქვენი პირადი ანგარიშის მეშვეობით, ანუ ოფიციალურად დარეგისტრირდით მომწოდებელთან.
პრობლემის გადაწყვეტა (თავიდანვე) ტექნოლოგიურად მარტივია. ფაილების ჩატვირთვა (საწყისი მონაცემები), ფაილის ამოცნობის ალგორითმი იწერება თითოეული მიმწოდებლისთვის და მონაცემები მოთავსებულია საწყისი მონაცემების ერთ დიდ ცხრილში. ყველა მონაცემის მიღების შემდეგ, ახალი მონაცემების უწყვეტი გაცვლის მექანიზმის (ყოველდღიური, ყოველკვირეული ან შეცვლისას) დადგენის შემდეგ:
- შეცვალეთ ასორტიმენტი;
- ფასის ცვლილებები;
- მარაგში არსებული რაოდენობის დაზუსტება;
- საგარანტიო პირობების კორექტირება, სპეციფიკაციები და ა.შ.
აქ იწყება რეალური პრობლემები. საქმე ის არის, რომ მომწოდებელს შეუძლია დაწეროს:
- ნოუთბუქი Acer;
- ნოუთბუქი Asus;
- Dell ლეპტოპი.
ჩვენ ვსაუბრობთ ერთსა და იმავე პროდუქტზე, მაგრამ სხვადასხვა მწარმოებლისგან. როგორ დავამთხვიოთ ნოუთბუქი=ლეპტოპი ან როგორ ამოიღოთ Acer, Asus და Dell პროდუქტის ხაზიდან?
ამისთვისადამიანის პრობლემა არ არის, მაგრამ როგორ "გაიგებს" ალგორითმი, რომ Acer, Asus, Dell, Samsung, LG, HP, Sony არის სავაჭრო ნიშნები ან მომწოდებლები? როგორ დავამთხვიოთ „პრინტერი“და პრინტერი, „სკანერი“და „MFP“, „გადამწერი“და „MFP“, „ყურსასმენები“„ყურსასმენთან“, „აქსესუარები“„აქსესუარებთან“?
კატეგორიის ხის აშენება წყაროს მონაცემებზე (წყარო ფაილები) უკვე პრობლემაა, როცა ყველაფრის ავტომატურზე დაყენება გჭირდებათ.
მონაცემთა ნიმუში: გათხრები "ახლად ჩამოსხმული"
მოხსნილია კომპიუტერული ტექნიკის მომწოდებლების მონაცემთა ბაზის შექმნის ამოცანა. აშენდა კატეგორიების ხე, ფუნქციონირებს საერთო ცხრილი ყველა მომწოდებლის შეთავაზებით.
ტიპიური მონაცემთა მოპოვების ამოცანები ამ მაგალითის კონტექსტში:
- იპოვე პროდუქტი ყველაზე დაბალ ფასად;
- აირჩიეთ საქონელი ყველაზე დაბალი მიწოდების ღირებულებით და ფასით;
- პროდუქტის ანალიზი: მახასიათებლები და ფასები კრიტერიუმების მიხედვით.
მენეჯერის რეალურ მუშაობაში, რომელიც იყენებს რამდენიმე ათეული მომწოდებლის მონაცემებს, იქნება ამ ამოცანების მრავალი ვარიაცია და კიდევ უფრო რეალური სიტუაციები.
მაგალითად, არის მიმწოდებელი "A", რომელიც ყიდის ASUS VivoBook S15: წინასწარ გადახდა, მიწოდება ფულის ფაქტიური მიღებიდან 5 დღის შემდეგ. არის იგივე მოდელის პროდუქტის მიმწოდებელი "B": გადახდა მიღებისას, მიწოდება ხელშეკრულების დადების შემდეგ დღეში, ფასი ერთნახევარჯერ მეტია.
დატამაინინგი იწყება - "გათხრები". ფიგურული გამოთქმები: „გათხრები“ან „მონაცემთა მოპოვება“სინონიმებია. ეს არის იმის შესახებ, თუ როგორ უნდა მიიღოთ გადაწყვეტილების მიღების მიზეზი.
მიმწოდებლებს "A" და "B" აქვთ მიწოდების ისტორია. შეფასებაწინასწარი გადახდა პირველ შემთხვევაში ქვითარზე გადახდის სანაცვლოდ მეორე შემთხვევაში, იმის გათვალისწინებით, რომ მიწოდების წარუმატებლობა მეორე შემთხვევაში 65%-ით მეტია. კლიენტისგან ჯარიმების რისკი უფრო მაღალი/დაბალია. როგორ და რა უნდა განვსაზღვროთ და რა გადაწყვეტილება მივიღოთ?
მეორეს მხრივ: მონაცემთა ბაზა შეიქმნა პროგრამისტისა და მენეჯერის მიერ. თუ პროგრამისტი და მენეჯერი შეიცვალა, როგორ განვსაზღვროთ მონაცემთა ბაზის ამჟამინდელი მდგომარეობა და ვისწავლოთ მისი სწორად გამოყენება? ასევე მოგიწევთ მონაცემთა მოპოვება. მონაცემთა მოპოვება გთავაზობთ მრავალფეროვან მათემატიკურ და ლოგიკურ მეთოდებს, რომლებსაც არ აინტერესებთ რა სახის მონაცემები იკვლევენ. ეს იძლევა სწორ გადაწყვეტას ზოგიერთ შემთხვევაში, მაგრამ არა ყველაში.
ვირტუალურობაში გადასვლა და მნიშვნელობის პოვნა
მონაცემთა მოპოვების მეთოდები აზრობრივი ხდება, როგორც კი ინფორმაცია ჩაიწერება მონაცემთა ბაზაში და გაქრება „ხედვის ველიდან“. კომპიუტერული ტექნიკით ვაჭრობა საინტერესო ამოცანაა, მაგრამ ეს მხოლოდ ბიზნესია. რამდენად კარგად არის ის ორგანიზებული კომპანიაში, დამოკიდებულია მის წარმატებაზე.
კლიმატის ცვლილებები პლანეტაზე და ამინდი კონკრეტულ ქალაქში ყველასთვისაა საინტერესო და არა მხოლოდ კლიმატის პროფესიონალი ექსპერტებისთვის. ათასობით სენსორი იღებს ქარის, ტენიანობის, წნევის, დედამიწის ხელოვნურ თანამგზავრების მონაცემებს და არსებობს წლებისა და საუკუნეების მონაცემების ისტორია.
ამინდის მონაცემები არ არის მხოლოდ იმის გადაწყვეტილების შესახებ, მიიტანოთ თუ არა ქოლგა სამსახურში. მონაცემთა მოპოვების ტექნოლოგიები არის საჰაერო ხომალდის უსაფრთხო ფრენა, ავტომაგისტრალის სტაბილური მუშაობა და ნავთობპროდუქტების საიმედო მიწოდება ზღვით.
"ნედლეული" მონაცემები იგზავნება ინფორმაციაზესისტემა. მონაცემთა მოპოვების ამოცანებია მათი გადაქცევა ცხრილების სისტემატიზებულ სისტემად, ბმულების დამყარება, ჰომოგენური მონაცემების ჯგუფების ხაზგასმა და შაბლონების აღმოჩენა.
მათემატიკურმა და ლოგიკურმა მეთოდებმა რაოდენობრივი ანალიტიკის დროიდან მოყოლებული OLAP (On-line Analytical Processing) აჩვენა თავისი პრაქტიკულობა. აქ ტექნოლოგია საშუალებას გაძლევთ იპოვოთ მნიშვნელობა და არ დაკარგოთ ის, როგორც ეს კომპიუტერული ტექნიკის გაყიდვის მაგალითშია.
უფრო მეტიც, გლობალურ ამოცანებში:
- ტრანსნაციონალური ბიზნესი;
- საჰაერო ტრანსპორტის მართვა;
- მიწის ნაწლავების ან სოციალური პრობლემების შესწავლა (სახელმწიფო დონეზე);
- შესწავლა წამლების გავლენის შესახებ ცოცხალ ორგანიზმზე;
- სამრეწველო საწარმოს მშენებლობის შედეგების პროგნოზირება და ა.შ.
მონაცემთა მაღაროს ტექნოლოგიები და „უაზრო“მონაცემების რეალურ მონაცემებად გადაქცევა, რაც საშუალებას გაძლევთ მიიღოთ ობიექტური გადაწყვეტილებები, ერთადერთი ვარიანტია.
ადამიანის შესაძლებლობები მთავრდება იქ, სადაც არის დიდი რაოდენობით ნედლეული ინფორმაცია. მონაცემთა მოპოვების სისტემები კარგავენ სარგებლობას იქ, სადაც საჭიროა ინფორმაციის ნახვა, გაგება და შეგრძნება.
ფუნქციების გონივრული განაწილება და ობიექტურობა
ადამიანი და კომპიუტერი ერთმანეთს უნდა ავსებდეს - ეს აქსიომაა. დისერტაციის დაწერა ადამიანისათვის პრიორიტეტულია, საინფორმაციო სისტემა კი დახმარება. აქ მონაცემთა მოპოვების ტექნოლოგიას აქვს ევრისტიკა, წესები, ალგორითმები.
ყოველკვირეული ამინდის პროგნოზის მომზადება საინფორმაციო სისტემის პრიორიტეტია.ადამიანი მართავს მონაცემებს, მაგრამ თავის გადაწყვეტილებებს სისტემის გამოთვლების შედეგებზე აყალიბებს. იგი აერთიანებს მონაცემთა მოპოვების მეთოდებს, მონაცემთა სპეციალისტების კლასიფიკაციას, ალგორითმების გამოყენების ხელით კონტროლს, წარსული მონაცემების ავტომატურ შედარებას, მათემატიკური პროგნოზირებას და საინფორმაციო სისტემის გამოყენებაში ჩართული რეალური ადამიანების უამრავ ცოდნასა და უნარს.
ალბათობის თეორია და მათემატიკური სტატისტიკა არ არის ცოდნის ყველაზე "საყვარელი" და გასაგები სფეროები. ბევრი სპეციალისტი მათგან ძალიან შორს არის, მაგრამ ამ სფეროებში შემუშავებული მეთოდები თითქმის 100%-ით სწორ შედეგს იძლევა. მონაცემთა მოპოვების იდეებზე, მეთოდებსა და ალგორითმებზე დაფუძნებული სისტემების გამოყენებით, გადაწყვეტილებების მიღება შესაძლებელია ობიექტურად და საიმედოდ. წინააღმდეგ შემთხვევაში, გამოსავლის მიღება უბრალოდ შეუძლებელია.
ფარაონები და გასული საუკუნეების საიდუმლოებები
ისტორია პერიოდულად იწერებოდა:
- სახელმწიფოები - მათი სტრატეგიული ინტერესების გულისთვის;
- ავტორიტეტული მეცნიერები - მათი სუბიექტური რწმენის გულისთვის.
ძნელი სათქმელია, რა არის მართალი და რა მცდარი. მონაცემთა მოპოვების გამოყენება ამ პრობლემის გადაჭრის საშუალებას გვაძლევს. მაგალითად, პირამიდების აგების ტექნოლოგია აღწერილი იყო მემატიანეების მიერ და შეისწავლეს მეცნიერები სხვადასხვა საუკუნეებში. ყველა მასალა არ მოიპოვება ინტერნეტში, აქ ყველაფერი უნიკალური არ არის და ბევრ მონაცემს შეიძლება არ ჰქონდეს:
- აღწერილი დროის წერტილი;
- აღწერის დაწერის დრო;
- თარიღი, რომელზედაც დაფუძნებულია აღწერა;
- ავტორი(ები), გათვალისწინებული მოსაზრებები (ბმულები);
- ობიექტურობის დადასტურება.
Bბიბლიოთეკები, ტაძრები და „მოულოდნელი ადგილები“შეგიძლიათ იპოვოთ სხვადასხვა საუკუნის ხელნაწერები და წარსულის მატერიალური მტკიცებულებები.
საინტერესო მიზანი: ყველაფერი ერთად გავაერთიანოთ და ამოვიცნოთ "სიმართლე". პრობლემის თავისებურება: ინფორმაციის მიღება შესაძლებელია მემატიანეს პირველი აღწერიდან, ფარაონების სიცოცხლეში, მიმდინარე საუკუნემდე, სადაც ამ პრობლემას მრავალი მეცნიერი თანამედროვე მეთოდებით წყვეტს.
მონაცემთა მოპოვების გამოყენების დასაბუთება: ხელით მუშაობა შეუძლებელია. ძალიან ბევრი რაოდენობა:
- ინფორმაციის წყარო;
- წარმომადგენლობის ენები;
- მკვლევარები, რომლებიც აღწერენ ერთსა და იმავეს სხვადასხვა გზით;
- თარიღები, მოვლენები და პირობები;
- ტერმინების კორელაციის პრობლემები;
- სტატისტიკის ანალიზი მონაცემთა ჯგუფების მიხედვით დროთა განმავლობაში შეიძლება განსხვავდებოდეს და ა.შ.
გასული საუკუნის ბოლოს, როდესაც ხელოვნური ინტელექტის იდეის მორიგი ფიასკო აშკარა გახდა არა მხოლოდ ერისკაცისთვის, არამედ დახვეწილი სპეციალისტისთვისაც, გაჩნდა იდეა: „პიროვნების ხელახლა შექმნა“.
მაგალითად, პუშკინის, გოგოლის, ჩეხოვის ნაშრომების მიხედვით, ყალიბდება წესების გარკვეული სისტემა, ქცევის ლოგიკა და იქმნება საინფორმაციო სისტემა, რომელსაც შეუძლია უპასუხოს გარკვეულ კითხვებს, როგორც ადამიანს: პუშკინი, გოგოლი ან ჩეხოვი. თეორიულად, ასეთი დავალება საინტერესოა, მაგრამ პრაქტიკაში მისი განხორციელება უკიდურესად რთულია.
თუმცა, ასეთი დავალების იდეა გვთავაზობს ძალიან პრაქტიკულ იდეას: "როგორ შევქმნათ ინტელექტუალური ინფორმაციის ძებნა". ინტერნეტი არის უამრავი განვითარებადი რესურსი, უზარმაზარი მონაცემთა ბაზა და ეს არის შესანიშნავი შესაძლებლობა გამოიყენოს მონაცემთა მოპოვება ადამიანებთან ერთად.ლოგიკა ერთობლივი განვითარების ფორმატში.
მანქანა და კაცი დაწყვილებული შესანიშნავი ამოცანაა და უდავო წარმატებაა "ინფორმაციული არქეოლოგიის" სფეროში, მაღალი ხარისხის გათხრები მონაცემებში და შედეგებში, რომლებიც რაღაცას ეჭვქვეშ დააყენებს, მაგრამ უეჭველად მოგცემთ საშუალებას. მოიპოვოს ახალი ცოდნა და იყოს მოთხოვნადი საზოგადოებაში.