Subscribe
  • ყველა სიახლე
    • ბიზნესი
    • ეკონომიკა
    • ფინანსები
    • პოლიტიკა
    • საქართველო
    • მსოფლიო
    • ტექნოლოგიები
    • ყველა სიახლე
  • Forbes პერსონა
    • ინტერვიუ
    • ანტრეპრენიორები
    • მენეჯერები
  • Forbes Life
    • კულტურა
    • სპორტი
    • მოგზაურობა
    • სტილი
    • რჩევები
  • მოსაზრება
    • რედაქტორის სვეტი
    • ბლოგები
    • ოპედი
    • CopyPaste
  • 30u30
    • თბილისის ბიზნეს ისტორიები
    • Forbes Auto
    • Forbes Culture
    • Forbes GREEN
    • Forbes Science
    • Forbes Sport
    • FORBES TECH
  • პროექტები
    • 30 Under 30
    • Forbes Banker
    • Forbes Infrastructure
    • Forbes Property
    • Forbes Georgia in English
    • HEALTH
    • Forbes Woman
  • ღონისძიებები
  • რეიტინგი
  • ყველა სიახლე
    • ბიზნესი
    • ეკონომიკა
    • ფინანსები
    • პოლიტიკა
    • საქართველო
    • მსოფლიო
    • ტექნოლოგიები
    • ყველა სიახლე
  • Forbes პერსონა
    • ინტერვიუ
    • ანტრეპრენიორები
    • მენეჯერები
  • Forbes Life
    • კულტურა
    • სპორტი
    • მოგზაურობა
    • სტილი
    • რჩევები
  • მოსაზრება
    • რედაქტორის სვეტი
    • ბლოგები
    • ოპედი
    • CopyPaste
  • 30u30
    • თბილისის ბიზნეს ისტორიები
    • Forbes Auto
    • Forbes Culture
    • Forbes GREEN
    • Forbes Science
    • Forbes Sport
    • FORBES TECH
  • პროექტები
    • 30 Under 30
    • Forbes Banker
    • Forbes Infrastructure
    • Forbes Property
    • Forbes Georgia in English
    • HEALTH
    • Forbes Woman
  • ღონისძიებები
  • რეიტინგი

კვლევის თანახმად, AI-ის შესაძლებლობები შესაძლოა გაზვიადებული იყოს

by იზა გვარამაძე
November 12, 2025
in ტექნოლოგიები, ყველა სიახლე
0
კვლევის თანახმად, AI-ის შესაძლებლობები შესაძლოა გაზვიადებული იყოს
0
SHARES
0
VIEWS

გასულ კვირას გამოქვეყნებული კვლევის ავტორები ამტკიცებენ, რომ ხელოვნური ინტელექტის სისტემების შესაფასებლად გამოყენებული ტესტები ხშირად AI-ის რეალურ შესაძლებლობებს გადაჭარბებით აფასებს და მათ მეცნიერული სიზუსტე აკლია.

კვლევა ოქსფორდის ინტერნეტის ინსტიტუტმა (OII) სხვა ინსტიტუტების 30-ზე მეტ მკვლევართან პარტნიორობით ჩაატარა. გუნდმა ხელოვნური ინტელექტის უნარების შესაფასებელი 445 წამყვანი ტესტი გააანალიზა, რომლებიც ფართოდ გამოიყენება AI-მოდელების შესაძლებლობების შესაფასებლად სხვადასხვა მიმართულებით, მათ შორის პროგრამული ინჟინერიის, აბსტრაქტული აზროვნებისა და ენობრივი უნარების განსასაზღვრად.

კვლევის მიხედვით, ამ ტესტების დიდი ნაწილი არ განასაზღვრავს ზუსტად, რა არის შემოწმების მიზანი; ხშირად იყენებს უკვე არსებულ მონაცემებსა და მეთოდოლოგიებს; და იშვიათად მიმართავს მოდელებს შორის სტატისტიკურად სანდო შედარებით ანალიზს.

„როდესაც ხელოვნური ინტელექტის მოდელებს გარკვეული დავალებების შესრულებას ვთხოვთ, ჩვენ ხშირად სრულიად განსხვავებულ კონცეფციებს ან კონსტრუქტებს ვზომავთ, ვიდრე იმას, რისი გაზომვაც გვსურს“, – აცხადებს კვლევის წამყვანი ავტორი, ოქსფორდის უნივერსიტეტის მკვლევარი ადამ მაჰდი, NBC News-თან ინტერვიუში.

მისი კოლეგა, ენდრიუ ბინი აღნიშნავს, რომ საზოგადოება და მედია ტესტების შედეგებს ზედმეტად ენდობა. „როდესაც ვისმენთ ფრაზებს, რომ „მოდელი დოქტორის დონის ინტელექტს“ აღწევს, არ ვართ დარწმუნებულნი, რომ ეს შეფასებები სწორად არის გაკეთებული,“ – ამბობს ბინი.

კვლევაში მოყვანილია მაგალითებიც. მაგალითად, ერთ-ერთი ფართოდ გამოყენებული ტესტი Grade School Math 8K (GSM8K) ამოწმებს მოდელის უნარს, როგორ პასუხობს ის საბაზო მათემატიკურ შეკითხვებს. თუმცა მაჰდის თქმით, სწორი პასუხები აუცილებად არ ნიშნავს, რომ მოდელი მათემატიკურ ლოგიკას რეალურად იაზრებს.

„თუ პირველკლასელს ეკითხები, რამდენია ორს პლუს ხუთი და გიპასუხებს შვიდი, ეს სწორი პასუხია. მაგრამ ნიშნავს თუ არა ეს, რომ მას მათემატიკური მსჯელობის უნარი აქვს? ალბათ – არა.“

კვლევის ავტორები ხაზს უსვამენ „კონსტრუქციული სიზუსტის“ აუცილებლობას, თუ რამდენად სწორად ზომავს ტესტი იმ რეალურ ფენომენს, რომლის შეფასებასაც ცდილობს. მათი განცხადებით, ტესტების დაახლოებით ნახევარი ვერ განსაზღვრას, კონკრეტულად რას აფასებს, რაც მათ სანდოობას ეჭვქვეშ აყენებს.

მეცნიერებმა რვაპუნქტიანი რეკომენდაციაც მოამზადეს, რომელიც ტესტების გამჭვირვალობისა და მეცნიერული ანალიზის საფუძვლიანობის გაუმჯობესებას ისახავს მიზნად. მათ შორისაა: შეფასების ზუსტი მიზნის განსაზღვრა; დავალებების ისეთი კომპლექტის შექმნა, რომელიც უკეთ ავლენს რეალურ უნარებს; მოდელების შედარებისას სტატისტიკური მეთოდების გამოყენება და ა.შ.

კვლევას დადებითი გამოხმაურება მოჰყვა სხვა ექსპერტების მხრიდანაც. „თუ გვსურს, რომ ტესტების შედეგები რეალურად გასაგები იყოს, მეტი მეცნიერული სიზუსტეა საჭირო. ეს საკონტროლო სია მკვლევრებისთვის საწყისი წერტილია იმის შესამოწმებლად, იქნება თუ არა მათი საორიენტაციო ტესტის შედეგები გამჭრიახი“, – აცხადებს METR AI-ის მკვლევარი ნიკოლა იურკოვიჩი.

AI-ტესტების სანდოობის საკითხი დღის წესრიგში აქამდეც დადგა. გასულ წელს კომპანია Anthropic-ის მკვლევრებმა ორგანიზაციებს ტესტების უფრო მკაცრი სტატისტიკური გადამოწმებისკენ მოუწოდეს, რათა დადგინდეს, მოდელის შედეგი რეალური შესაძლებლობების გამოხატულებაა თუ უბრალოდ „იღბლიანი დამთხვევა“.

ზოგიერთი კვლევითი ცენტრი უკვე მუშაობს ახალი ტიპის ტესტებზე, რომლებიც AI-მოდელების რეალურ სამყაროში ეკონომიკურად მნიშვნელოვან ამოცანებზე მუშაობას უკეთ აფასებს.

მაგალითად, OpenAI-მ სექტემბერში წარადგინა ტესტების ახალი სერია, რომელიც ხელოვნური ინტელექტის მუშაობას 44 სხვადასხვა პროფესიისთვის საჭირო ამოცანებზე დაყრდნობით აფასებს, რათა AI-ის შესაძლებლობები უკეთ დაასაბუთოს. მათ შორის, შეძლებს თუ არა AI გაყიდვების ანალიტიკოსის როლში Excel-ში შეცდომების გასწორებას, ან ვიდეოპროდიუსერის ამპლუაში 60-წამიანი ვიდეოს წარმოების გეგმის შედგენას.

ხელოვნური ინტელექტის უსაფრთხოების ცენტრის დირექტორმა, დენ ჰენდრიკსმა, მკვლევართა გუნდთან ერთად, შეიმუშავა ტესტების კომპლექტი, რომელიც AI-მოდელების უნარებს დისტანციური სამუშაოს ავტომატიზაციისთვის საჭირო ამოცანების შესრულების კუთხით აფასებს.

საბოლოოდ, კვლევის ავტორები ასკვნიან, რომ AI-ის მეცნიერული შეფასების მხოლოდ საწყის ეტაპზე ვართ და აღნიშნული კუთხით წინ რთული და საინტერესო გზა გველის.

Previous Post

ბაფეტმა მადლიერების დღისადმი მიძღვნილ წერილში საქველმოქმედო ტემპების დაჩქარების შესახებ განაცხადა

Next Post

Mark Zuckerberg promises to travel the entire United States in 2017

იზა გვარამაძე

Next Post

Mark Zuckerberg promises to travel the entire United States in 2017

Stay Connected test

  • 23.9k Followers
  • 99 Subscribers
  • Trending
  • Comments
  • Latest
როგორ ეხმარება Justice League-ი ბიზნესებს ციფრულ ეპოქაში?

როგორ ეხმარება Justice League-ი ბიზნესებს ციფრულ ეპოქაში?

April 6, 2026
ბეზოსი $6.2-მილიარდიან AI-სტარტაპს აარსებს და მისი თანახელმძღვანელი იქნება

ბეზოსი $6.2-მილიარდიან AI-სტარტაპს აარსებს და მისი თანახელმძღვანელი იქნება

March 17, 2026
მარტინ ლინდსტრომმა – ბრენდინგის #1 ექსპერტმა მსოფლიოში – „არქის“ რებრენდინგი განახორციელა

მარტინ ლინდსტრომმა – ბრენდინგის #1 ექსპერტმა მსოფლიოში – „არქის“ რებრენდინგი განახორციელა

March 17, 2026
Global Finance-მა თიბისი საქართველოში ვალუტის გაცვლითი სერვისების საუკეთესო მიმწოდებლად დაასახელა

Global Finance-მა თიბისი საქართველოში ვალუტის გაცვლითი სერვისების საუკეთესო მიმწოდებლად დაასახელა

April 29, 2026
Moderna კორონავირუსის საწინააღმდეგო ვაქცინის გლობალური მიწოდებისთვის ემზადება

Moderna კორონავირუსის საწინააღმდეგო ვაქცინის გლობალური მიწოდებისთვის ემზადება

0
ცუკერბერგი ყველა თანამშრომელს მადლიერების დღისთვის ერთკვირიან არდადეგებს აძლევს

ცუკერბერგი ყველა თანამშრომელს მადლიერების დღისთვის ერთკვირიან არდადეგებს აძლევს

0
ევროპის მასშტაბით კორონავირუსის ახალი სახეობა ვრცელდება – მკვლევარები

ევროპის მასშტაბით კორონავირუსის ახალი სახეობა ვრცელდება – მკვლევარები

0
პარიზში Disneyland-ი კიდევ ერთხელ დაიხურა

პარიზში Disneyland-ი კიდევ ერთხელ დაიხურა

0
როგორ ეხმარება Justice League-ი ბიზნესებს ციფრულ ეპოქაში?

როგორ ეხმარება Justice League-ი ბიზნესებს ციფრულ ეპოქაში?

April 6, 2026
Martin Lindstrom – the World’s #1 Branding Expert – Leads the Rebranding of Archi

Martin Lindstrom – the World’s #1 Branding Expert – Leads the Rebranding of Archi

March 17, 2026
მარტინ ლინდსტრომმა – ბრენდინგის #1 ექსპერტმა მსოფლიოში – „არქის“ რებრენდინგი განახორციელა

მარტინ ლინდსტრომმა – ბრენდინგის #1 ექსპერტმა მსოფლიოში – „არქის“ რებრენდინგი განახორციელა

March 17, 2026
თებერვალში ფულადი გზავნილები 26.9%-ით შემცირდა – საიდან გადმორიცხეს ყველაზე მეტი?

ოქტომბერში ფულადი გზავნილები 13.4%-ით გაიზარდა – საიდან გადმორიცხეს ყველაზე მეტი?

November 17, 2025

Recent News

როგორ ეხმარება Justice League-ი ბიზნესებს ციფრულ ეპოქაში?

როგორ ეხმარება Justice League-ი ბიზნესებს ციფრულ ეპოქაში?

April 6, 2026
Martin Lindstrom – the World’s #1 Branding Expert – Leads the Rebranding of Archi

Martin Lindstrom – the World’s #1 Branding Expert – Leads the Rebranding of Archi

March 17, 2026
მარტინ ლინდსტრომმა – ბრენდინგის #1 ექსპერტმა მსოფლიოში – „არქის“ რებრენდინგი განახორციელა

მარტინ ლინდსტრომმა – ბრენდინგის #1 ექსპერტმა მსოფლიოში – „არქის“ რებრენდინგი განახორციელა

March 17, 2026
თებერვალში ფულადი გზავნილები 26.9%-ით შემცირდა – საიდან გადმორიცხეს ყველაზე მეტი?

ოქტომბერში ფულადი გზავნილები 13.4%-ით გაიზარდა – საიდან გადმორიცხეს ყველაზე მეტი?

November 17, 2025
NewsLetter

სიახლეები თქვენს ინბოქსში

Facebook Instagram Linkedin Tiktok X-twitter Youtube

კატეგორიები

  • ახალი ამბები
  • პროფილი
  • მოსაზრებები
  • რეიტინგი
  • ღონისძიებები
  • გამოცემები
  • 30 Under 30
  • Forbes Women
  • Forbes
  • ჩვენ შესახებ
  • რეკლამა
  • სარედაქციო კოდექსი
  • მასალის გამოყენების პირობები
  • კონტაქტი

Developed By Web Features © 2026 All Rights Reserved

No Result
View All Result