ევროპის მაუწყებელთა კავშირის (EBU) მიერ ჩატარებული კვლევის მიხედვით, ხელოვნური ინტელექტის პოპულარული სისტემები – მათ შორის ChatGPT, Copilot, Gemini და Perplexity, ხშირად არაზუსტ ან დამახინჯებულ პასუხებს იძლევიან. ამის შესახებ DW წერს.
კვლევის ავტორებმა 3000-ზე მეტი პასუხი სხვადასხვა კრიტერიუმის მიხედვით შეაფასეს:
ფაქტობრივი სიზუსტე,
წყაროს არსებობა და ხარისხი,
ფაქტისა და მოსაზრების გარჩევა,
კონტექსტის სწორად მიწოდება.
მიღებული შედეგებით, ხელოვნური ინტელექტის პასუხების 45% ვერ აკმაყოფილებდა ერთ ან რამდენიმე კრიტერიუმს.
მათ შორის, შემთხვევათა 31%-ში მითითებული წყარო საერთოდ არ არსებობდა ან არ იყო დაკავშირებული პასუხთან, ხოლო 20%-ში გამოგონილი დეტალები ან მოძველებული ინფორმაცია იყო მიწოდებული.
ყველაზე სუსტად თავი Gemini-მ წარმოაჩინა, რომლის პასუხებში სიზუსტესა და სისწორესთან დაკავშირებული პრობლემები 76%-ში დაფიქსირდა.
ევროპის მაუწყებელთა კავშირი აცხადებს, რომ მსგავსი კვლევები უნდა გახდეს რეგულარული და განმეორებადი, რადგან ხელოვნური ინტელექტის სწრაფი განვითარება დამოუკიდებელ და მუდმივ მონიტორინგს მოითხოვს.
აღსანიშნავია, რომ კვლევაში 11 ევროპული ქვეყნის საზოგადოებრივი მედიაორგანიზაცია მონაწილეობდა.