“Maksimum Truth” portalı böyük dil modelləri əsasında on iki müxtəlif chatbotları sınaqdan keçirib. Məlum olub ki, ChatGPT oxşar botların arasında ən ağıllısı deyil və reytinqin lideri İQ səviyyəsinə görə insanın göstəridyi orta İQ göstəricisini ötüb.
Çatbotların bacarıqlarını yoxlamaq üçün jurnalistlər 35 sualdan ibarət Norveç Mensa IQ testindən istifadə ediblər və onların çoxu illüstrasiyalarla müşayiət olunub. Əvvəlcə bütün chatbotlar şəkilləri düzgün anlaya bilmədiklərinə görə testdən keçə bilmədilər. Ancaq mətndə “sanki kor, amma ağıllı bir insana” təsvir edildikdə, onlar tapşırığı uğurla yerinə yetirə bildilər.

Test imtahanının nəticələrinə əsasən, ChatGPT-4 35 sualdan 13-nə düzgün cavab verərək 85 bal toplayıb və ikinci yeri tutub. Lider 101 balla AI modeli Claude-3 idi: bu, insanən orta göstəricisindən bir qədər çoxdur. Jurnalistlərin özlərinin də dediklərinə görə, analoji imtahanda cəmi 85 bal toplaya bildilər.
Üçüncü yeri Klodun əvvəlki versiyası (82 xal) tutub. Çatbot Microsoft Copilot (79) dördüncü, Google Gemini-nin baza versiyası (77.5) isə cəmi 76 xal toplayan Advanced modifikasiyasını qabaqlayaraq beşinci yerdə qərarlaşıb.
