ШІ провалив тест на деменцію: старіші версії гірше справляються із завданнями на увагу та пам’ять

Науковці з’ясували, що старіші моделі штучного інтелекту демонструють гірші когнітивні здібності порівняно з новішими. Для цього дослідники провели тестування, яке використовується для діагностики деменції та хвороби Альцгеймера у людей.
Дослідження опубліковане в журналі BMJ.
Результати показали, що старіші версії ШІ гірше впоралися із завданнями на візуальне та просторове мислення, зосередження та навчання. Зокрема, усі моделі зазнали невдачі у тесті на малювання годинника, який має показувати 11:10.
Науковці вирішили протестувати когнітивні здібності ШІ, оскільки він відіграє дедалі більшу роль у повсякденному житті та медицині, зокрема у діагностиці захворювань. У дослідженні взяли участь п’ять моделей: ChatGPT-4, ChatGPT-4o, Claude 3.5, Gemini 1 і Gemini 1.5. Всі вони допустили помилки в тестах на навчання, запам’ятовування та концентрацію уваги.
Старіші моделі, такі як Gemini 1 і Gemini 1.5, частіше помилялися при виконанні завдань, що вимагали просторово-часового мислення. Найстаріша модель, Gemini 1, також продемонструвала гірші результати у тестах на увагу та запам’ятовування інформації.
Дослідники наголошують, що хоча ці результати мають певні паралелі з віковими змінами у людей, штучний інтелект і людський мозок функціонують по-різному. Вони також рекомендують не покладатися на ШІ в завданнях, що потребують високого рівня просторово-часового мислення чи виконавчих функцій.
Нагадаємо, ШІ Gemini тепер запам'ятовуватиме попередні розмови
Олена Стебніцька - pravdatutnews.com





