Штучний інтелект досяг успіху в кодуванні, але не в історії — нове дослідження

Штучний інтелект досяг успіху в кодуванні, але не в історії — нове дослідження
Нове дослідження показало, що хоча штучний інтелект ефективно вирішує завдання, пов'язані з кодуванням, йому важко давати точні відповіді на історичні питання.

Штучний інтелект досяг значних успіхів у деяких сферах, таких як кодування, але його здатність справлятися з історичними запитаннями залишає бажати кращого, згідно з новим дослідженням.

Про це повідомляє TechCrunch.

Команда дослідників розробила спеціальний тест для перевірки знань трьох провідних мовних моделей — GPT-4 від OpenAI, Llama від Meta та Gemini від Google — з історії. Тест, відомий як Hist-LLM, використовує базу даних історичних знань Seshat Global History Databank для оцінки правильності відповідей. Результати дослідження, представлені на конференції NeurIPS, виявили, що навіть найкраща з моделей, GPT-4 Turbo, показала лише 46% точності, що ледь перевищує рівень випадкового вгадування.

Дослідники зазначили, що хоча великі мовні моделі ефективно справляються з базовими фактами, вони все ще не здатні глибоко розуміти складні історичні питання, які вимагають більш тонкого аналізу. Причиною такої слабкої роботи на історичних запитаннях, ймовірно, є схильність моделей екстраполювати дані з відомих та помітних історичних подій, що ускладнює їхнє опрацювання менш вивчених фактів.

Наприклад, GPT-4 неправильно відповів на запитання про наявність професійної армії в Давньому Єгипті, відповівши, що вона була, хоча правильна відповідь — ні. Дослідники припустили, що це сталося через надмірне використання даних про інші імперії, які мали постійні армії, на відміну від Єгипту.

Якщо вам скажуть А і В 100 разів і С 1 раз, а потім поставлять запитання про С, ви можете просто згадати А і Б і спробувати екстраполювати відповідь із них, — сказала дель Ріо-Чанона.

Результати також вказують на наявність упереджень у навчальних даних моделей, особливо в питаннях, що стосуються певних регіонів, таких як Африка на південь від Сахари.

Хоча штучний інтелект ще не може замінити людей у певних сферах історії, дослідники все ще сподіваються на його використання в майбутньому для допомоги історикам.

Загалом, хоча наші результати висвітлюють сфери, де LLM потребують удосконалення, вони також підкреслюють потенціал цих моделей для допомоги в історичних дослідженнях, - пише TechCrunch.

Нагадаємо, OpenAI запустила тестову версію функції нагадувань у ChatGPT для платних користувачів

Юлія Педюк - pravdatutnews.com

Читайте також
Новий метод дозволяє обманювати чат-боти ChatGPT і Gemini – дослідники Новий метод дозволяє обманювати чат-боти ChatGPT і Gemini – дослідники
Група науковців з Intel, Університету штату Айдахо та Університету Іллінойсу представила нову техніку, що дозволяє обійти системи безпеки у великих мовних моделях
Американські вчені створили новий алгоритм для навчання ШІ на симетричних даних Американські вчені створили новий алгоритм для навчання ШІ на симетричних даних
Вчені Массачусетського технологічного інституту (MIT) розробили новий алгоритм, що дозволяє штучному інтелекту ефективно працювати з симетричними даними
Китай розробляє ШІ для розуміння мови тварин Китай розробляє ШІ для розуміння мови тварин
Система збиратиме різноманітні дані про тварин, включаючи їхні голосові сигнали
Loading...
Load next