Штучний інтелект досяг успіху в кодуванні, але не в історії — нове дослідження

Нове дослідження показало, що хоча штучний інтелект ефективно вирішує завдання, пов'язані з кодуванням, йому важко давати точні відповіді на історичні питання.

Штучний інтелект досяг значних успіхів у деяких сферах, таких як кодування, але його здатність справлятися з історичними запитаннями залишає бажати кращого, згідно з новим дослідженням.

Про це повідомляє TechCrunch.

Команда дослідників розробила спеціальний тест для перевірки знань трьох провідних мовних моделей — GPT-4 від OpenAI, Llama від Meta та Gemini від Google — з історії. Тест, відомий як Hist-LLM, використовує базу даних історичних знань Seshat Global History Databank для оцінки правильності відповідей. Результати дослідження, представлені на конференції NeurIPS, виявили, що навіть найкраща з моделей, GPT-4 Turbo, показала лише 46% точності, що ледь перевищує рівень випадкового вгадування.

Дослідники зазначили, що хоча великі мовні моделі ефективно справляються з базовими фактами, вони все ще не здатні глибоко розуміти складні історичні питання, які вимагають більш тонкого аналізу. Причиною такої слабкої роботи на історичних запитаннях, ймовірно, є схильність моделей екстраполювати дані з відомих та помітних історичних подій, що ускладнює їхнє опрацювання менш вивчених фактів.

Наприклад, GPT-4 неправильно відповів на запитання про наявність професійної армії в Давньому Єгипті, відповівши, що вона була, хоча правильна відповідь — ні. Дослідники припустили, що це сталося через надмірне використання даних про інші імперії, які мали постійні армії, на відміну від Єгипту.

Якщо вам скажуть А і В 100 разів і С 1 раз, а потім поставлять запитання про С, ви можете просто згадати А і Б і спробувати екстраполювати відповідь із них, — сказала дель Ріо-Чанона.

Результати також вказують на наявність упереджень у навчальних даних моделей, особливо в питаннях, що стосуються певних регіонів, таких як Африка на південь від Сахари.

Хоча штучний інтелект ще не може замінити людей у певних сферах історії, дослідники все ще сподіваються на його використання в майбутньому для допомоги історикам.

Загалом, хоча наші результати висвітлюють сфери, де LLM потребують удосконалення, вони також підкреслюють потенціал цих моделей для допомоги в історичних дослідженнях, - пише TechCrunch.

Нагадаємо, OpenAI запустила тестову версію функції нагадувань у ChatGPT для платних користувачів

Юлія Педюк - pravdatutnews.com

Теги:

штучний інтелект

дослідження

історія

GPT-4

Llama

Gemini

точність відповідей

штучний інтелект в історії

машинне навчання

NeurIPS

вівторок, 21 січня 2025 р., 21:19

Читайте також

Meta розглядає інвестицію $10 мільярдів у стартап зі штучного інтелекту Scale AI — Bloomberg

Якщо угода відбудеться, це стане одним із найбільших приватних фінансувань в історії.

08 червня 2025 р., 16:07

Американські вчені створили новий алгоритм для навчання ШІ на симетричних даних

Вчені Массачусетського технологічного інституту (MIT) розробили новий алгоритм, що дозволяє штучному інтелекту ефективно працювати з симетричними даними

04 серпня 2025 р., 18:46

Дослідження: штучний інтелект може поводитися як психопат і підтримувати шкідливі дії

Без критичного контролю прагматичність моделей може перетворитися на небезпечну байдужість

27 жовтня 2025 р., 12:48

Рекомендовані

8 листопада: гороскоп, іменини, свята

312-й день року (313-й у високосні роки) у григоріанському календарі. До кінця року залишається 53 дні

08 листопада 2025 р., 07:33

6 листопада: гороскоп, іменини, свята

310-й день року (311-й у високосні роки) у григоріанському календарі. До кінця року залишається 55 днів

06 листопада 2025 р., 07:44

25 жовтня: гороскоп, іменини, свята

298-й день року (299-й у високосні роки) у григоріанському календарі. До кінця року залишається 67 днів

25 жовтня 2025 р., 07:53

Loading...

Load next

Топ теми

Рух опору знищив чотири об’єкти військової логістики РФ – ГУР

У ГУР наголошують, що такі дії суттєво ускладнюють пересування військових вантажів Росії та порушують роботу її тилової інфраструктури

09 листопада 2025 р., 11:29

Війська РФ під Сумами потерпають від дезертирства та провалів у командуванні — ISW

Згідно з даними Генштабу ЗСУ, з початку повномасштабного вторгнення Росія втратила близько 1 150 100 військових, з них 1190 — за останню добу

09 листопада 2025 р., 09:05

У Воронежі вночі пролунали вибухи: ймовірно, влучання по місцевій ТЕЦ-1

У Міноборони РФ заявили, що протягом ночі системи ППО нібито збили 43 безпілотники над Брянською областю та один — над Ростовською

09 листопада 2025 р., 08:04

Останні новини

09 листопада

15:30 РФ атакувала Корабельний район Херсона: двоє людей поранені

Удар стався близько 12:45

15:03 Біля Японії стався сильний землетрус: є загроза цунамі

У неділю, 9 листопада, біля північно-східного узбережжя Японії стався землетрус магнітудою 6,7. Внаслідок цього може утворитися цунамі.

14:31 Сім авто, які знімуть із виробництва у найближчі роки

Світові автовиробники готуються поставити крапку в історії кількох знакових моделей, які протягом десятиліть формували вигляд автомобільного ринку

14:05 У Воронежі, Бєлгороді та Курську зникло світло після ракетних ударів

Хоча російська влада не уточнює причини більшості аварій, інциденти сталися на тлі активізації ударів по об’єктах енергетичної інфраструктури РФ

13:34 У США створили робота, який допомагає пожежникам працювати у надекстремальних умовах

Пристрій створюють у стартапі Paradigm Robotics, заснованому інженером Сіддхартом Такуром

13:00 Підозри командирам рф, які керували обстрілом Львова. Допомога при народженні дитини ПравдаТУТ Львів

У цьому випуску «Новини в ТЕМІ» дивіться: Львівська міськрада збільшує статутний капітал «Львівтеплоенерго» на 165 мільйонів гривень для стабільної роботи системи теплопостачання

12:39 Топ продуктів, які забезпечать добову норму вітаміну D

Отримати достатню кількість вітаміну D лише з їжею непросто

12:06 У Швеції дрон облив фарбою віллу російської делегації

За фактом вандалізму відкрито кримінальне провадження

11:29 Рух опору знищив чотири об’єкти військової логістики РФ – ГУР

У ГУР наголошують, що такі дії суттєво ускладнюють пересування військових вантажів Росії та порушують роботу її тилової інфраструктури

11:04 Байден розкритикував Трампа: “Він буквально руйнує країну”

Колишній президент США Джо Байден різко висловився на адресу свого наступника Дональда Трампа, заявивши, що той “зруйнував демократію” та навіть фізично пошкодив символ американської влади

10:36 Анджеліна Джолі розповіла, як під час візиту до України потрапила під загрозу дронів

Американська акторка та гуманітарна діячка Анджеліна Джолі поділилася враженнями від поїздки до південних регіонів України, зазначивши, що постійно відчувала небезпеку через російські дрони

10:07 Португалія наказала білорусам із тимчасовим захистом залишити країну

Згідно з рішенням AIMA, білоруси мають 20 днів, щоб добровільно залишити Португалію, інакше їм загрожує депортація

09:33 Сильна магнітна буря продовжить впливати на Землю 9–10 листопада

На Землі триває потужна магнітна буря, що розпочалася кілька днів тому

09:05 Війська РФ під Сумами потерпають від дезертирства та провалів у командуванні — ISW

Згідно з даними Генштабу ЗСУ, з початку повномасштабного вторгнення Росія втратила близько 1 150 100 військових, з них 1190 — за останню добу

08:38 Торнадо у Бразилії забрав життя шістьох людей і поранив сотні

Близько тисячі мешканців були змушені залишити свої домівки

08:04 У Воронежі вночі пролунали вибухи: ймовірно, влучання по місцевій ТЕЦ-1

У Міноборони РФ заявили, що протягом ночі системи ППО нібито збили 43 безпілотники над Брянською областю та один — над Ростовською

07:30 9 листопада: гороскоп, іменини, свята

313-й день року (314-й у високосні роки) в григоріанському календарі. До кінця року залишається 52 дні

00:15 Огляд букмекерської платформи Jonny 24 для онлайн-ставок

Онлайн-платформа Джонні надає можливість робити ставки на спортивні та кіберспортивні події. Вона функціонує як легальний букмекер і забезпечує доступ до широкого спектра ринків

Реклама

08 листопада

22:22 Вчені з'ясували, як темний шоколад покращує пам'ять

Дослідники з Японії з’ясували, що гіркі сполуки, які містяться в какао та ягодах, можуть покращувати пам’ять. Причому важливим є точний час, коли організм на них реагує

21:29 Прогноз погоди в Україні на 9 листопада: хмарно, місцями дощі

Завтра, 9 листопада, в Україні очікується хмарна з проясненнями погода

21:00 Візит Анджеліни Джолі, повітряна контрабанда, марафон ветерана у пам'ять про сина | ПравдаТУТЛьвів

У новому випуску «Новини В ТЕМІ» — головні події з України та Львівщини. Анджеліна Джолі знову в Україні: акторка відвідала Херсон і зустрілася з дітьми в укритті

20:31 Відключення світла 9 листопада: "Укренерго" вводить графіки на всю добу через наслідки атак

У неділю, 9 листопада, заходи обмеження споживання будуть застосовуватись всю добу у більшості регіонів України. Причиною є складна ситуація в енергосистемі, зумовлена російськими обстрілами 8 листопада

20:02 Чи можна залишати телефон на ніч на зарядці? Експерти дали чітку відповідь

Попри те, що сучасні моделі мають захист від перезаряджання, це питання залишається одним із найпопулярніших

19:36 Більше, ніж у лососі: названо 3 продукти з високим вмістом вітаміну D

Отримати достатню кількість вітаміну D тільки з їжі складно, але якщо говорити про харчові джерела, лосось посідає одне з перших місць. Він забезпечує майже 400 МО у кожній порції

19:08 "Центренерго" заявило про повну зупинку після наймасованішого удару РФ по всіх своїх ТЕС

В ніч на 8 листопада 2025 року російська армія завдала наймасованішого удару по ТЕС "Центренерго" з початку повномасштабної війни, уразивши одночасно всю генерацію компанії

Більше новин