Штучний інтелект досяг успіху в кодуванні, але не в історії — нове дослідження

Нове дослідження показало, що хоча штучний інтелект ефективно вирішує завдання, пов'язані з кодуванням, йому важко давати точні відповіді на історичні питання.

Штучний інтелект досяг значних успіхів у деяких сферах, таких як кодування, але його здатність справлятися з історичними запитаннями залишає бажати кращого, згідно з новим дослідженням.

Про це повідомляє TechCrunch.

Команда дослідників розробила спеціальний тест для перевірки знань трьох провідних мовних моделей — GPT-4 від OpenAI, Llama від Meta та Gemini від Google — з історії. Тест, відомий як Hist-LLM, використовує базу даних історичних знань Seshat Global History Databank для оцінки правильності відповідей. Результати дослідження, представлені на конференції NeurIPS, виявили, що навіть найкраща з моделей, GPT-4 Turbo, показала лише 46% точності, що ледь перевищує рівень випадкового вгадування.

Дослідники зазначили, що хоча великі мовні моделі ефективно справляються з базовими фактами, вони все ще не здатні глибоко розуміти складні історичні питання, які вимагають більш тонкого аналізу. Причиною такої слабкої роботи на історичних запитаннях, ймовірно, є схильність моделей екстраполювати дані з відомих та помітних історичних подій, що ускладнює їхнє опрацювання менш вивчених фактів.

Наприклад, GPT-4 неправильно відповів на запитання про наявність професійної армії в Давньому Єгипті, відповівши, що вона була, хоча правильна відповідь — ні. Дослідники припустили, що це сталося через надмірне використання даних про інші імперії, які мали постійні армії, на відміну від Єгипту.

Якщо вам скажуть А і В 100 разів і С 1 раз, а потім поставлять запитання про С, ви можете просто згадати А і Б і спробувати екстраполювати відповідь із них, — сказала дель Ріо-Чанона.

Результати також вказують на наявність упереджень у навчальних даних моделей, особливо в питаннях, що стосуються певних регіонів, таких як Африка на південь від Сахари.

Хоча штучний інтелект ще не може замінити людей у певних сферах історії, дослідники все ще сподіваються на його використання в майбутньому для допомоги історикам.

Загалом, хоча наші результати висвітлюють сфери, де LLM потребують удосконалення, вони також підкреслюють потенціал цих моделей для допомоги в історичних дослідженнях, - пише TechCrunch.

Нагадаємо, OpenAI запустила тестову версію функції нагадувань у ChatGPT для платних користувачів

Юлія Педюк - pravdatutnews.com

Теги:

штучний інтелект

дослідження

історія

GPT-4

Llama

Gemini

точність відповідей

штучний інтелект в історії

машинне навчання

NeurIPS

вівторок, 21 січня 2025 р., 21:19

Читайте також

Meta розглядає інвестицію $10 мільярдів у стартап зі штучного інтелекту Scale AI — Bloomberg

Якщо угода відбудеться, це стане одним із найбільших приватних фінансувань в історії.

08 червня 2025 р., 16:07

Дослідження: штучний інтелект може поводитися як психопат і підтримувати шкідливі дії

Без критичного контролю прагматичність моделей може перетворитися на небезпечну байдужість

27 жовтня 2025 р., 12:48

Новий метод дозволяє обманювати чат-боти ChatGPT і Gemini – дослідники

Група науковців з Intel, Університету штату Айдахо та Університету Іллінойсу представила нову техніку, що дозволяє обійти системи безпеки у великих мовних моделях

09 липня 2025 р., 13:49

Рекомендовані

8 листопада: гороскоп, іменини, свята

312-й день року (313-й у високосні роки) у григоріанському календарі. До кінця року залишається 53 дні

08 листопада 2025 р., 07:33

6 листопада: гороскоп, іменини, свята

310-й день року (311-й у високосні роки) у григоріанському календарі. До кінця року залишається 55 днів

06 листопада 2025 р., 07:44

25 жовтня: гороскоп, іменини, свята

298-й день року (299-й у високосні роки) у григоріанському календарі. До кінця року залишається 67 днів

25 жовтня 2025 р., 07:53

Loading...

Load next

Топ теми

Росіяни протягом дня атакували три громади Сумщини: поранено жінку

Упродовж 9 листопада війська РФ завдали кількох ударів дронами по території Сумської області

09 листопада 2025 р., 18:06

РФ атакувала Корабельний район Херсона: двоє людей поранені

Удар стався близько 12:45

09 листопада 2025 р., 15:30

Рух опору знищив чотири об’єкти військової логістики РФ – ГУР

У ГУР наголошують, що такі дії суттєво ускладнюють пересування військових вантажів Росії та порушують роботу її тилової інфраструктури

09 листопада 2025 р., 11:29

Останні новини

09 листопада

21:45 Прогноз погоди в Україні на 10 листопада: хмарно, дощі

10 листопада в Україні буде хмарно

21:03 Пожежа трамвая, LEGO-мультфільм про Стуса та нові культурні події міста | ПравдаТУТ Львів

У цьому випуску «Новини в ТЕМІ» дивіться: у центрі Львова згорів трамвай — вагон вигорів ущент просто на площі Митній.

20:31 SpaceX успішно відправила на орбіту ще 29 супутників Starlink

Загалом, з початку 2025 року SpaceX здійснила вже 143 запуски ракети Falcon 9. Із цієї кількості 103 місії були спрямовані на розбудову сузір'я Starlink

20:13 В Україні оголосили обов'язкову евакуацію з деяких населених пунктів на Запоріжжі та Дніпропетровщині

Це рішення ухвалено за підсумками засідання Координаційного штабу з проведення евакуаційних заходів та ефективного реагування на масове переміщення населення. Засідання провів заступник Міністра розвитку громад та територій Олексій Рябикін

20:02 Китай скасував заборону на експорт до США рідкісноземельних металів

Заборона діяла з грудня 2024 року

19:39 П’ять чаїв, які корисніші за зелений: поради дієтологів

Багато людей обирають зелений чай, щоб підвищити споживання антиоксидантів, адже він містить катехіни — флавоноїди, які зменшують запалення, захищають клітини та знижують ризик серцево-судинних і хронічних захворювань.

19:01 Кохана проїхала 2 тисячі кілометрів, щоб знайти чоловіка після бою | ПравдаТУТ Львів

Розповідь військовослужбовця, який 2022 році служив на зеленому кордоні, а згодом добровільно вирушив на Схід — до підрозділу швидкого реагування «Шквал».

18:33 Як відновити ґрунт після картоплі: ефективні способи

Тривале вирощування картоплі на одному місці часто призводить до виснаження ґрунту.

18:06 Росіяни протягом дня атакували три громади Сумщини: поранено жінку

Упродовж 9 листопада війська РФ завдали кількох ударів дронами по території Сумської області

17:38 США призупинили продаж озброєння союзникам через шатдаун

Йдеться як про прямий продаж зброї від уряду США союзникам по Альянсу, так і про видачу ліцензій приватним американським оборонним компаніям на експорт їхньої продукції

17:01 Супертайфун на Філіппінах: понад 900 тисяч людей евакуювали

Управління цивільної авіації країни повідомило про скасування майже 400 рейсів — як внутрішніх, так і міжнародних — через наближення негоди

16:33 У Танзанії виявили три нові види жаб, які народжують живих дитинчат

Дослідники знайшли у гірських лісах Східної Дуги в Танзанії три нові види деревних ропух роду Nectophrynoides

16:10 Британія посилить оборону Бельгії після вторгнення невідомих дронів

Велика Британія направить військовий персонал та обладнання до Бельгії для посилення її оборони у відповідь на вторгнення невідомих дронів у повітряний простір країни

15:30 РФ атакувала Корабельний район Херсона: двоє людей поранені

Удар стався близько 12:45

15:03 Біля Японії стався сильний землетрус: є загроза цунамі

У неділю, 9 листопада, біля північно-східного узбережжя Японії стався землетрус магнітудою 6,7. Внаслідок цього може утворитися цунамі.

14:31 Сім авто, які знімуть із виробництва у найближчі роки

Світові автовиробники готуються поставити крапку в історії кількох знакових моделей, які протягом десятиліть формували вигляд автомобільного ринку

14:05 У Воронежі, Бєлгороді та Курську зникло світло після ракетних ударів

Хоча російська влада не уточнює причини більшості аварій, інциденти сталися на тлі активізації ударів по об’єктах енергетичної інфраструктури РФ

13:34 У США створили робота, який допомагає пожежникам працювати у надекстремальних умовах

Пристрій створюють у стартапі Paradigm Robotics, заснованому інженером Сіддхартом Такуром

13:00 Підозри командирам рф, які керували обстрілом Львова. Допомога при народженні дитини ПравдаТУТ Львів

У цьому випуску «Новини в ТЕМІ» дивіться: Львівська міськрада збільшує статутний капітал «Львівтеплоенерго» на 165 мільйонів гривень для стабільної роботи системи теплопостачання

12:39 Топ продуктів, які забезпечать добову норму вітаміну D

Отримати достатню кількість вітаміну D лише з їжею непросто

12:06 У Швеції дрон облив фарбою віллу російської делегації

За фактом вандалізму відкрито кримінальне провадження

11:29 Рух опору знищив чотири об’єкти військової логістики РФ – ГУР

У ГУР наголошують, що такі дії суттєво ускладнюють пересування військових вантажів Росії та порушують роботу її тилової інфраструктури

11:04 Байден розкритикував Трампа: “Він буквально руйнує країну”

Колишній президент США Джо Байден різко висловився на адресу свого наступника Дональда Трампа, заявивши, що той “зруйнував демократію” та навіть фізично пошкодив символ американської влади

10:36 Анджеліна Джолі розповіла, як під час візиту до України потрапила під загрозу дронів

Американська акторка та гуманітарна діячка Анджеліна Джолі поділилася враженнями від поїздки до південних регіонів України, зазначивши, що постійно відчувала небезпеку через російські дрони

10:07 Португалія наказала білорусам із тимчасовим захистом залишити країну

Згідно з рішенням AIMA, білоруси мають 20 днів, щоб добровільно залишити Португалію, інакше їм загрожує депортація

Більше новин