ШІ поступився математикам у складному тесті: дослідники зафіксували обмеження нейромереж

У найсуворішому математичному випробуванні для штучного інтелекту найкращі моделі не змогли перевершити людей, розв’язавши лише частину задач

Фото: depositphotos

Передові системи штучного інтелекту все ще поступаються людям у складних математичних дослідженнях. Про це свідчить експеримент у межах проєкту First Proof, який вважається одним із найжорсткіших тестів для оцінки математичних можливостей ШІ, повідомляє WION.

У межах дослідження чотирьом сучасним моделям запропонували розв’язати десять задач дослідницького рівня. Важливо, що ці завдання не входили до навчальних даних моделей, а їхні відповіді перевіряли незалежні експерти-математики, що виключало можливість «підказок» або відтворення відомих рішень.

Організатори також підкреслили, що експеримент проходив автономно, без втручання людей у процес виконання завдань. До участі допускалися лише загальнодоступні системи штучного інтелекту, зокрема OpenAI з ChatGPT 5.5 Pro, а також розробки академічних команд із провідних університетів США та Швейцарії.

Деякі учасники використовували спеціальні автоматизовані системи («хернеси»), які змушували моделі багаторазово перевіряти та уточнювати свої відповіді.

Результати показали, що найуспішніша система змогла правильно розв’язати лише 6 із 10 задач. Оскільки всі завдання вже були відомі професійним математикам, це підтвердило: у роботі з новими дослідницькими проблемами людська експертиза поки що залишається сильнішою за штучний інтелект.

Автори дослідження зазначають, що ШІ ще потребує розвитку, перш ніж зможе повноцінно виступати як автономний інструмент для математичних доказів і дослідницької роботи.

До слова, дослідження: європейський ШІ Mistral гірше виявляє російську пропаганду, ніж американські та китайські моделі.

Стрілець Діана - pravdatutnews.com

Теги:

ші

математика

тест

дослідження

середа, 17 червня 2026 р., 12:02

Читайте також

Штучний інтелект здобув "золоту медаль" на Міжнародній математичній олімпіаді

Розробники ШІ вважають, що ці результати свідчать про те, що штучний інтелект починає наближатися до "елітного математичного мислення людини"

22 липня 2025 р., 19:34

ШІ підштовхує людей до брехні та обману: дослідження вчених

Дослідження показало, що використання штучного інтелекту (ШІ) може призводити до зростання неетичної поведінки серед людей.

24 вересня 2025 р., 15:01

Китай розробляє ШІ для розуміння мови тварин

Система збиратиме різноманітні дані про тварин, включаючи їхні голосові сигнали

10 травня 2025 р., 12:11

Рекомендовані

На яких пляжах України безпечно купатись, де заборонено, а які – не перевірено: повний перелік

Після початку сезону відпочинку на воді безпечність місць купання регулярно перевіряють фахівці територіальних лабораторій центрів контролю та профілактики хвороб.

21 червня 2026 р., 23:43

Уперше після народження третього малюка: 53-річна Кемерон Діас звернулась до фанів з двома пляшками

Кемерон Діас уперше з’явилася на зв’язку після народження третьої дитини: акторка, яка знову стала мамою у 53 роки, вирішила особисто прорекламувати червоне та біле вина власного винного бренду.

19 червня 2026 р., 06:26

Як п’ять забутих на острові корів поставили під сумнів теорію еволюції

П’ять корів, залишених на віддаленому острові Амстердам в Індійському океані ще у XIX столітті, несподівано перетворилися на кількатисячне стадо й поставили під сумнів класичну теорію «острівної карликовості».

18 червня 2026 р., 23:13

Loading...

Load next

Топ теми

На яких пляжах України безпечно купатись, де заборонено, а які – не перевірено: повний перелік

Після початку сезону відпочинку на воді безпечність місць купання регулярно перевіряють фахівці територіальних лабораторій центрів контролю та профілактики хвороб.

21 червня 2026 р., 23:43

Російський дрон вбив жінку в Запоріжжі, ще троє людей поранені

Унаслідок атаки безпілотника на приватний сектор загорівся житловий будинок

22 червня 2026 р., 09:02

Найдревнішим у світі готелем 1300 років керують 52 покоління однієї родини

Найстаріший готель світу — японський «Нісіяма Онсен Кейункан» — працює безперервно вже понад 1300 років.

22 червня 2026 р., 00:07

Останні новини

22 червня

23:44 Mitsubishi пропонує найдешевший електрокар за $11 700

Mitsubishi представила оновлений міський електрокар eK X EV — компактний кей-кар довжиною 3,4 м із запасом ходу 180 км, який після «зеленої» субсидії коштує лише $11 700.

23:33 Як швидко заснути у спеку: сомнолог порадила простий спосіб

У спекотні літні ночі заснути стає майже неможливо — організм не може охолодитися, серце працює швидше, а мозок залишається у стані тривожної бадьорості.

23:23 Стародавні римські записи підтвердили історію життя та страти Ісуса

У стародавніх римських текстах знайдено переконливі свідчення існування Ісуса Христа: згадки у працях Тацита та Йосифа Флавія підтверджують, що він був реальною історичною постаттю, страченою за правління Понтія Пілата.

23:13 «І в хорошому, і в поганому, і в потворному»: Міла Куніс розкрила секрети щасливого шлюбу з Катчером

Міла Куніс відверто розповіла про шлюб з Ештоном Кутчером, наголосивши: їхній союз тримається на довгій історії знайомства, відсутності секретів і взаємній повазі.

23:03 Директор НАБУ – про зарплати у бюро: «Ми не жируємо»

Директор НАБУ розкрив розміри зарплат детективів – детективи без досвіду отримують 75 тисяч грн.

22:52 Geely запускає у серію Galaxy Cruiser 700: гібридний гігант на 1113 к.с.

Geely офіційно запускає у серію Galaxy Cruiser 700 — гібридний позашляховик із піковою потужністю 1113 к.с., який поєднує бензиновий двигун та три електромотори.

22:42 Трихолог пояснила причини проблем із волоссям: що ми робимо не так

Більшість людей миє волосся неправильно — і саме ця звичка стає причиною тьмяності, ламкості та швидкого забруднення пасем.

22:32 Притули охрестили у Лаврі наймолодшого: 10-місячний Марко вже ходить

Відомий український волонтер, а у минулому ведучий і шоумен Сергій Притула з нагоди хрещення вперше показав обличчя молодшого сина.

22:02 Прокуратура викрила масштабну схему незаконної вирубки лісу зі збитками майже 250 млн грн

Правоохоронці повідомили про викриття злочинної мережі, до якої, за даними слідства, входили працівники лісової галузі, посадовці та підприємці. Через незаконну вирубку лісу державі завдано збитків на 248,6 млн гривень

21:43 Вчені з’ясували, як коні поширилися між континентами у давнину

Генетичний аналіз викопних решток показав, що вимерлий даляньський кінь міг бути важливою ланкою в поширенні північноамериканського генетичного походження серед коней Євразії

21:33 У росії пояснюють відмову від сирен під час атак страхом паніки та втомою населення — розвідка

У низці регіонів росії місцева влада не вмикає системи повітряного оповіщення під час атак безпілотників, пояснюючи це ризиком паніки, звиканням до тривог та психологічним навантаженням на населення

21:16 Конституцію України вперше повністю переклали жестовою мовою

До 30-річчя Конституції України в країні вперше створили повний переклад Основного закону українською жестовою мовою, щоб зробити його доступнішим для людей із порушеннями слуху

20:58 Гравці в Zelda почуваються менш самотніми — дослідження пов’язує це зі стоїцизмом

Дослідження показало, що гравці в The Legend of Zelda та Yoshi’s Crafted World мають нижчий рівень самотності та вищий рівень стоїцизму, який може допомагати краще справлятися з емоціями

20:41 У Туреччині затримали активістів після протесту біля французького фрегата НАТО

У Мармарисі поліція затримала чотирьох людей після акції протесту проти НАТО поблизу французького військового корабля, який перебував у порту в межах місії Альянсу

20:20 На Харківщині після обстрілів не працює жодна АЗС — пошкоджено інфраструктуру

У Богодухівській громаді на Харківщині внаслідок російських обстрілів зупинили роботу всі заправні станції, є поранені та пошкодження критичної інфраструктури

20:07 Генетична схильність до набору ваги стала сильніше проявлятися в поколіннях «епідемії ожиріння» — дослідження

Вчені встановили, що зв’язок між генами та підвищеним індексом маси тіла майже вдвічі сильніший у людей, які народилися в епоху «епідемії ожиріння», порівняно з попередніми поколіннями

19:44 Дієтологи назвали 6 консервів, які можуть допомогти знизити тиск

Фахівці розповіли, що деякі консервовані продукти можуть бути корисними для людей із високим кров’яним тиском, якщо обирати варіанти з низьким вмістом натрію та без доданого цукру

19:27 У Києві посадовиці оголосили підозру через ймовірну переплату майже 700 тис. грн на обладнанні для шкіл

Правоохоронці підозрюють посадовицю у розтраті бюджетних коштів під час закупівлі навчального обладнання для шкільних кабінетів біології — переплата, за даними слідства, становила близько 700 тисяч гривень

19:16 Стрес допоміг джмелям краще бачити й швидше ухвалювати рішення — дослідження

Стресові умови, схожі на атаку хижака, не погіршили, а навпаки покращили зорові здібності джмелів і пришвидшили їхнє прийняття рішень без втрати точності

19:03 Солодкі напої в дитинстві пов’язані з підвищеним ризиком гіпертонії в дорослому віці — дослідження

Часте споживання солодких напоїв у дитинстві може суттєво підвищувати ризик високого артеріального тиску в дорослому віці, свідчить масштабне дослідження, опубліковане в журналі Circulation

18:45 У “Паспортних сервісах” запроваджують нову верифікацію під час запису до е-черги на закордонний паспорт

У центрах Паспортний сервіс тестують оновлений механізм підтвердження особи через BankID НБУ під час онлайн-запису до електронної черги

18:34 У Steam продають гру за $1000, яку можна завершити за кілька хвилин

На платформі Steam з’явився незвичний проєкт Congratulations On Your Purchase, який претендує на звання найдорожчої гри сервісу та коштує тисячу доларів

18:16 У Німеччині знайшли загублене середньовічне поселення, про яке знали лише з документів

Археологи виявили сліди поселення Ехене, яке зникло з історичних джерел близько 600 років тому та тривалий час вважалося втраченим

18:02 ДЕСС перевірить Почаївську лавру на можливі зв’язки із забороненими релігійними структурами

Державна служба України з етнополітики та свободи совісті розпочне перевірку Почаївської Свято-Успенської лаври щодо можливих ознак афілійованості з іноземною релігійною організацією, діяльність якої заборонена в Україні

17:43 Не лише квасоля: 6 продуктів, які допоможуть добрати клітковину

Важливе не одне джерело, а різноманіття бобових, овочів, фруктів, цільнозернових продуктів і насіння.

Більше новин