ШІ впорався гірше з обрахунками, ніж люди - нове дослідження

Дослідники вважають, що ШІ ще не може повністю замінити людську експертизу в математиці.

Фото: pexels

Передові системи штучного інтелекту продовжують швидко розвиватися, однак у складних дослідницьких математичних задачах вони поки поступаються найкращим фахівцям-людям.

Про це повідомляє WION.

Йдеться про результати тестування в межах проєкту First Proof. Його називають одним із найсуворіших тестів для перевірки математичних здібностей ШІ.

Чотирьом передовим системам штучного інтелекту запропонували розв’язати 10 складних задач дослідницького рівня. Особливість тесту полягала в тому, що ці питання не були частиною навчальних даних моделей. Тобто системи не могли просто відтворити вже відомі відповіді.

Виконання завдань відбувалося автономно, без участі людей у процесі розв’язання. До тестування допускали лише загальнодоступні ШІ-системи.

Серед учасників були OpenAI, а також академічні групи з Каліфорнійського університету, Принстонського університету та Швейцарського федерального інституту технологій у Цюриху. Команди використовували автоматизовані системи, які змушували чат-боти багаторазово перевіряти та уточнювати власні відповіді.

Результати показали, що найкраща система змогла розв’язати 6 із 10 задач. Відповіді перевіряли незалежні експерти-математики.

Усі завдання, які отримали моделі, раніше вже були розв’язані професійними математиками. Саме тому організатори дійшли висновку, що людська експертиза поки залишається сильнішою у роботі з новими математичними проблемами дослідницького рівня.

Автори проєкту зазначають, що ШІ ще має пройти довгий шлях, перш ніж зможе автономно бути надійним помічником у математичних дослідженнях. Зокрема, йдеться про перевірку доказів і повноцінне розв’язання складних наукових задач.

До слова, китайські хакери понад рік шпигували через Google Workspace: компанія розкрила деталі атаки.

Юлія Люшньова - pravdatutnews.com

Теги:

ші

штучний інтелект

математика

технології

OpenAI

середа, 17 червня 2026 р., 19:33

Читайте також

ChatGPT Plus для всіх жителів Великої Британії: чому ідея не втілилася

Ідея передбачала безкоштовний преміум-доступ до ChatGPT для всіх мешканців Британії, а потенційна вартість проєкту оцінювалася у 2 мільярди фунтів стерлінгів

25 серпня 2025 р., 18:47

Apple планує впровадити ШІ-пошук у Safari

Apple веде переговори з OpenAI, Perplexity та іншими компаніями щодо впровадження пошуку на основі штучного інтелекту в Safari.

08 травня 2025 р., 16:24

Штучний інтелект здобув "золоту медаль" на Міжнародній математичній олімпіаді

Розробники ШІ вважають, що ці результати свідчать про те, що штучний інтелект починає наближатися до "елітного математичного мислення людини"

22 липня 2025 р., 19:34

Рекомендовані

Скільки часу алкоголь виводиться з організму та як довго його виявляють тести

Алкоголь може залишатися в організмі людини від кількох годин до доби, а його сліди — навіть до трьох місяців.

25 червня 2026 р., 06:36

50-річна Lama пояснила переваги стосунків із на 18 років молодшим: «Раджу всім жінкам»

50-річна співачка Lama (Наталія Дзеньків) відверто пояснила, чому їй комфортніше будувати стосунки з набагато молодшим за себе чоловіком.

25 червня 2026 р., 06:16

Loading...

Load next

Топ теми

ЗСУ ліквідували ще 1270 окупантів: ворог втратив 67 артсистем за добу

За минулу добу Сили оборони України знищили 1270 російських військових. Також значних втрат зазнала техніка окупантів, зокрема артилерія та безпілотники

25 червня 2026 р., 08:28

Останні новини

26 червня

00:28 Новий робот-собака плаває, лазить по горах і працює при -30 – +55°C

Китайський робот собака Lynx M20S — це не просто чергова демонстрація інженерної майстерності, а справжній прорив у сфері автономної робототехніки.

25 червня

23:53 У Німеччині недорого продають найменший у світі неоготичний замок: чим він цікавий

У Гамбурзі виставили на продаж найменший замок у світі — неоготичний Геннеберґ, збудований у XIX столітті на березі Альстера.

23:33 Новий Audi Q3 вже в Україні: компактний, преміальний і найдешевший водночас

Audi представила в Україні новий Q3 третього покоління — компактний, але технологічно зрілий кросовер на платформі MQB Evo, який поєднує преміальний комфорт із помірною ціною.

23:23 Літній суперфуд українців: чому лікарі радять їсти малину щодня

Малина у сезоні — це не просто літній десерт, а справжній суперфуд: вона багата на антиоксиданти, вітаміни та мікроелементи, допомагає зміцнити імунітет, нормалізувати травлення й навіть знизити ризики серцево-судинних та нейродегенеративних хвороб.

23:13 Запроваджено нові умови для бронювання працівників: вимоги зросли в рази

Держава суттєво підняла планку для підприємств, які хочуть отримати статус критично важливих для економіки - а разом із ним і право на бронювання співробітників.

23:03 «Людина-павук» у костюмі Louis Vuitton, Зендея – у вінтажному павутинні від Armani

«Людина павук» у костюмі Louis Vuitton, Зендея – у павутинні від Armani: найефектніша пара Голлівуду ефектно продовжила престур свого майбутнього фільму "Людина-павук: Абсолютно новий день" у Римі.

22:52 Mitsubishi знайшла спосіб зробити Outlander Sport дешевшим

Mitsubishi повернула передній привід у лінійку Outlander Sport 2027, зробивши кросовер доступнішим — базова версія тепер коштує $25 505 у США, що на $1500 менше, ніж торік.

22:42 Лікарі застерігають: спека провокує загострення хронічних хвороб – як вберегтися

У літню спеку лікарі попереджають: високі температури не лише виснажують організм, а й провокують загострення хронічних хвороб — від серцево судинних проблем до мігрені.

22:32 Ще дві популярні довідки відтепер можна отримати через Дію

Відтепер довідки ОК-5 та ОК-7 можна отримувати через Мультишеринг у Дії миттєво — разом з іншими необхідними документами

21:50 Прогноз погоди на 26 червня

26 червня більшість областей залишатимуться під впливом антициклону, однак на сході та півдні місцями можливі короткочасні грози

21:31 Продукти, які варто їсти ввечері для зменшення стресу

Харчування перед сном може впливати на рівень кортизолу, якість сну та загальне відчуття напруги

21:16 Міністерка Швеції привела тримісячного сина на засідання Ради ЄС

Інцидент у Люксембурзі став, ймовірно, першим випадком участі немовляти в міністерській зустрічі Євросоюзу

21:00 Фіктивна бронь, вирок хірургу та 18 мільйонів збитків: головні новини Львова | ПравдаТУТ Львів

20:47 У Мексиці виявили загублене місто мая, приховане джунглями понад тисячу років

Археологи за допомогою LiDAR знайшли місто “Мінанбе” з пірамідою, храмами та унікальними артефактами

20:32 Що відбувається з рівнем цукру в крові, коли ти їси заквасний хліб

Ферментація змінює спосіб, у який організм засвоює вуглеводи, тому заквасний хліб впливає на глюкозу м’якше, ніж звичайний білий хліб

20:20 Суд у Росії заочно засудив Коломойського до 12 років ув’язнення у справі про “розкрадання нафти”

Разом із ним вироки отримали ще кілька українських бізнесменів у справі, що стосується подій 2006–2007 років

20:02 ЄС може отримати нових членів до 2029 року — Марта Кос назвала можливі країни

Єврокомісарка з питань розширення заявила про прискорення переговорів і пов’язала це з війною в Україні

19:46 У Мексиці автомобіль в’їхав у натовп футбольних фанатів під час святкування перемоги над Чехією

У Кабо-Сан-Лукас постраждали щонайменше 17 людей, одну людину госпіталізували у важкому стані

19:34 Франція підтвердила перший випадок Еболи у лікаря, який повернувся з ДР Конго

Пацієнта ізолювали одразу після прибуття, влада розпочала відстеження контактів, ризик для населення оцінюють як низький

19:19 Менопавза: в які міфи варто перестати вірити — пояснюють експерти

Фахівці розвінчують поширені помилки про менопаузу та перименопаузу, які часто вводять жінок в оману

19:00 «Жити — це теж перемагати війну». Володимир Станчишин про провину, радість і втрати |ПравдаТУТ Львів

18:44 Путін “блефує” ядерними погрозами та демонструє слабкість — американський чиновник

У США заявили, що риторика Кремля про ядерну зброю свідчить не про силу, а про невпевненість Росії та зміну глобального ядерного балансу

18:28 Опитування Pew: більшість у світі не довіряє Трампу

Лише 23% респондентів у 36 країнах висловили впевненість у здатності президента США Дональда Трампа вести міжнародні справи

18:08 Україна отримає £210 млн на ядерне паливо для АЕС

Фінансування від Великої Британії забезпечить стабільні постачання ядерного палива для українських атомних електростанцій упродовж наступних двох років

17:49 Україна залучить понад 1 млрд євро для енергетики за підсумками конференції у Гданську

У межах Конференції з відновлення України державні та приватні енергетичні компанії підписують десятки угод із міжнародними партнерами щодо фінансування та постачання обладнання

Більше новин