ШІ впорався гірше з обрахунками, ніж люди - нове дослідження

ШІ впорався гірше з обрахунками, ніж люди - нове дослідження
Дослідники вважають, що ШІ ще не може повністю замінити людську експертизу в математиці.

Фото: pexels

Передові системи штучного інтелекту продовжують швидко розвиватися, однак у складних дослідницьких математичних задачах вони поки поступаються найкращим фахівцям-людям.

Про це повідомляє WION.

Йдеться про результати тестування в межах проєкту First Proof. Його називають одним із найсуворіших тестів для перевірки математичних здібностей ШІ.

Чотирьом передовим системам штучного інтелекту запропонували розв’язати 10 складних задач дослідницького рівня. Особливість тесту полягала в тому, що ці питання не були частиною навчальних даних моделей. Тобто системи не могли просто відтворити вже відомі відповіді.

Виконання завдань відбувалося автономно, без участі людей у процесі розв’язання. До тестування допускали лише загальнодоступні ШІ-системи.

Серед учасників були OpenAI, а також академічні групи з Каліфорнійського університету, Принстонського університету та Швейцарського федерального інституту технологій у Цюриху. Команди використовували автоматизовані системи, які змушували чат-боти багаторазово перевіряти та уточнювати власні відповіді.

Результати показали, що найкраща система змогла розв’язати 6 із 10 задач. Відповіді перевіряли незалежні експерти-математики.

Усі завдання, які отримали моделі, раніше вже були розв’язані професійними математиками. Саме тому організатори дійшли висновку, що людська експертиза поки залишається сильнішою у роботі з новими математичними проблемами дослідницького рівня.

Автори проєкту зазначають, що ШІ ще має пройти довгий шлях, перш ніж зможе автономно бути надійним помічником у математичних дослідженнях. Зокрема, йдеться про перевірку доказів і повноцінне розв’язання складних наукових задач.

До слова, китайські хакери понад рік шпигували через Google Workspace: компанія розкрила деталі атаки.              

Юлія Люшньова - pravdatutnews.com

Читайте також
ChatGPT Plus для всіх жителів Великої Британії: чому ідея не втілилася ChatGPT Plus для всіх жителів Великої Британії: чому ідея не втілилася
Ідея передбачала безкоштовний преміум-доступ до ChatGPT для всіх мешканців Британії, а потенційна вартість проєкту оцінювалася у 2 мільярди фунтів стерлінгів
Apple планує впровадити ШІ-пошук у Safari Apple планує впровадити ШІ-пошук у Safari
Apple веде переговори з OpenAI, Perplexity та іншими компаніями щодо впровадження пошуку на основі штучного інтелекту в Safari.
Штучний інтелект здобув "золоту медаль" на Міжнародній математичній олімпіаді Штучний інтелект здобув "золоту медаль" на Міжнародній математичній олімпіаді
Розробники ШІ вважають, що ці результати свідчать про те, що штучний інтелект починає наближатися до "елітного математичного мислення людини"
Loading...
Load next