ШІ впорався гірше з обрахунками, ніж люди - нове дослідження

ШІ впорався гірше з обрахунками, ніж люди - нове дослідження
Дослідники вважають, що ШІ ще не може повністю замінити людську експертизу в математиці.

Фото: pexels

Передові системи штучного інтелекту продовжують швидко розвиватися, однак у складних дослідницьких математичних задачах вони поки поступаються найкращим фахівцям-людям.

Про це повідомляє WION.

Йдеться про результати тестування в межах проєкту First Proof. Його називають одним із найсуворіших тестів для перевірки математичних здібностей ШІ.

Чотирьом передовим системам штучного інтелекту запропонували розв’язати 10 складних задач дослідницького рівня. Особливість тесту полягала в тому, що ці питання не були частиною навчальних даних моделей. Тобто системи не могли просто відтворити вже відомі відповіді.

Виконання завдань відбувалося автономно, без участі людей у процесі розв’язання. До тестування допускали лише загальнодоступні ШІ-системи.

Серед учасників були OpenAI, а також академічні групи з Каліфорнійського університету, Принстонського університету та Швейцарського федерального інституту технологій у Цюриху. Команди використовували автоматизовані системи, які змушували чат-боти багаторазово перевіряти та уточнювати власні відповіді.

Результати показали, що найкраща система змогла розв’язати 6 із 10 задач. Відповіді перевіряли незалежні експерти-математики.

Усі завдання, які отримали моделі, раніше вже були розв’язані професійними математиками. Саме тому організатори дійшли висновку, що людська експертиза поки залишається сильнішою у роботі з новими математичними проблемами дослідницького рівня.

Автори проєкту зазначають, що ШІ ще має пройти довгий шлях, перш ніж зможе автономно бути надійним помічником у математичних дослідженнях. Зокрема, йдеться про перевірку доказів і повноцінне розв’язання складних наукових задач.

До слова, китайські хакери понад рік шпигували через Google Workspace: компанія розкрила деталі атаки.              

Юлія Люшньова - pravdatutnews.com

Читайте також
Meta вивчає можливість використання сторонніх ШІ-моделей Meta вивчає можливість використання сторонніх ШІ-моделей
У фокусі — Gemini від Google та ChatGPT від OpenAI для покращення пошукових і діалогових функцій
Китай розробляє ШІ для розуміння мови тварин Китай розробляє ШІ для розуміння мови тварин
Система збиратиме різноманітні дані про тварин, включаючи їхні голосові сигнали
ChatGPT отримає «режим 18+»: OpenAI змінює політику для дорослих користувачів ChatGPT отримає «режим 18+»: OpenAI змінює політику для дорослих користувачів
Компанія реагує на критику та обіцяє зберегти баланс між безпекою та свободою користувачів
Loading...
Load next