Експерти з’ясували, який штучний інтелект найменше помиляється

Фото: Unsplash
Саме ця модель найрідше припускається так званих «галюцинацій», суттєво випереджаючи рішення від Google та OpenAI.
Про це свідчить дослідження аналітичної компанії Relum
Аналітики оцінили десять провідних ШІ-моделей з точки зору ризиків для бізнес-завдань. За результатами дослідження, Grok надає недостовірні відповіді лише у 8% випадків. Для порівняння, ChatGPT від OpenAI демонструє рівень помилок близько 35%, тоді як показник Google Gemini перевищує 40%. Досить високий відсоток неточностей також зафіксовано у Microsoft Copilot — 27%.
До групи відносно надійних інструментів експерти також віднесли китайську модель DeepSeek із показником помилок 14%, сервіс Perplexity (13%) та Claude (17%). У Relum підкреслюють, що достовірність відповідей стає ключовим критерієм для корпоративного сектору, адже понад 65% американських компаній уже використовують штучний інтелект у своїй діяльності. Очікується, що надалі бізнес дедалі частіше обиратиме ШІ-рішення, орієнтуючись передусім на їхню фактичну точність.
До слова, Google робить серйозний крок у сфері генеративного штучного інтелекту, кидаючи виклик популярним платформам Lovable, Cursor та Replit. Компанія інтегрувала свій інструмент для "вайб-кодингу" (vibe-coding) під назвою Opal безпосередньо в інтерфейс чат-бота Gemini
Олена Стебніцька - pravdatutnews.com





