GPT-4 очолив рейтинг ШІ для чат-ботів

GPT-4 очолив рейтинг ШІ для чат-ботів

У сервісі LMSYS Chatbot Arena оновився рейтинг великих мовних моделей штучного інтелекту. Він дозволяє оцінити, які моделі нині найкраще справляються зі своїми задачами.

LMSYS Chatbot Arena – це краудсорсингова відкрита платформа для оцінювання великих мовних моделей (LLM). Для складання рейтингу оцінюються понад 300 тис. людських відгуків про роботу моделей за системою рейтингу Ело, пише sundries.

Як працює тест — люди вводять запит та обирають кращу відповідь з кількох варіантів від різних моделей. На основі тисяч користувацьких тестів формується і ранжирується топ.

Як свідчить новий рейтинг чатбот-арени, лідером серед LLM наразі є GPT4. Нещодавні твердження Claude, що їхня модель краще не підтвердилися. Вона зайняла третє місце. Відразу за нею розташувалася модель Bard (Gemini Pro) від Google. Всі ці моделі отримали рейтинг Ело понад 1200.

Ознайомитися з докладними актуальними результатами ранжування наявних великих мовних моделей можна за наступною адресою.

Нагадаємо, Канада вже прийняла майже 250 тисяч українських біженців

Андрій Самойленко - pravdatutnews.com

Теги: 
Читайте також
Alibaba і Tencent вимкнули ШІ-ботів на час вступних іспитів у Китаї Alibaba і Tencent вимкнули ШІ-ботів на час вступних іспитів у Китаї
Китайські техногіганти тимчасово обмежили функції своїх чат-ботів зі штучним інтелектом, щоб запобігти шпаргалкам під час національного іспиту «гаокао».
«ШІ Ісус» у швейцарській каплиці: інновація, яка об'єднує технології та релігію «ШІ Ісус» у швейцарській каплиці: інновація, яка об'єднує технології та релігію
У Швейцарії презентували новаторський проєкт — штучний інтелект, що виступає в ролі Ісуса Христа
Держмитслужба запроваджує штучний інтелект для спрощення митного оформлення авто Держмитслужба запроваджує штучний інтелект для спрощення митного оформлення авто
Державна митна служба України продовжує цифрову модернізацію, впроваджуючи передові технології для громадян і бізнесу. Використання штучного інтелекту дозволяє оптимізувати митні процедури, скоротити час оформлення та підвищити ефективність роботи.
Loading...
Load next