GPT-4 очолив рейтинг ШІ для чат-ботів

У сервісі LMSYS Chatbot Arena оновився рейтинг великих мовних моделей штучного інтелекту. Він дозволяє оцінити, які моделі нині найкраще справляються зі своїми задачами.

LMSYS Chatbot Arena – це краудсорсингова відкрита платформа для оцінювання великих мовних моделей (LLM). Для складання рейтингу оцінюються понад 300 тис. людських відгуків про роботу моделей за системою рейтингу Ело, пише sundries.

Як працює тест — люди вводять запит та обирають кращу відповідь з кількох варіантів від різних моделей. На основі тисяч користувацьких тестів формується і ранжирується топ.

Як свідчить новий рейтинг чатбот-арени, лідером серед LLM наразі є GPT4. Нещодавні твердження Claude, що їхня модель краще не підтвердилися. Вона зайняла третє місце. Відразу за нею розташувалася модель Bard (Gemini Pro) від Google. Всі ці моделі отримали рейтинг Ело понад 1200.

Ознайомитися з докладними актуальними результатами ранжування наявних великих мовних моделей можна за наступною адресою.

Нагадаємо, Канада вже прийняла майже 250 тисяч українських біженців

Андрій Самойленко - pravdatutnews.com

Теги:

GPT-4

ші

чат-боти

п’ятниця, 08 березня 2024 р., 21:30

Читайте також

Google тестує рекламу в ШІ-відповідях

Чат-боти наразі вважаються персональними помічниками, а поява реклами в їхніх відповідях може змінити сприйняття користувачами цього інструменту в гірший бік

23 листопада 2025 р., 18:01

Навіть найновіші моделі ШІ «ступорять» і «тупіють» у діалозі з людиною – Microsoft Research

Дослідження підтвердило скарги користувачів, мовляв, чат-боти на основі штучного інтелекту дають все гірші відповіді при тривалій роботі.

22 лютого 2026 р., 23:23

Alibaba і Tencent вимкнули ШІ-ботів на час вступних іспитів у Китаї

Китайські техногіганти тимчасово обмежили функції своїх чат-ботів зі штучним інтелектом, щоб запобігти шпаргалкам під час національного іспиту «гаокао».

09 червня 2025 р., 15:33

Рекомендовані

Щоб двигун служив довше: просте літнє правило від автомеханіків

У літню спеку автомобільний двигун працює з підвищеним навантаженням, особливо після швидкісної їзди чи тривалих поїздок.

03 липня 2026 р., 07:07

Бій з Усиком зруйнував особисте життя Верховена: він скасував весілля та розійшовся з нареченою

Легендарний нідерландський кікбоксер Ріко Верховен і фітнес-тренерка Наомі ван Беєм офіційно повідомили про завершення своїх стосунків.

03 липня 2026 р., 06:16

Ціна війни Путіна в Україні: втрати військових з обох сторін перевищили 2 млн, - The New York Times

Згідно з новим дослідженням, за чотири роки, упродовж яких Росія веде війну проти свого сусіда, понад два мільйони російських та українських військових були вбиті або поранені. До того ж, навесні російська армія вперше з 2024 року почала втрачати більше території, ніж захоплювати.

01 липня 2026 р., 22:52

Loading...

Load next

Топ теми

Росія за добу втратила ще 1 250 військових і понад 2 тисячі безпілотників – Генштаб

03 липня 2026 р., 08:19

У Бєлгороді пролунали вибухи: повідомляють про перебої зі світлом і водою

03 липня 2026 р., 08:26

Росія атакувала Кривий Ріг і Сумщину: є загиблі та поранені

03 липня 2026 р., 08:47

Останні новини

03 липня

21:52 Не лише матча: дієтологи назвали 8 корисних альтернатив каві

Фахівці з харчування рекомендують вісім напоїв, які можуть замінити каву. Частина з них містить менше кофеїну, а деякі взагалі не мають його у складі, водночас підтримуючи бадьорість і здоров’я

21:36 росія атакувала АЗС на Полтавщині: поранено людину

Під час повітряної тривоги російські війська завдали удару по автозаправній станції в Лубенському районі Полтавської області. Попередньо відомо про одного постраждалого

21:18 Примати збільшили тіло раніше за мозок: вчені підтвердили давню еволюційну гіпотезу

Британський дослідник отримав нові докази того, що в еволюції приматів спершу збільшувалися розміри тіла, а вже потім — мозку

21:06 Зеленський провів зустріч з військовим Олегом Ляшком: говорили про потреби фронту

Президент України Володимир Зеленський зустрівся з командиром 432-го окремого полку безпілотних систем Олегом Ляшком. Під час розмови обговорили забезпечення військових і мотивацію бійців

20:48 росія атакувала Дніпропетровщину: троє загиблих і 12 поранених, серед постраждалих — діти

Упродовж 3 липня внаслідок російських обстрілів Дніпропетровської області загинули троє людей, ще 12 зазнали поранень. Ворог атакував чотири райони регіону

20:36 Чоловіки-марафонці майже вдвічі частіше за жінок різко втрачають темп

Аналіз результатів понад 800 тисяч учасників Берлінського марафону показав, що чоловіки значно частіше стикаються зі «стіною» — різким уповільненням на другій половині дистанції

20:12 Червнева спека могла забрати життя понад 20 тисяч людей у Європі

Науковці оцінили, що хвиля екстремальної спеки наприкінці червня могла спричинити від 17 до 25 тисяч смертей у Європі, хоча частина дослідників закликає обережно ставитися до цих розрахунків

20:01 ШІ перевершив політиків у дебатах: учасники дослідження частіше обирали відповіді GPT-4 Turbo

Дослідники з’ясували, що відповіді, згенеровані GPT-4 Turbo від імені британських публічних осіб, люди вважали переконливішими та логічнішими за їхні справжні висловлювання

19:41 Мідь подорожчала до понад 13 тисяч доларів за тонну: що вплинуло на ринок

Ціни на мідь зросли на тлі ослаблення долара США та зменшення очікувань щодо підвищення процентних ставок Федеральною резервною системою

19:25 У Польщі знайшли бронзовий меч віком майже 3000 років

У лісі поблизу Гданська пошуковець-аматор за допомогою металодетектора виявив добре збережений меч бронзової доби, який незабаром представлять на виставці

19:07 Роботи замість священних тварин: чому в Індії сперечаються через механічних слонів

Індійські храми дедалі частіше замінюють живих слонів роботизованими копіями. Ініціативу підтримують зоозахисники, однак частина священнослужителів і власників тварин вважає це загрозою багатовіковим традиціям

18:51 У Києві на балконі під час спеки загинув французький бульдог: поліція відкрила справу

У столиці чоловік залишив собаку зачиненим на балконі в сильну спеку та пішов з дому. Тварина загинула, правоохоронці розпочали кримінальне провадження

18:37 Не лише чорна ікра: головні фудтренди та антитренди літа-2026

Цього літа гастрономічні вподобання змінилися: популярності набирають солоні мілфеї, корейські продукти та охолоджені червоні вина, тоді як чорна ікра на чипсах і рожеві вина втрачають актуальність

18:16 ФІФА пояснила скасований гол Хорватії в матчі з Португалією на ЧС-2026

Міжнародна федерація футболу пояснила, чому арбітри не зарахували гол збірної Хорватії наприкінці матчу 1/16 фіналу чемпіонату світу-2026 проти Португалії

18:02 В Україні затвердили дати навчального року 2026–2027: коли почнуться уроки та що буде з канікулами

Кабінет міністрів визначив терміни нового навчального року. Водночас кожна школа самостійно вирішуватиме дату завершення занять і тривалість літніх канікул

17:47 Ай Вейвей відтворить своє ув’язнення у 24-годинному перформансі в Манчестері

Китайський художник і активіст Ай Вейвей проведе перший у своїй кар’єрі 24-годинний перформанс, присвячений досвіду ув’язнення після арешту у 2011 році

17:32 Прем’єр Молдови подав у відставку: Мая Санду вже відреагувала

Прем’єр-міністр Молдови Александру Мунтяну оголосив про відставку, заявивши, що більше не може виконувати свої обов’язки відповідно до власних принципів

17:17 Суд призначив Тищенку 10 млн грн застави у справі про ймовірне “кришування” кол-центрів

Вищий антикорупційний суд обрав народному депутату Миколі Тищенку запобіжний захід у вигляді застави в розмірі 10 млн гривень

17:02 Укус комахи свербить: що станеться, якщо постійно його чухати

Дослідження на мишах пояснило механізм посилення запалення, але не означає, що кожен укус турбуватиме тиждень.

16:44 5 ознак, що кондиціонер потребує обслуговування: які сигнали не варто ігнорувати

Не кожен симптом означає серйозну поломку, однак запах гару, вода під блоком або незвичні шуми краще не ігнорувати.

16:32 Godot посилить правила для ШІ-коду: значні згенеровані фрагменти не прийматимуть

Фонд Godot хоче зменшити навантаження на рецензентів і вимагатиме, щоб автори відповідали за власний код.

16:16 Втома й біль у суглобах: які продукти варто додати до раціону для підтримки здоров’я

Найкраще досліджені переваги має не окремий «суперфуд», а раціон із великою кількістю овочів, фруктів, бобових і цільнозернових продуктів.

16:01 Топ-10 нових авто в Україні: Renault Duster став бестселером півріччя

У січні – червні 2026 року в Україні зареєстрували близько 33 тисяч нових легкових автомобілів. Найпопулярнішою моделлю першого півріччя став кросовер Renault Duster.

15:46 Чому вільний вигул небезпечний для котів і як зробити їхнє життя безпечнішим

Чому вільний вигул небезпечний для котів і як зробити їхнє життя безпечнішим

15:36 Чи має значення порядок підключення зарядки: що реально шкодить батареї телефона

В офіційних рекомендаціях виробників порядок підключення не називають причиною деградації батареї.

Більше новин