GPT-4 очолив рейтинг ШІ для чат-ботів

У сервісі LMSYS Chatbot Arena оновився рейтинг великих мовних моделей штучного інтелекту. Він дозволяє оцінити, які моделі нині найкраще справляються зі своїми задачами.

LMSYS Chatbot Arena – це краудсорсингова відкрита платформа для оцінювання великих мовних моделей (LLM). Для складання рейтингу оцінюються понад 300 тис. людських відгуків про роботу моделей за системою рейтингу Ело, пише sundries.

Як працює тест — люди вводять запит та обирають кращу відповідь з кількох варіантів від різних моделей. На основі тисяч користувацьких тестів формується і ранжирується топ.

Як свідчить новий рейтинг чатбот-арени, лідером серед LLM наразі є GPT4. Нещодавні твердження Claude, що їхня модель краще не підтвердилися. Вона зайняла третє місце. Відразу за нею розташувалася модель Bard (Gemini Pro) від Google. Всі ці моделі отримали рейтинг Ело понад 1200.

Ознайомитися з докладними актуальними результатами ранжування наявних великих мовних моделей можна за наступною адресою.

Нагадаємо, Канада вже прийняла майже 250 тисяч українських біженців

Андрій Самойленко - pravdatutnews.com

Теги:

GPT-4

ші

чат-боти

п’ятниця, 08 березня 2024 р., 21:30

Читайте також

Google тестує рекламу в ШІ-відповідях

Чат-боти наразі вважаються персональними помічниками, а поява реклами в їхніх відповідях може змінити сприйняття користувачами цього інструменту в гірший бік

23 листопада 2025 р., 18:01

Alibaba і Tencent вимкнули ШІ-ботів на час вступних іспитів у Китаї

Китайські техногіганти тимчасово обмежили функції своїх чат-ботів зі штучним інтелектом, щоб запобігти шпаргалкам під час національного іспиту «гаокао».

09 червня 2025 р., 15:33

Навіть найновіші моделі ШІ «ступорять» і «тупіють» у діалозі з людиною – Microsoft Research

Дослідження підтвердило скарги користувачів, мовляв, чат-боти на основі штучного інтелекту дають все гірші відповіді при тривалій роботі.

22 лютого 2026 р., 23:23

Рекомендовані

Redmi Note 17 Pro з акумулятором на 9000 мАг гарантує безоплатну заміну, якщо той сяде раніше, ніж за 5 років

Redmi Note 17 Pro отримав акумулятор на 9000 мАг із п’ятирічною гарантією — виробник обіцяє безоплатну заміну, якщо батарея втратить більше 20% ємності раніше цього терміну.

09 липня 2026 р., 23:55

Майже вдвічі дешевший за Duster: Nissan презентувала кросовер Tekton

Новий Nissan Tekton став однією з найгучніших прем’єр літа — компактний, але повноцінний кросовер із ціною близько 11 000 доларів, що робить його майже вдвічі доступнішим за популярний Duster.

09 липня 2026 р., 23:23

Пік розумових здібностей: вчені визначили оптимальний вік призначень на керівні посади

Вчені встановили, що найвищого рівня розумових здібностей людина досягає у віці від 55 до 60 років.

08 липня 2026 р., 06:26

Loading...

Load next

Топ теми

Генштаб: за добу Росія втратила ще 1 490 військових

За даними Генерального штабу ЗСУ, загальні втрати російських військ від початку повномасштабного вторгнення сягнули близько 1,417 млн осіб

11 липня 2026 р., 09:39

Зеленський: бензинова криза в Росії поглиблюється, а в оточенні Путіна зростає підтримка миру

Президент України Володимир Зеленський заявив, що українські далекобійні удари посилюють тиск на Росію, а серед оточення Володимира Путіна дедалі більше усвідомлюють, що мир не має альтернативи

11 липня 2026 р., 08:36

Генштаб: за добу Росія втратила ще 1 460 військових

За даними Генерального штабу ЗСУ, загальні втрати особового складу російських військ від початку повномасштабного вторгнення перевищили 1,416 млн осіб

10 липня 2026 р., 09:46

Останні новини

11 липня

22:05 Де в Україні пройдуть дощі та грози: прогноз погоди на 12 липня

У суботу, 12 липня, в Україні очікується мінлива хмарність, місцями пройдуть короткочасні дощі з грозами

21:32 ОК «Північ» підтвердило повідомлення про СЗЧ командира 155 бригади

За неофіційною інформацією, причиною злочину міг стати конфлікт, пов’язаний із особистими обставинами командира бригади

21:00 900 скарг на ТЦК у Львові! Чому система дала збій і як тепер захищати свої права? | ПравдаТУТ Львів

20:46 Навроцький закликав парламент заборонити в Польщі червоно-чорний прапор

Він наголосив, що не хоче бачити цей символ у Польщі та має намір домагатися відповідного рішення на рівні парламенту

20:11 У Варшаві зведуть Стіну пам’яті на честь польських жертв війн ХХ століття в Україні

Туск наголосив, що історична пам’ять не повинна ставати джерелом нової ворожнечі

19:38 У Венесуелі вже понад 4 тисячі загиблих через землетрус

В Управлінні ООН оцінили прямі збитки приблизно у 37 мільярдів доларів

19:15 Євро замість гривні: чи може це стати реальністю для України

Вступ до ЄС сам по собі не означає автоматичний перехід на євро

18:21 Суд у Львові зобов'язав власницю квартири замінити пластикові вікна й двері на автентичні заголовок

Водночас це рішення може бути оскаржене в апеляційному порядку

18:06 У Києві подорожчає проїзд: скільки коштуватиме поїздка

Вартість поїздок зменшуватиметься залежно від кількості придбаних квитків або поїздок

17:38 На Стрийщині сталося ДТП: загинула 70-річна жінка, є травмовані

Аварія трапилася 10 липня на трасі М-30 у Жидачеві

17:02 Українське посвідчення водія на німецьке: обміняти можна буде без іспитів

Це стосується категорій A1, A, B, BE, C1, C1E, C, CE, D1, D1E, D і DE

16:31 Нацбанк звинуватили у використанні російського піратського шрифту на банкноті 2000 грн

На купюрі із зображенням поета-шістдесятника Василя Стуса застосували кириличну версію шрифту Bickham Script

15:55 Новообраний лідер Ірану пообіцяв покарати вбивць свого батька Хаменеї

Наразі в країні тривають масштабні похоронні заходи, під час яких вшановують пам’ять не лише самого лідера, а й членів його родини

15:36 У "Резерв+" відновили роботу сервіси для підтвердження даних про інвалідність

Роботу функцій тимчасово призупиняли, щоб уникнути помилок

15:01 Ще трьох підозрюваних у сутичках із ТЦК у Львові відправили під варту

За даними слідства, двоє чоловіків віком 21 та 28 років безпосередньо брали участь у пошкодженні службового автомобіля військових

14:35 5 продуктів для сніданку, які містять більше клітковини, ніж яблуко

Дієтологи радять додавати до ранкового раціону продукти з високим вмістом клітковини, адже вони допомагають довше відчувати ситість і підтримують здоров’я травної системи

14:04 Як правильно очистити порцелянову плитку, щоб зберегти її блиск

Експерти з прибирання радять регулярно видаляти пил і бруд із порцелянової плитки та використовувати м’які засоби, щоб не пошкодити її поверхню

13:40 Дослідження: добавки з омега-3 не покращили роботу мозку у людей із ризиком хвороби Альцгеймера

Нове дослідження показало, що високі дози DHA — однієї з омега-3 жирних кислот — дійсно потрапляють у мозок, але не призвели до покращення пам’яті чи когнітивних функцій протягом двох років

13:03 У суботу прогнозують магнітну бурю рівня K-4

За даними Meteoagent та Британської геологічної служби, 11 липня очікується помірна сонячна активність, а геомагнітне поле відповідатиме K-індексу 4

12:37 Трамп заявив, що наказав би завдати нищівного удару по Ірану у разі замаху на нього

Президент США Дональд Трамп повідомив, що залишив чіткі інструкції щодо відповіді Ірану, якщо Тегеран реалізує плани з його ліквідації

12:02 Король Чарльз III вперше за чотири роки зустрівся з онуками Арчі та Лілібет

Під час приватного візиту до Великої Британії принц Гаррі, його дружина Меган та їхні діти зустрілися з королем Чарльзом III у маєтку в Глостерширі

11:38 Reuters: Patriot для України можуть виробляти в Європі

За даними Reuters, одним із найімовірніших варіантів для організації виробництва американських ракет-перехоплювачів до систем Patriot є Німеччина, яка вже має власний виробничий ланцюжок для PAC-2

11:04 Міністр оборони Польщі відвідає Волинь для вшанування жертв Волинської трагедії

Очільник польського оборонного відомства Владислав Косіняк-Камиш повідомив, що 11 липня прибуде до Волинської області, де візьме участь у жалобних заходах пам’яті загиблих під час Волинської трагедії

10:31 Повітряні сили: уночі Росія випустила 121 дрон і 12 ракет

У ніч на 11 липня російські війська атакували Україну балістичними, керованими авіаційними та протирадіолокаційними ракетами, а також ударними безпілотниками. Сили ППО збили або подавили більшість дронів і частину ракет

10:02 Партія Санду висуне бізнесмена Василе Тофана на посаду прем’єр-міністра Молдови

Керівна партія "Дія і солідарність" (PAS) планує запропонувати президентці Маї Санду кандидатуру підприємця та інвестора Василе Тофана на посаду глави уряду

Більше новин