Китайська компанія DeepSeek разом із Університетом Цінхуа працює над новим підходом до навчання штучного інтелекту, який дозволить моделям самостійно закріплювати отримані знання.
Про це повідомляє Bloomberg.
Такий підхід має зменшити витрати на тренування моделей та водночас покращити їхню здатність адаптуватися до людських запитів. Йдеться про використання моделі навчання з підкріпленням, яка вже довела свою ефективність у вузькоспеціалізованих сферах. Проте застосування цієї методики до універсальних ШІ-систем — складніша задача, яку й намагається вирішити команда DeepSeek.
Розроблена стратегія, за словами компанії, показала кращі результати у тестах порівняно з чинними моделями, при цьому потребуючи менше обчислювальних ресурсів.
Нові моделі отримали назву DeepSeek-GRM (generalist reward modeling) і незабаром мають з’явитися з відкритим вихідним кодом.
Нагадаємо, У Південній Кореї заявили, що китайський додаток DeepSeek надмірно збирає персональні дані
Юлія Педюк - pravdatutnews.com