Фото: depositphotos
Вчені з'ясували, що великі мовні моделі, які тренуються на великих обсягах такого контенту, можуть поступово втрачати ефективність і ставати "тупішими".
Про це пише Wired.
Ці результати подібні до досліджень, що показують, як вживання низькоякісної інформації в соціальних мережах впливає на розумові здібності людей. Зокрема, у 2024 році Оксфордський словник ввів термін "брейнрот", який описує цей ефект.
"Ми живемо в епоху, коли інформація надходить швидше, ніж наша здатність до концентрації уваги, і значна її частина розроблена для того, щоб привернути увагу, а не для надання глибоких і правдивих відомостей", — зазначив Джуньюань Хонг, майбутній доцент Національного університету Сінгапуру, який брав участь у дослідженні.
Вчені завантажили різні типи текстів у дві відкриті мовні моделі під час попереднього етапу навчання. Вони протестували, як моделі реагують на популярні або сенсаційні публікації, що містять такі фрази, як "вау", "дивіться" чи "тільки сьогодні".
Після цього команда оцінила вплив "сміттєвої" інформації на моделі Llama від Meta та Qwen від Alibaba. Виявилось, що моделі, натреновані на низькоякісному контенті, почали показувати ознаки "штучного брейнроту", що проявлялося в зниженій здатності до логічного мислення, погіршенні пам'яті та проблемах з етикою. Моделі ставали менш здатними до критичного аналізу та виявляли психопатичні риси.
Дослідження також показало, що моделі ШІ, які "отруїлися" таким контентом, важко відновити або повторно натренувати. Крім того, системи, що використовують дані з соцмереж (як, наприклад, Grok від xAI), можуть зіткнутися з серйозними проблемами контролю якості, якщо ці дані не перевіряються на достовірність.
Хонг підкреслив, що ці результати важливі для розвитку ШІ, оскільки розробники часто використовують пости з соціальних мереж як джерело для навчання моделей. Однак такий контент може непомітно знижувати здатність ШІ до міркування, етичність та увагу до контексту.
До слова, компанія OpenAI обмежила використання образів і голосів знаменитостей у своєму відеододатку Sora. Тепер створювати відео із зірками або відомими особами можна лише після отримання їхньої офіційної згоди.
Юлія Педюк - pravdatutnews.com






