Фото: Unsplash
Google використовує величезну базу відео з YouTube для навчання своїх моделей штучного інтелекту, включно з генеративною системою Gemini та інструментом для створення відео й аудіо Veo 3.
Про це повідомляє CNBC з посиланням на джерела, обізнані з внутрішніми процесами компанії.
Один із співрозмовників зазначив, що для тренування залучено добірку з понад 20 мільярдів відео. У компанії підтвердили, що використовують частину відео з YouTube відповідно до домовленостей із медіапартнерами й авторами, однак не уточнили обсяг залучених даних.
У YouTube наголошують, що давно застосовують свій контент для поліпшення сервісів, і поява генеративного ШІ не змінила цього підходу. За словами представників платформи, компанія забезпечує "захист інтересів творців", хоча конкретних інструментів для відмови від використання відео у ШІ-навчанні не передбачено.
Це викликало критику з боку експертів з цифрових прав. Вони попереджають, що автори можуть втратити контроль над своїми творами, адже не мають змоги заборонити Google використовувати їхній контент. Хоча деякі автори відкриті до використання їхніх відео в тренуванні, більшість вимагають чітких правил і прозорості.
Зокрема, компанія Vermillio розробила інструмент Trace ID, який дозволяє порівнювати створене ШІ-відео з оригінальним — в окремих випадках схожість перевищувала 90%.
Попри укладені угоди з агентствами, такими як Creative Artists Agency, які допомагають керувати ШІ-контентом, що імітує знаменитостей, питання захисту авторських прав залишається невирішеним. У США вже лунають заклики до створення законодавчих норм, які дали б творцям реальні важелі контролю над тим, як їхній контент використовують для навчання штучного інтелекту.
Нагадаємо, DeepSeek підозрюють у використанні даних Google Gemini для навчання своєї ШІ-моделі
Юлія Педюк - pravdatutnews.com