GPT-5 зламали менш ніж за добу: небезпечну вразливость виявили дослідники

Дві незалежні команди обійшли захист нової моделі й продемонстрували її вразливість до контекстних маніпуляцій

Фото: depositphotos

Менше ніж за 24 години після виходу GPT-5 дослідники з NeuralTrust та SPLX заявили про успішний злам системи. Як повідомляє SecurityWeek, їм вдалося обійти захисні фільтри моделі, що ставить під питання її безпеку та готовність до корпоративного використання.

Про це повідомляє SecurityWeek.

NeuralTrust використала власну техніку EchoChamber у поєднанні з невинним на вигляд оповіданням, змусила модель надати інструкцію зі створення коктейлю Молотова. Фахівці наголошують: у запиті не було прямих ознак шкідливого наміру, а вразливість пов’язана з тим, що GPT-5 аналізує запити окремо, без урахування всього контексту розмови.

Тим часом команда SPLX застосувала метод StringJoin Obfuscation Attack — розділила букви запиту дефісами, таким чином замаскувала його під вигадане шифрування. Це також дозволило обійти обмеження моделі. Порівняльний аналіз показав, що GPT-4o продовжує краще протистояти подібним атакам, особливо після додаткових захисних налаштувань.

Обидві компанії радять використовувати GPT-5 з обережністю та вказують на необхідність удосконалення системи безпеки, щоб запобігти контекстним маніпуляціям у майбутньому.

Нагадаємо, OpenAI представила нову потужну модель штучного інтелекту GPT-5

Юлія Корній - pravdatutnews.com

Теги:

GPT-5

злам gpt-5

вразливості gpt-5

безпека штучного інтелекту

neuraltrust

splx

атаки на ai

echochamber

stringjoin obfuscation

технології

штучний інтелект

субота, 09 серпня 2025 р., 18:01

Читайте також

GPT-5 зламали за добу після релізу: дослідники виявили серйозні вразливості

Дві незалежні команди — NeuralTrust та SPLX — повідомили, що змогли обійти захисні механізми нової моделі GPT-5 вже протягом першої доби після її виходу.

10 серпня 2025 р., 17:05

У проєкті Microsoft для керування сайтами через ШІ виявили вразливість

Вразливість у протоколі NLWeb могла надати доступ до конфіденційних даних.У Microsoft швидко усунули проблему, але відмовилися присвоювати їй CVE

06 серпня 2025 р., 20:16

Штучний інтелект навчили приховувати секретні повідомлення у звичайних розмовах

Дослідники розробили новий метод шифрування, який дозволяє приховувати секретні повідомлення у звичайному тексті так, що листування виглядає цілком природно

28 квітня 2025 р., 21:17

Рекомендовані