ШІ піддається маніпуляціям, як і люди – дослідження

понеділок, 01 вересня 2025 р., 11:46

Вчені протестували сім методів впливу, і більшість із них виявилися дієвими проти систем безпеки чатботів

ШІ піддається маніпуляціям, як і люди – дослідження

Фото: depositphotos

Дослідники Університету Пенсільванії з’ясували, що сучасні мовні моделі штучного інтелекту вразливі до психологічних маніпуляцій. Звичайні прийоми, які впливають на людей — лестощі, соціальний тиск чи створення "лінії поведінки" — можуть змусити чатботи виконувати заборонені запити.

Про це повідомляє The Verge.

У дослідженні перевіряли GPT-4o Mini від OpenAI. Виявилося, що якщо модель одразу просили синтезувати лідокаїн, вона погоджувалася лише у 1% випадків. Але якщо перед цим йшло невинне питання — наприклад, про синтез ваніліну, — а потім ставився складніший запит, ймовірність позитивної відповіді зростала до 100%. Це дослідники пояснюють ефектом "зобов’язання".

Подібні результати отримали й під час перевірки на використання образливих слів. Без підготовки чатбот застосовував різкі вирази лише у 19% випадків. Якщо ж почати з м’якшого слова, успішність доходила до 100%.

У роботі застосовували сім технік переконання з книги Роберта Чалдіні «Вплив: психологія переконання»: авторитет, симпатія, зобов’язання, взаємність, дефіцит, соціальне підтвердження та єдність. Найсильнішими виявилися методи "зобов’язання" та "лінії поведінки". Лестощі та соціальний тиск теж працювали, але менш ефективно — виконання заборонених запитів зростало максимум до 18%.

Науковці наголосили: попри те, що експеримент проводили лише з GPT-4o Mini, результати піднімають питання надійності захисних механізмів у ШІ. OpenAI, Meta та інші компанії активно вдосконалюють системи безпеки, але дослідження показує, наскільки вразливими вони можуть бути до базових психологічних прийомів.

Нагадаємо, Meta вивчає можливість використання сторонніх ШІ-моделей

Юлія Люшньова - pravdatutnews.com

Теги:

штучний інтелект

чатбот

дослідження

маніпуляції

психологія

технології

OpenAI

Читайте також

Китай розробляє ШІ для розуміння мови тварин

Система збиратиме різноманітні дані про тварин, включаючи їхні голосові сигнали

10 травня 2025 р., 12:11

Спілкування з ChatGPT підвищує рівень самотності - дослідження OpenAI

Дослідження OpenAI виявило зв’язок між використанням ChatGPT і відчуттям самотності

22 березня 2025 р., 15:11

Дослідження пояснило, чи впливають "будь ласка" і "дякую" на відповіді ChatGPT

Як показало дослідження, головне для отримання якісного результату — правильно сформулювати запит

28 липня 2026 р., 12:48

Рекомендовані

Кросовер Suzuki Brezza за $7700: витрата лише 4,7 л/100 км і заводське ГБО

Suzuki Brezza 2026 — це нове покоління бюджетного кросовера, яке поєднує економічність, сучасні технології та дизайн у стилі старшої Vitara.

27 липня 2026 р., 22:42

Андрій Макаревич – про війну в Україні: «Щодня прокидаюся з відчуттям, що, можливо, сьогодні вона закінчиться»

Співак зізнався, що щодня прокидається з відчуттям, що, можливо, сьогодні війна в Україні закінчиться.

27 липня 2026 р., 23:43

Смачно їсти і худнути: 13 продуктів, що пришвидшують спалювання жиру

Дієтологи називають 13 продуктів і напоїв, які природно активують спалювання жиру: від зеленого чаю та ягід до спецій і кави. Вони підсилюють термогенез, знижують апетит і допомагають організму витрачати більше енергії навіть у стані спокою.

28 липня 2026 р., 00:22

Loading...

Load next

Топ теми

Зеленський прибув до США для зустрічі із Трампом

Візит відбувається на тлі активних дипломатичних контактів між Києвом і Вашингтоном

28 липня 2026 р., 08:50

У Підмосков’ї спалахнули завод і склади: влада заявила про атаку понад 390 БпЛА

В Чехові після дронової атаки спалахнула пожежа на території заводу

28 липня 2026 р., 09:34

росія запустила по Україні 131 дрон: ППО знешкодила 107, але зафіксовано влучання

У ніч на 28 липня російські війська атакували Україну ударними безпілотниками з чотирьох напрямків. Більшість повітряних цілей вдалося знешкодити, однак без влучань не обійшлося

28 липня 2026 р., 10:17

Останні новини

29 липня

00:24 Зміцнюють серце, покращують травлення, допомагають відновитись: цей сухофрукт дарма недооціюють

Родзинки — це не просто солодкий перекус, а справжнє джерело клітковини, заліза, калію й антиоксидантів.

28 липня

23:43 Єдина рідна донька Тома Круза зреклася його прізвища

20 річна Сурі, єдина донька Тома Круза та Кеті Голмс, офіційно відмовилася від прізвища знаменитого батька й зареєструвалася для участі у виборах у США під ім’ям Сурі Ноель.

23:33 Повернення легенди: збірну Франції очолив Зідан, що відмовився задля цього від €100 млн на рік

Легендарний французький футболіст Зінедін Зідан офіційно став головним тренером національної збірної Франції. Контракт підписано на чотири роки — він діятиме до завершення чемпіонату світу 2030.

23:23 Чому смартфон в авто заряджається повільно: типова помилка і швидкий спосіб

Смартфон у машині заряджається повільно не через кабель чи акумулятор, а через самі вбудовані USB-порти: вони створені для передачі даних, а не для швидкої зарядки.

23:13 Допоможе швидше заснути і спати міцніше: що радять дієтологи замість піґулок

Лікарі наголошують: щоб заснути швидше й прокинутися бадьорим, зовсім не обов’язково вживати пігулки магнію чи снодійне — достатньо перед сном з’їсти банан.

Станом на 28 липня вступники подали 805 822 заяви на вступ до бакалаврату та медичної магістратури.

22:52 Замість батька – тітка Джулія: єдина рідна донька Еріка Робертса не запросила його на весілля

Єдина рідна донька актора Еріка Робертса — Емма — вийшла заміж, але на весілля не запросила батька.

22:42 Від Nissan до Volvo: експерти склали рейтинг найкращих електромобілів 2026 року

Британські експерти Auto Express назвали десятку найкращих електромобілів 2026 року — від доступних міських хетчбеків до преміальних кросоверів із запасом ходу понад 800 км.

22:32 Щоб вітамін D засвоївся повністю: дієтологи назвали найефективніший спосіб приготування яєць

Яйця справді є одним із небагатьох природних джерел вітаміну D, але для того, щоб організм засвоїв його максимально ефективно, важливо поєднувати їх із корисними жирами — наприклад, оливковою чи авокадовою олією.

22:00 Якою буде погода 29 липня: де в Україні пройдуть дощі та грози

У вівторок, 29 липня, в більшості регіонів України очікується суха та комфортна погода. Лише на сході та північному сході країни через вплив холодного атмосферного фронту прогнозуються дощі та грози

21:44 В Одесі під час руху вибухнув автомобіль: водій загинув, пасажирку доправили до лікарні

21:26 Буданов заявив про домовленості щодо прискорення переговорного процесу

21:18 У Львові врятували однорічну дівчинку, яка вдихнула арахіс

21:00 Масштабне викриття тютюнової імперії. Суд за картини з Польщею | ПравдаТУТ Львів

20:51 Дофаміновий детокс: чи справді нам потрібно відмовитись від “швидкого” задоволення

20:34 Стало відомо, яку спеціальність у коледжах України обирали найчастіше у 2026 році

Найбільший попит серед вступників до закладів фахової передвищої освіти у 2026 році має спеціальність «Медсестринство». На неї абітурієнти подали понад 11 тисяч заяв

20:19 Де в Україні найдорожчі та найдешевші приватні будинки: нові дані про ціни

Ціни на приватні будинки в Україні відрізняються у десятки разів залежно від регіону

20:07 У Польщі спалахнув новий скандал через образи українців: поліція відкрила справу

Справу розслідують не лише за фактом погроз, а й за підозрою у дискримінації за національною ознакою

19:43 В Італії чоловіка ув’язнили за фальшивий римський амфітеатр, на якому він заробляв на туристах

Італійський суд засудив 69-річного чоловіка, який власноруч звів несправжній «давньоримський» амфітеатр і роками продавав туристам квитки на екскурсії

19:30 Мільйонний ХАБАР, підпільна фабрика та напад на мітингу | Новини Львова | ПравдаТУТ Львів

19:19 Дослідження: збалансований раціон важливіший для здоров’я, ніж відмова від оброблених продуктів

Науковці дійшли висновку, що на довготривале здоров’я більше впливає загальна якість харчування, ніж сам факт наявності у раціоні сильно оброблених продуктів

18:47 ЄС готує найбільший пакет санкцій проти російських компаній, — Bloomberg

Європейський Союз планує запровадити санкції проти понад 1600 російських компаній, які, за даними джерел, підтримують військову агресію рф проти України

18:33 Роберто Манчіні вдруге очолив збірну Італії

Італійська федерація футболу призначила Роберто Манчіні головним тренером національної команди. Фахівець уже працював із «Скуадрою Адзуррою» та привів її до перемоги на Євро-2020

18:14 У США схвалили новий препарат для лікування РДУГ, який діє за новим принципом

У США дозволили використовувати новий препарат для лікування розладу дефіциту уваги з гіперактивністю (РДУГ). Він став першим схваленим засобом, що діє за механізмом, подібним до антидепресантів

18:06 У Польщі Конституційний суд заборонив реєстрацію укладених за кордоном одностатевих шлюбів

Більше новин