OpenAI і Anthropic обмінялися перевірками безпеки моделей ШІ

Вперше компанії провели крос-аудит своїх продуктів і оприлюднили висновки

Фото: depositphotos

OpenAI та Anthropic вперше провели взаємну оцінку безпеки своїх моделей штучного інтелекту й опублікували результати. Про це повідомляє Engadget.

Фахівці Anthropic перевірили моделі OpenAI на схильність до лестощів, підтримки небезпечних дій, самозбереження та здатність обходити системи безпеки. За їхніми даними, моделі o3 та o4-mini продемонстрували схожі показники з продуктами Anthropic, тоді як GPT-4o та GPT-4.1 викликали більше занепокоєння. Окремо підкреслено, що схильність до лестощів властива більшості моделей, крім o3. Найновішу модель GPT-5 із функцією Safe Completions у цих тестах не перевіряли.

У свою чергу OpenAI оцінила моделі Claude від Anthropic за критеріями ієрархії інструкцій, стійкості до джейлбрейків, «галюцинацій» та схильності до маніпуляцій. Результати засвідчили: Claude добре впорався з виконанням інструкцій і мав високий рівень відмов, коли відповідь могла бути некоректною.

Аудит відбувся на тлі напружених відносин між компаніями. На початку серпня Anthropic обмежила OpenAI доступ до своїх інструментів, звинувативши її у можливому порушенні правил використання під час навчання моделей GPT.

Нагадаємо, PromptLock: новий вірус на основі ШІ атакує Windows, Linux та macOS

Юлія Люшньова - pravdatutnews.com

Теги:

OpenAI

Anthropic

штучний інтелект

технології

кібербезпека

GPT

Claude

ші

четвер, 28 серпня 2025 р., 19:32

Читайте також

Anthropic пояснила, як історії про «злий ШІ» могли вплинути на Claude

Компанія назвала таку поведінку проявом «агентної невідповідності» та пов’язала її з шаблонами у тренувальних даних.

11 травня 2026 р., 14:39

Китай розробляє ШІ для розуміння мови тварин

Система збиратиме різноманітні дані про тварин, включаючи їхні голосові сигнали

10 травня 2025 р., 12:11

Meta вивчає можливість використання сторонніх ШІ-моделей

У фокусі — Gemini від Google та ChatGPT від OpenAI для покращення пошукових і діалогових функцій

01 вересня 2025 р., 08:16

Рекомендовані

Пам’ятник Булгакову «дерусифікували» і забрали з Андріївського узвозу у Києві

На Андріївському узвозі у столиці України демонтували пам’ятник російському та радянському письменнику Михайлу Булгакову.

04 червня 2026 р., 22:32

В Єврокомісії визначились, чи позбавлятимуть захисту українців мобілізаційного віку

Єврокомісія підтвердила: українці, які вже мають тимчасовий захист у ЄС, не втратять його.

02 червня 2026 р., 23:03

Гарантовано спалює жир: простий і приємний спосіб схуднути без зайвих витрат

Єдина вправа, що не потребує додаткових витрат, але гарантовано допомагає схуднути — це звичайна ходьба.

02 червня 2026 р., 06:36

Loading...

Load next

Топ теми

Росія вночі атакувала Запоріжжя: частина міста залишилася без світла, спалахнула пожежа

Окупанти застосовували безпілотники, керовані авіабомби та балістичне озброєння, енергетики вже працюють над відновленням електропостачання

07 червня 2026 р., 10:34

Зеленський відзначив 37 медійників українських та іноземних видань із нагоди Дня журналіста

Орденом відзначили продюсерку та лейтенантку ЗСУ Вікторію Боброву (Квітку), яка загинула 23 квітня в місті Барвінкове Харківської області

06 червня 2026 р., 19:26

Російська атака на Запоріжжя: загинули двоє людей, пошкоджено інфраструктуру міста

Унаслідок удару дронами постраждали об’єкти критичної та промислової інфраструктури

06 червня 2026 р., 08:34

Останні новини

08 червня

00:11 Як впоратись зі стресом без піґулок: 10 простих, але дієвих способів

Згідно з дослідженнями, 47 % українців постійно відчувають високий рівень стресу, а 57 % борються з тривогою майже щодня. Тому такі природні методи — це не просто лайфхаки, а реальні інструменти самодопомоги, які варто практикувати щодня.

07 червня

23:43 За які порушення ПДР в Україні штрафують найчастіше, а за які – конфіскують авто

У 2026 році в Україні продовжують діяти посилені санкції за порушення правил дорожнього руху.

23:33 Татуювання і правда про ризики: 5 міфів, за які розплачуємося здоров’ям

Татуювання — це не лише мистецтво на тілі, а й втручання у здоров’я. Лікарі розвінчують п’ять міфів, які досі вводять людей в оману: від уявної безпечності фарб до «чарівного» лазерного видалення без слідів.

23:23 У найбільшому місті світу живе більше людей, ніж в усій Україні

Чунцін — найбільше місто світу, де проживає понад 32 мільйони людей, тобто більше, ніж у всій Україні.

23:13 Зеленський назвав «найшвидший спосіб» завершити війну

Президент наголосив, що це не означає "дати Росії те, чого вона хоче"

23:03 Віталій Кличко пояснив, чому й досі «холостякує»

Віталій Кличко вперше за довгий час відверто розповів про своє особисте життя — мер Києва визнав, що нині його серце вільне, а головною причиною самотності назвав постійну зайнятість і відсутність часу навіть на друзів.

22:52 Універсал із характером спорткара: Subaru представила три варіанти Levorg 2026

Subaru представила оновлений універсал Levorg 2026 — модель на базі Impreza з гібридною установкою, витратою лише 5,3 л/100 км і повним приводом.

22:42 Щоб волосся росло швидше і не сіклось: 8 порад лікарів

Ріст волосся — процес повільний, у середньому 10–15 см на рік. Але комплексний підхід — від тарілки з корисними продуктами до зменшення стресу — реально повертає густоту й блиск. Це не магія, а щоденна турбота, яка з часом приносить результат.

22:32 Офіційні зарплати урядовців у травні перевищили середню у 4 рази

У травні 2026 року зарплати керівників Кабміну коливалися від 109 000 до 128 000 грн після сплати податків.

21:30 Дощі, грози та шквали: якою буде погода в Україні 8 червня

У північних і центральних областях місцями можливі значні дощі, а вдень на Лівобережжі прогнозують грози.

20:28 Смартфон може швидше втрачати ресурс батареї через одну звичку під час заряджання

Такий порядок може зменшити ризик стрибків напруги й допомогти продовжити термін служби акумулятора.

20:03 Колишній чемпіон світу Андраде проведе перший бій із 2023 року

Американський боксер проведе поєдинок 24 липня на арені Mohegan Sun в Анкасвіллі.

19:33 Квіти, які витримають спеку без постійного поливу: що посадити на клумбі

У спекотне літо не всі рослини здатні зберігати декоративність без регулярного поливу. Однак є квіти, які добре переносять посуху й можуть цвісти навіть за складних умов.

19:02 4 продукти, що можуть шкодити селезінці – що радять обмежити дієтологи

Фахівці пояснюють, що здоров’я селезінки тісно пов’язане зі станом печінки та загальним рівнем запалення в організмі.

18:22 Переїзд за коханням в іншу країну: 7 помилок, яких можна уникнути

Переїзд заради кохання може стати щасливим рішенням, але адаптація в іншій країні потребує часу, підтримки й підготовки.

18:00 Кібершахрайство у Львові! Якшахраї полюють на підлітків ? ТОП популярних схем! | ПравдаТУТ Львів

17:37 Одна транзакція Bitcoin залишає майже пів тонни CO2 – дослідження

За оцінками фахівців, одна транзакція Bitcoin генерує близько 486 кг діоксиду вуглецю.

17:00 Будівельні закупівлі стануть прозорішими: в Україні створюють державну базу цін

Нова система має допомогти перевіряти вартість будівельної продукції та виявляти завищені ціни.

16:34 Більше клітковини, ніж у яблуці: які овочі варто додати до раціону

Клітковина підтримує травлення, допомагає довше відчувати ситість і є важливою частиною збалансованого раціону.

16:00 КАБи вдарили біля зупинки у передмісті Запоріжжя: є загиблі та поранені

Внаслідок атаки по Балабиному загинули двоє людей, ще п’ятеро отримали поранення.

15:31 Ворожий БПЛА атакував електровоз у Запоріжжі

Локомотивна бригада вчасно перейшла в укриття, тому обійшлося без постраждалих.

15:10 Унікальна операція на печінці, трансплантація серця у 18 років та новий інклюзивний спортмайданчик

У випуску новин Львова: медики врятували чоловіка від смертельного діагнозу та провели унікальну операцію на печінці без трансплантації.

14:38 Дослідження: віддалена робота може погіршувати психічне здоров’я через соціальну ізоляцію

Вчені фіксують зростання рівня самотності та психологічного дистресу серед працівників, які працюють із дому

14:04 Перша річ, яку варто зробити, заходячи в гості до когось додому

Експерти з етикету пояснюють, що перші секунди в домі господаря задають тон усьому візиту — і все починається з правильної поведінки при вході

13:34 Продукти з прихованим цукром: які «здорові» продукти можуть виявитися солодшою пасткою

Деякі продукти, які багато людей вважають корисними для здоров’я, можуть містити значно більше цукру, ніж здається на перший погляд. Експерти радять уважно читати склад та харчові етикетки, щоб уникнути надмірного споживання доданого цукру

Більше новин