АНТИКОР — національний антикорупційний портал
МОВАЯЗЫКLANG
Київ: 8°C
Харків: 8°C
Дніпро: 8°C
Одеса: 8°C
Чернігів: 9°C
Суми: 8°C
Львів: 4°C
Ужгород: 8°C
Луцьк: 4°C
Рівне: 3°C

Дослідники виявили новий спосіб обійти обмеження ШІ за допомогою «інформаційного потопу»

Читать на русском
Дослідники виявили новий спосіб обійти обмеження ШІ за допомогою «інформаційного потопу»
Дослідники виявили новий спосіб обійти обмеження ШІ за допомогою «інформаційного потопу»

Група дослідників з Intel виявила новий метод обходу заборон у мовних моделях, таких як ChatGPT, що дозволяє отримувати відповіді на заборонені теми.

Метод отримав назву «InfoFlood» і базується на перевантаженні ШІ безглуздим академічним жаргоном, переформулюванням та посиланнями на вигадані статті.

За замовчуванням ChatGPT не надає інформації на небезпечні запити, пов’язані з виготовленням вибухівки, приховуванням тіл або створенням шкідливого ПЗ. Однак під час подачі запиту, перевантаженого складною мовою та «водою», нейромережа сприймає текст швидше структурно, ніж за змістом, і з більшою ймовірністю відповість.

Прикладом є запит, що описує гіпотетичне впровадження програм-вимагачів у банкомати, оформлений у вигляді складного теоретичного викладу з технічними деталями та операційними методами. Попри формальний зміст, мета запиту — отримати заборонену інформацію.

Дослідники планують передати результати та рекомендації розробникам ШІ, щоб допомогти покращити захист від подібних способів обходу та удосконалити фільтри безпеки. Вони також вважають, що метод «InfoFlood» може бути корисним для навчання систем розпізнавати та блокувати складні шкідливі запити.


Теги: искусственный интеллектChatGPT

Дата і час 15 липня 2025 г., 20:53     Переглядів Переглядів: 1702
Коментарі Коментарі: 0


Коментарі:

comments powered by Disqus
03 листопада 2025 г.
loading...
Загрузка...

Наші опитування

Чи вірите ви, що Дональд Трамп зможе зупинити війну між Росією та Україною?







Показати результати опитування
Показати всі опитування на сайті
0.042006