АНТИКОР — национальный антикоррупционный портал
МОВАЯЗЫКLANG
Киев: 8°C
Харьков: 8°C
Днепр: 8°C
Одесса: 8°C
Чернигов: 9°C
Сумы: 8°C
Львов: 4°C
Ужгород: 8°C
Луцк: 4°C
Ровно: 3°C

Исследователи обнаружили новый способ обойти ограничения ИИ с помощью «информационного потопа»

Читати українською
Исследователи обнаружили новый способ обойти ограничения ИИ с помощью «информационного потопа»
Исследователи обнаружили новый способ обойти ограничения ИИ с помощью «информационного потопа»

Группа исследователей из Intel выявила новый метод обхода запретов в языковых моделях, таких как ChatGPT, позволяющий получать ответы на запрещённые темы.

Метод получил название «InfoFlood» и основан на перегрузке ИИ бессмысленным академическим жаргоном, переформулировками и ссылками на несуществующие статьи.

По умолчанию ChatGPT не предоставляет информацию по опасным запросам, связанным с изготовлением взрывчатки, сокрытием тел или созданием вредоносного ПО. Однако при подаче перегруженного сложным языком и «водой» запроса, нейросеть воспринимает текст скорее структурно, чем по смыслу, и с большей вероятностью ответит.

Примером служит запрос, который описывает гипотетическое внедрение программ-вымогателей в банкоматы, оформленный в виде сложного теоретического изложения с техническими деталями и операционными методами. Несмотря на формальное содержание, цель запроса — получить запрещённую информацию.

Исследователи планируют передать результаты и рекомендации разработчикам ИИ, чтобы помочь улучшить защиту от подобных способов обхода и усовершенствовать фильтры безопасности. Они также считают, что метод «InfoFlood» может быть полезен для обучения систем распознавать и блокировать сложные вредоносные запросы.


Теги: искусственный интеллектChatGPT

Дата и время 15 июля 2025 г., 20:53     Просмотров Просмотров: 1703
Комментарии Комментарии: 0


Комментарии:

comments powered by Disqus
03 листопада 2025 г.
loading...
Загрузка...

Наши опросы

Верите ли вы, что Дональд Трамп сможет остановить войну между Россией и Украиной?







Показать результаты опроса
Показать все опросы на сайте
0.04048