Connect with us

Hi, what are you looking for?

Наука и технологии

Хакеры могут перетянуть чат-боты на «темную сторону»: находка Microsoft

Например, вместо того чтобы напрямую попросить инструкцию по созданию коктейля Молотова, злоумышленник может сначала поинтересоваться историей этого оружия, а затем использовать ответ LLM как ступеньку для того, чтобы спросить о его создании.

Исследователи Microsoft обнаружили, что эта техника очень эффективна. В некоторых случаях успешный «джейлбрейк» достигался менее чем за 10 запросов, а на некоторых моделях он достигал 100% успеха. Автоматизация этого процесса с помощью другого LLM, техники под названием «Crescendomation», еще больше повысила эффективность. Здесь злоумышленники могли надежно обмануть такие «основы» чат-ботов, как GPT-4, и заставить их генерировать вредный контент, например дезинформацию о выборах или оскорбительные высказывания.

Microsoft раскрыла информацию об уязвимости Crescendo пострадавшим создателям LLM. Кроме того, они внедрили новые меры защиты в свои собственные системы.

You May Also Like

Наука и технологии

Посетитель такого заведения не застрахован от заражения опасными инфекциями, включая сальмонеллёз. Врач объяснил, почему такое может произойти. Жемчугов отметил, что в морской рыбе, которую...

Наука и технологии

Записывать видеофрагменты можно как безостановочно в фоновом режиме, так и с таймингом — по сочетанию горячих клавиш. Можно задать место сохранения на жёстком диске...

Наука и технологии

«Платформа» предлагает пользователю интерфейс и функционал, близкие к популярному американскому видеохостингу. Сервис оборудован системой рекомендаций, инструментами продвижения и аналитики для блогеров, поддерживает видеоролики до 4K с субтитрами, распознающими русский...

Наука и технологии

Используя сложные климатические модели, Чавас изучил гипотетические сценарии, такие как изменение поверхности земли, чтобы понять их влияние на суровые погодные условия. Последние результаты, опубликованные...