Видео, созданные ИИ, становятся настолько реалистичными, что их сложно отличить от настоящих. Новое поколение генераторов видео, вроде Sora от OpenAI и Runway Gen-2, использует диффузионные модели, создавая видео из шума.
Существующие методы обнаружения ищут неестественные движения, нетипичные для реальных видео, но эти признаки легко маскируются новыми ИИ-инструментами.
DIVID анализирует исходное видео и его реконструированную версию, выявляя несоответствия, указывающие на ИИ-обработку.
Исследователи отмечают, что DIVID может быть интегрирован в Zoom для обнаружения «deepfake» звонков в реальном времени. Также рассматривается создание веб-сайта или браузерного плагина для обычных пользователей.
Точность DIVID на тестовых видео достигает 93,7%. Пока инструмент доступен только разработчикам, но в будущем его планируют сделать более доступным.