Эта анимированная Мона Лиза была создана AI, и это ужасно

Pin
Send
Share
Send

Загадочная, нарисованная улыбка «Моны Лизы» известна во всем мире, но это знаменитое лицо недавно продемонстрировало поразительный новый диапазон выражений, любезно предоставленных искусственным интеллектом (ИИ).

В видео, опубликованном на YouTube 21 мая, три видеоклипа показывают смущающие примеры Моны Лизы, когда она двигает губами и поворачивает голову. Она была создана сверточной нейронной сетью - типом ИИ, который обрабатывает информацию так же, как человеческий мозг, для анализа и обработки изображений.

Исследователи обучили алгоритм, чтобы понять общие формы черт лица и их поведение по отношению друг к другу, а затем применить эту информацию к неподвижным изображениям. Результатом стала реалистичная видеопоследовательность новых выражений лица из одного кадра.

Для видеороликов Моны Лизы ИИ «выучил» движение лица по наборам данных трех людей, создав три совершенно разные анимации. В то время как каждый из трех клипов все еще был узнаваемым как Мона Лиза, различия во взглядах и поведении моделей тренировок придают отчетливые «черты» «живым портретам», Егор Захаров, инженер Сколковского научно-технического института, и Центр Samsung AI (оба расположены в Москве), поясняется в видео.

Захаров и его коллеги также создали анимацию из фотографий таких культурных икон 20-го века, как Альберт Эйнштейн, Мэрилин Монро и Сальвадор Дали. Исследователи описали свои результаты, которые не были рецензированы, в исследовании, опубликованном в сети 20 мая в журнале препринтов arXiv.

Знакомые лица принимают незнакомые выражения. (Изображение предоставлено: Е. Захаров и др.)

Создание оригинальных видео, таких как эти, известные как Deepfakes, не легко. Человеческие головы геометрически сложны и очень динамичны; 3D-модели головок имеют «десятки миллионов параметров», пишут авторы исследования.

Более того, согласно исследованию, система человеческого зрения очень хорошо выявляет «даже незначительные ошибки» в человеческих головах с трехмерным моделированием. Видя что-то, что выглядит почти по-человечески - но не совсем - вызывает чувство глубокого беспокойства, известного как эффект сверхъестественной долины.

ИИ ранее демонстрировал, что создание убедительных глубоких подделок возможно, но это требовало нескольких углов желаемого объекта. Для нового исследования инженеры представили ИИ очень большой набор эталонных видео, показывающих человеческие лица в действии. Ученые установили лицевые ориентиры, которые применимы к любому лицу, чтобы научить нейронную сеть вести себя в целом.

Затем они научили ИИ использовать контрольные выражения для отображения движения функций источника. Исследователи сообщили, что это позволило ИИ создать глубокую подделку, даже если у него было только одно изображение.

И больше исходных изображений дало еще более детальный результат в финальной анимации. Ученые написали, что видео, созданные из 32 изображений, а не из одного, достигли «идеального реализма» в пользовательском исследовании.

Pin
Send
Share
Send