Как определить, что фотографию создала нейросеть (Спойлер: смотрим на блеск и яркость)

ИИскусство: какие средства разоблачения нейрофотографий существуют сегодня.

Сегодня «нейромашинное» творчество распознать не так сложно (пока!), но нейросети обладают наибольшим потенциалом, чтобы обмануть зрителя и воздействовать на его мнение, настроение и мировоззрение.

Если речь идет о фото, в наши дни еще можно заподозрить, что снимок или картинка продукт творчества нейроботов, но если речь идет о художественной картине, то в этом случае огрехи и особенности, описанные ниже, гораздо вероятнее принять за видение художника. И поэтому, пока в Сети не появилась маркировка, помечающая творчество как продукт ИИ, и нет соответствующих законов, защищающих пользователей, передвигайтесь по Интернету осторожно, как по минному полю, и не верьте тому, что видите. Держим наготове свой «ИИ-радар», читаем инструкцию и разоблачаем нейрофейки, отделяя правду от вымысла нейробота.

Введение

ИИ-искусство — это уже не просто концепция: оно повсюду, и мы, скорее всего, сталкиваемся с ним каждый день, порой даже не догадываясь, что это за явление перед нами. Этот вид, с позволения сказать, творчества и искусства завоевывает награды (хотя и вызывает споры), уже используется в фильмах Netflix и других киностудий и обманывает несметное количество пользователей соцсетей ложными изображениями младенцев, политиков и звезд шоу-бизнеса, фейковой едой, животными и много чем еще. В ближайшее время продукт творчества нейросетей, естественно, никуда не денется, поэтому лучше научиться отделять зёрна от плевел, хорошее от дурного, вредное от полезного или поддельное нейроизображение, созданное ИИ, от реальной фотографии. 

Поскольку технология создания нейрофотографий продолжает совершенствоваться, сейчас как никогда важно научиться их распознавать, чтобы не быть одураченным чужими поддельными картинками. Образ какой-нибудь утки, сгенерированный нейросетью, может показаться безобидным, но когда злоумышленники распространяют дезинформацию с помощью вот таких нейроизображений, последствия оказываются куда более плачевными.

Компании, создающие подобные бот-генераторы, сегодня работают над способами создания специальных «водяных знаков» для такой нейропродукции, но до нужного результата еще далеко. Большинство фальшивых изображений циркулирует в Сети без четкой маркировки, предупреждающей пользователей о том, что они ненастоящие. Советы, которые мы в 1GAI.ru собрали в статье, помогут вам распознать фейковые, искусственно созданные изображения — они наверняка часто появляются в вашей ленте соцсетей, в Телеграме и на новостных сайтах.

Как работают фотогенераторы искусственного интеллекта

На первый взгляд художественные произведения нейросетей просто сшиты из множества изображений базы данных. Однако, на самом деле, все не так.

Генераторы искусственного интеллекта действительно обучаются на огромных базах данных изображений, от художественных картин до фотографий. Однако эти машинные инструменты не могут «видеть» эти картинки так, как это делает человек. Вместо этого они разбивают объекты на части: на пиксели (анализируется пиксель за пикселем).

ИИ не видит яблоко — он видит группу пикселей и их значения. Со временем он «поймет», что эта определенная группа пикселей с определенными значениями и параметрами и есть то самое яблоко. Обучите искусственный интеллект на достаточном количестве изображений с соответствующим контекстом, и он начнет проводить аналогии между всеми видами объектов и стилей. Он «поймет», как в целом изображать фрукты, животных и людей, а также различные художественные направления, стили, цвета и настроения.

Современные нейрогенераторы изображений, такие как DALL-E, используют так называемую диффузию для обучения и создания картинок.

По сути, они берут обучающее изображение и добавляют к нему визуальный «шум» (считайте, статический), пока вся картинка не потеряет смысл. Идея состоит в том, чтобы понять, как влияет на рисунок добавление шума на каждом этапе: после этого машина пытается сделать все наоборот, создавая свою собственную версию исходного материала из ничего, то есть из визуального «шума» (из набора беспорядочных разноцветных пикселей): именно так тренируется ИИ создавать изображения с нуля.

Это очень упрощенное объяснение, но важно знать основную идею: эти генераторы опираются на огромную базу данных заученных взаимосвязей. Обученный бот позволяет создавать сложные сцены за считанные секунды. Но часто подобная нейрогенерация приводит к появлению странных вещей, которые могут помочь нам отличить изображение ИИ от настоящего.

Ссылка на статью

Посчитайте пальцы

С каждым годом генерация изображений ботами становится все лучше, но они все еще неидеальны. Хотя ИИ-инструменты уже сейчас способны генерировать высококачественные изображения с реалистичным освещением, они пока не справляются с мелкими деталями.

Наиболее известным и частым багом нейросетей является неправильная генерация количества пальцев на руках человека. Причем эти ошибки встречаются на изображениях, где остальные детали точны и убедительны. Посмотрите на руки, и вы можете увидеть шесть, семь или даже восемь пальцев на каждой. А может быть, все наоборот: на руке может оказаться три пальца, два из которых превращаются в один. В любом случае, именно пальцы и руки чаще всего оказываются в хаосе на сгенерированных нейросетями картинках.

Но если пальцы — это то, в чем ИИ чаще всего ошибается, в целом на руках его проблемы не заканчиваются. На самом деле, любые повторяющиеся детали (особенно если речь идет о человеке) могут быть сгенерированы искусственным интеллектом неправильно. Например, зубы: иногда их может быть слишком много или они выглядят кривыми или искаженными. 

Кстати, иногда на сгенерированном изображении можно увидеть человека с лишней конечностью. Признайтесь, вам попадалась ИИ-картинка, глядя на которую вы гадали, что в ней не так, и вдруг замечали, что из одежды человека вылезла третья рука?

На сайте Vox есть отличное видео о том, почему искусственный интеллект не справляется с такими повторяющимися элементами. Оказывается, все причины сводятся к недостатку опыта машины. ИИ-боты обучаются на огромном количестве данных, но когда дело доходит до чего-то сложного (например, рук), имеющиеся данные не обеспечивают достаточного контекста для того, чтобы нейросеть имела представление, как правильно и реалистично сгенерировать конечности человека. Она не знает, как на самом деле работают руки, и может опираться только на то, что видит. Именно в этом сразу видны пределы ее знаний. Но имейте в виду, что все машины учатся. И уже не за горами время, когда все детали человека ИИ смогут воспроизводить без ошибок. 

Следите за смешивающимися элементами

Промт (запрос): «Создай фото, группу друзей, улыбающихся друг другу во время игры в настольную игру»

(Фото: Open AI)

Посмотрите на продукт творчества ИИ, и вы заметите нечто странное: повсюду предметы смешиваются и переходят друг в друга. Это происходит не только с пальцами, но и со многими другими деталями: зубы превращаются в другие зубы, одежда сливается сама с собой, глаза плавно перетекают в другие части головы.

Но это касается не только частей человеческого тела. Обратите внимание на сгенерированные изображения нейросети DALL-E, приведенное выше.

Поле настольной игры неровное и волнистое, части доски сливаются с фишками (игровые фигуры).

Зубы девушки справа сжаты, кривы и наезжают друг на друга, а манжеты свитера другой женщины складываются сами в себя (не говоря уже о том, что ее пальцы сливаются в один).

Внимательно смотрите на надписи

Попросите DALL-E сгенерировать карту, и нейросеть сделает это — но есть вопрос, насколько точно бот это сделает.

(Фото: OpenAI)

Нейросеть может неплохо генерировать хороший, грамотный текст, но зачастую она не справляется с подписями на изображениях. Иногда это логотип, который похож на свой реальный аналог, но до него не дотягивает (видно, что он пытается сказать «Кока-Кола», но все буквы перемешиваются между собой). В некоторых случаях это похоже на попытку выдумать новый язык или на то, как будто вы пытаетесь прочитать что-то во сне (кстати говоря, на самом деле, многие из изображений ИИ реально напоминают сон или бред).

Прямо сейчас эта сторона искусства ИИ стремительно улучшается с каждым днем. И DALL-E, и многие другие боты уже смогли сгенерировать изображение торта с четкой и главное правильной надписью «HAPPY BIRTHDAY KAREN». Тем не менее результат все равно неидеальный: вторая буква «P» в слове «HAPPY» больше похожа на букву «Y», а буква «A» в слове «KAREN» имеет две линии, а не одну. Но важно отметить, что эти картинки с надписью получаются намного лучше, когда вы специально в промте попросите ИИ написать ее. Если не расписать подробно промт, слова в результате будут часто выглядеть странно, а это может быть очевидным признаком, что изображение создано машиной.

Ищите вещи, которые не имеют смысла (бессмысленные)

В конце концов, ИИ на самом деле не разбирается в искусстве. Он создает его на основе взаимосвязей, которые он собрал из всех данных, на которых обучался. Он не знает, как в точности должно быть построено здание, как играют в теннис или как двигается человеческая рука. Он использует сведения из учебной базы, чтобы воспроизвести эти запросы в меру своих возможностей. Если присмотреться, то можно заметить, что пробелы в знаниях проявляются во всех работах нейросетей, особенно в картинах, где происходит много событий.

Возьмем пример: нейронную сеть DALL-E попросили создать изображение вечеринки в подвале, где люди играют в пиво-понг, пьют из красных одноразовых стаканчиков Solo Cup и общаются. Результат был не очень. Сразу же возникают некоторые серьезные проблемы: глаза людей в кадре в основном не видны; рука человека, кидающего мячик, неестественная; и почему он бросает шарики для пинг-понга с этой стороны? Кстати, о столе: он волнистый и деформируется и с одной стороны стола почему-то еще наборы стаканов.

Посмотрите на задний план, и все становится еще более странным. Мужчина сидит на корточках и пьет из красного стакана, как будто это бутылка. Человек за его спиной, похоже, держит синюю банку внутри своей красной чашки. У человека, сидящего сзади него, лицо так размыто, что кажется отфотошопленным.

Промт: «Создай изображение вечеринки в подвале: люди играют в пиво-понг, пьют из красных Solo Cup стаканчиков и общаются»

OpenAI

Даже в официальных примерах компаний, создающих эти инструменты, встречаются подобные логические несоответствия. У OpenAI есть забавное изображение авокадо у врача-терапевта, чтобы продемонстрировать работу DALL-E 3.

OpenAI

У авокадо на животе ямка, и он жалуется терапевту (по сути — ложке) на ощущение пустоты внутри. Вполне приличная картинка, но посмотрите на блокнот терапевта: в нем он пишет задом наперед, страницами наружу. Бот DALL-E видел достаточно изображений терапевтов, чтобы знать, с какими инструментами они обычно работают и принимают пациентов, но машина не понимает, что мы, люди, обычно пишем на бумаге, а не на планшете с прищепкой.

Конечно, посты ИИ, которые становятся вирусными в социальных сетях, часто вообще не имеют смысла. Вы видели скульптуры кошек из печенья Oreo? Или смешных котиков в образах знаменитых героев боевиков? Да, любое искусство может быть образным, но вот искусство от ИИ — это еще и странно, причем как в мелких деталях, так и в масштабных темах. Именно поэтому творчество нейросетей завоевывает популярность по всему миру. Ни один художник не создаст такие странные и необычные уникальные картины. 

Всё внимание — на «блеск» и яркость

Посмотрев некоторое время на изображения, созданные нейроботами, вы начинаете замечать еще кое-что необычное, особенно среди фотореалистичных картин: это странный блеск почти всего. Картины часто получаются с так называемым характерным «блеском искусственного интеллекта»: и именно он может выдать происхождение и автора рисунка, правда, если вы знаете, что ищете и на что обращать внимание. Картинки нейросетей часто переэкспонированы или имеют резкое освещение, что делает почти все объекты слишком яркими.

Посмотрите на фотографию ниже, и вы сразу поймете, что она была сделана с помощью искусственного интеллекта, просто по одному ее виду (даже если у объекта «съемки» руки-ноги на месте).

Промт: «Создай реалистичную фотографию женщины, держащей бейсбольный мяч двумя руками»

(Фото: OpenAI)

Проявляйте скептицизм

Нынешний мир таков, что современные технологии и чей-то замысел или умысел легко может обмануть любого человека. Поэтому без критически-недоверчивого отношения к чему-либо сегодня в Сети никуда. В общем, увидев какую-то вирусную картинку, не спешите верить, что ее создал или сфотографировал человек. 

Хотя эти советы могут быть актуальны сегодня, технологии ИИ продолжают развиваться и совершенствоваться, и в ближайшем будущем они могут стать бесполезными. Нейросети уже сейчас стали работать лучше. И машины продолжают самообучаться. Так что не стоит быть уверенным в том, что они не придумают способ генерировать реалистичные руки на каждом своем изображении. Или чтобы элементы на фотографии не сливались друг с другом. Даже не сомневайтесь: боты рано или поздно научатся многому чему. В том числе они перестанут добавлять странную чертовщину на фон картинок.

И еще: если советы, приведенные выше, полезны для фотореалистичных изображений (фотографий), то вот распознать произведения искусства, созданные ИИ, может быть намного сложнее: эти работы могут иметь те же недостатки, о которых говорилось выше, но несоответствия проще замаскировать мазками «краски», которая часто смешивается, менее реалистична и более открыта для интерпретации. Ведь, согласитесь, если речь идет о художественных картинах, рисованной или векторной графике или об иллюстрациях, то уже тяжело определить, кто автор — человек или машина.

В наше неспокойное время как никогда важно включать свой «радар» бдительности. Особенно когда вы просматриваете что-то в Интернете. Прежде чем впечатлиться чьим-то замысловатым произведением искусства или прийти в ярость от оскорбительного изображения, подумайте дважды: а существует ли это изображение вообще? Вполне возможно, перед вами фейк, созданный машиной. 

Обложка: Open AI, 1GAI.ru

Источник статьи: All the Ways to Tell a Picture Was Made With AI

Смотрите также:

Как определить, что видео создала нейросеть

6 лучших нейросетей, которые генерируют музыку (и не только ее)

Всё, что вы хотели знать о нейросетях — технологиях, которые уже прочно вошли в нашу жизнь

100 изображений, которые создала нейросеть GigaChat (Спойлер: теперь мы знаем, как выглядит чудо в перьях)

Как использовать нейросеть Gemini на iPhone без приложения Google (В России работает)

Оцените новость:
27.09.24 (17:42)
1 200
Источник — © 1gai.ru
Автор — 1gai
Какой ваш доход в месяц?

Следите за нами в соцсетях

Новостная рассылка


Рассылка анонсов статей производится каждый понедельник