
Удивительно, но “нейрохудожники” появилась не вчера. Оказывается, компьютеры умели генерировать целые картины еще когда в мире бушевал глэм-рок, молодежь страны Советов находила романтику в поездке на БАМ, а жесткий диск со 100 мегабайтами считался эпохальным прорывом технической мысли…
Мехкомпьютеры и “кислота”
Подрядить компьютер в художники люди стремились уже давно. Чего только стоит эксперимент Десмонда Пола Генри, пионера компьютерной графики, который научил суровую аналоговую ЭВМ из переработанных вычислителей бомбовых прицелов рисовать замысловатые узоры прямиком из параллельной реальности.
Вот уж действительно он перековал мечи, только не на орала, а мольберты: движущиеся части бомбонаводителя приводили в движение перо, прижатое к бумаге. Механизм имел несколько степеней свободы и “само‑осциллировал” под действием сервомоторов. Так эхо самой разрушительной войны, которую мы знаем, застыло в немой поэзии экстравагантных абстракций, затем перекочевавших в Windows Media Player.
Кстати говоря, похожим образом на свет появилась и первая компьютерная графика для кино. В 1958 аниматор Джон Уитни “перепилил” прицельный механизм зенитной артиллерии М5, чтобы тот двигал камеры и фиксировал в кадре светящиеся объекты дабы они превращались в психоделическое лазер-шоу. Полученная секвенция была включена в фильм Хичкока “Головокружение” и до сих пор выглядит гипнотически.
Кадры из заставки хичкоковского “Головокружения”/”Vertigo” (1958):



Но абстракции абстракциями, а может ли компьютер нарисовать что-то более осмысленное? А может даже и заменить служителя кисти и холста? Этим вопросом задался лондонский художник Гарольд Коэн (1928 – 2016), ставший в 1971 приглашенным исследователем в стэнфордской Лаборатории искусственного интеллекта.
Его звали Аарон…
Наблюдая за работой коллег-ИИшников, Коэн озадачивается мыслью: как превратить иррациональное и эфемерное искусство рисунка в код? Он начал с вопроса: “А что делает изображение эмоционально значимым?” и, не будучи даже технарем, попытался формализовать элементарные художественные решения под компьютерную логику: фигуры и фон, замкнутость и незамкнутость линий, симметрии, повторения,образующие узоры и все остальное.
Чтобы составить понятную систему координат для компьютера, он анализировал детские рисунки, наскальную живопись, схематику древних изображений и собственные абстракции, чтобы выделить базовые “функциональные примитивы” рисунка и затем перенести их в алгоритм. И что интересно, первые работы AARON’а действительно были похожи то ли на детские каракули, то ли на пиктографические символы, оставленные людьми пещерной древности.
Естественно, AARON не был построен на самообучающихся алгоритмах и плоды его творческих мук целиком и полностью зависели от системы правил, заложенных Коэном в фундамент программы. Вот как они приблизительно выглядели с собственной иерархией правил:
-
Высокий уровень — образы мира: люди, растения, предметы, масштабы, расположение объектов.
-
Средний уровень — стратегии рисования: как программа должна вести линию, соединять фигуры, заполнять пространство, а также избегать нежелательных, конфликтующих пересечений.
-
Низкий уровень — геометрические манёвры: кривые, углы, общая сегментация рисунка.
А поскольку учиться на ошибках AARON не умел, править их приходилось Коэну в ручную, каждый раз залезая в код и внося требуемые изменения.
Первые рисунки были крайне простыми монохромными эскизами, не особо постижимыми для маленького человеческого умишки. Но позднее AARON освоил и навык колориста, и более утонченные силуэты под руководством создателя, который внес в код соответствующие инструкции о том как работает композиционная логика цвета и формы.
Первоначально код для программы писался, скорее всего, на Фортране 66, но затем состоялась миграция на С, а уже в 90-х Коэн откроет для себя Lisp:
“В итоге я пришёл к выводу, что в C просто не хватало выразительности, чтобы адекватно представить нечто столь абстрактное, как цвет. И только после того, как я переписал всю программу на Common Lisp — CLOS — я наконец смог увидеть, как можно решить эту проблему.”
А дальше в цитате, дабы продемонстрировать выразительность человеческого языка, он упоминает, что у эскимосов 50 слов для снега. Но при этом, видимо по той же фундаментальной причине, эскимосского Шекспира мир так и не увидел.
Маленький робот рисует кораблик…
Коэн, наверно, первым доказал, что робот может нарисовать если не шедевр, то нечто интересное точно. По мере того как AARON взрослел, взрослело и его искусство: если начинал он буквально с “палка-палка, огуречик”, то уже к 80-м научился рисовать портреты вымышленных людей, которых Коэн никогда не встречал в жизни.
Интересно, что сам художник не воспринимал AARON’а как просто бездушную игрушку. Живший в компактной компьютерной станции Data General Nova, AARON был полноправным ассистентом Коэна, как Кустодиев для Репина. И временами робот сам становился наставником, когда автор с интересом наблюдал за художественной логикой своего маленького детища.
Вот что он сам говорил по этому поводу:
“Очень долгое время я считал, что работы AARON’а должны быть неотличимы от работ живых художников. Сейчас все иначе. Я хочу, чтобы работа выглядела так, будто она создана разумным существом, но при этом не человеком. Теперь я чувствую себя гораздо счастливее, когда программа создает изображение, которое выглядит так, будто его сделал некто или нечто, видящий мир в первый раз. Кто смотрит на него иначе, нежели человек, выросший среди себе подобных.”
И честно говоря, это гораздо более интересный подход, чем мгновенная генерация “пикч” сегодня. Да, это эффектно, часто нужно для дела и даже может поразвлекать, когда есть праздные пять минут. Но уникальность программы Коэна кроется именно в психологической глубине: не просто получить фотографический слепок с реального мира, а увидеть его через призму абсолютно чужого сознания. При чем человеку едва ли понятного.
Художник, что рисует дождь
AARON был не только первой программой, умевшей самостоятельно творить. Еще он наверно самый долгоиграющий софтверный проект в истории, Санта-Барбара от мира кода: Коэн любовно разрабатывал и улучшал свое детище почти 50 лет подряд до самого последнего дня жизни (!)
Выдающегося художника не стало в 2016, всего за год до того, когда на Реддите случится историческое нашествие дипфейков. А через шесть лет мир познакомиться с Midjourney и Stable Diffusion. И посреди жарких баталий о том является ли мазня GenAI искусством или нет, мы увидим, что сбылись пророческие слова Коэна, написанные им в 1982 году:
“Мы постепенно осознаем тот факт, что “интеллект” больше не синонимичен с термином “человеческий разум.”
ссылка на оригинал статьи https://habr.com/ru/articles/1028564/