Как FLUX.1 разрушает миллиардную индустрию ИИ-генераторов изображений

от автора

Теперь вы можете генерировать гиперреалистичные ИИ-изображения в промышленных масштабах бесплатно.

За последние несколько лет индустрия генераторов изображений на базе ИИ выросла в геометрической прогрессии.

До июля 2024 года лидерами рынка моделей генерации ИИ были Midjourney V6.1, Dalle-E 3 от OpenAI и Stable Diffusion от Stability AI (с открытым исходным кодом).

Однако 1 августа стартап под названием Black Forest Labs выпустил версию FLUX.1, которая шокировала некоторых экспертов отрасли и заставила занервничать некоторые ведущие компании, разрабатывающие ИИ-генераторы изображений.

Новичок в сфере ИИ — Flux.1

FLUX.1 — это набор моделей, обеспечивающих новый уровень детализации, соблюдения промптов, разнообразия стилей и сложности сцен для преобразования текста в изображение.

Стартап создан командой, в которую входят первоначальные разработчики технологии, лежащей в основе Stable Diffusion, и изобретатели скрытой диффузии.

FLUX.1 имеет три модели, которые представлены ниже:

Flux.1 Pro

Это флагманская модель, которая обладает исключительными возможностями по обработке промптов, визуальному качеству, детализации изображений и разнообразию выходных данных.

В ней используются передовые ИИ-технологии, включая диффузионные модели и трансформаторные архитектуры, что позволяет ей генерировать высококачественные изображения, которые соответствуют сложным текстовым промптам.

Эта модель доступна в основном через API и подходит для коммерческого использования, что делает ее идеальной для профессиональных приложений.

FLUX.1 Dev

Это усовершенствованная версия FLUX.1 Pro, разработанная специально для некоммерческого использования.

Она обеспечивает такое же качество и соблюдение промптам, как и FLUX.1 Pro, но при этом более эффективна, чем стандартные модели того же размера.

Эта модель имеет открытый вес, что позволяет пользователям получать доступ и использовать ее в личных и исследовательских целях без коммерческих ограничений.

FLUX.1 Schnell

Это самая быстрая модель из набора моделей FLUX, оптимизированная для локальной разработки и индивидуального использования.

Она находится в открытом доступе под лицензией Apache 2.0, что делает ее доступной для пользователей, которые хотят поэкспериментировать с генерацией ИИ изображений без ограничений, связанных с коммерческим лицензированием.

В этой модели приоритет отдается скорости и эффективности, что делает ее подходящей для быстрого создания прототипов и личных проектов.

Как получить доступ к моделям FLUX.1

Лучший способ получить доступ к модели FLUX.1 — через Hugging Face, известную ИИ-компанию и платформу сообщества, ориентированную на обработку естественного языка (NLP) и машинное обучение.

Эта платформа стала центральным хабом в ИИ-сообществе. Чтобы использовать нужные модели, зайдите в пространство и выполните поиск.

Для FLUX.1 DEV вы можете напрямую перейти в пространство FLUX.1 Dev, а затем ввести промпт для генерации изображения.

После ввода нужного промпта нужно нажать «Run», и изображение будет сгенерировано.

Промпт: Halloween night scene with a carved, aged pumpkin glowing from within. It sits on a dry tree stump in an abandoned rural landscape, with an old, blurry house in the background surrounded by dry overgrowth. The sky is cloudy and gray, creating a cold and eerie atmosphere.

Аналогичным образом можно получить доступ к пространству FLUX.1 Schnell и генерировать изображения. Однако официальных пространств для доступа к FLUX.1 Pro через Hugging Face не существует.

Одна из проблем использования Hugging Face заключается в том, что у него есть ограничения на количество использований. Это происходит потому, что он позволяет всем желающим использовать модели, размещенные на хостинге, что приводит к увеличению времени ожидания.

Black Forest Labs заключила партнерство с несколькими партнерами, такими как fal.ai, replicate, Freepik и многими подобными платформами. Есть бесплатные и платные тарифные планы, и вы можете выбрать их в зависимости от ваших потребностей.

Примеры изображений, сгенерированных с помощью моделей FLUX.1

Изображения, созданные с помощью FLUX.1, мягко говоря, впечатляют, и это еще мягко сказано.

У него большое и активное сообщество разработчиков и пользователей, которые помогают ему становиться все лучше. Его открытый исходный код позволяет пользователям настраивать инструмент и добавлять новые функции.

Сейчас я покажу на нескольких примерах, насколько великолепны получаемые изображения.

Киборги занимают рабочие места людей

FLUX.1 Pro

FLUX.1 Pro
Midjourney v6.1

Midjourney v6.1

Промпт: Cyborgs taking the human jobs in the dystopian future.

Лично мне больше понравился дизайн киборга в Midjourney, но следование промпту более точно у FLUX.1 Pro. Midjourney славится точностью создания изображений, но FLUX.1 Pro работает еще лучше.

Селфи девушки на вечеринке

Leonardo’s Lightning XL

Leonardo’s Lightning XL
Midjourney v6.1

Midjourney v6.1
FLUX.1 Dev

FLUX.1 Dev

Промпт: Selfie, self-portrait of a woman at the party, candid, ultra-wide-angle, distinct facial features, neon lights, red, everyday outfit, 4k

Изображения, созданные всеми моделями, хороши, но давайте посмотрим, как они смотрятся в сравнении друг с другом. Lightning XL — это доработанная модель Leonardo AI, и она проделала довольно приличную работу, за исключением того, что на лице не видны красные неоновые огни.

Варианты использования сгенерированных изображений бесконечны, и в индустрии генераторов изображений наблюдается только тенденция к росту. Станет ли она миллиардной индустрией к 2030 году? Время покажет.


ссылка на оригинал статьи https://habr.com/ru/articles/861014/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *