Stability AI научил Stable Diffusion генерировать текст на изображениях

23.02.2024

14:35

Стартап в области искусственного интеллекта Stability AI Ltd. анонсировал Stable Diffusion третьего поколения.

Announcing Stable Diffusion 3, our most capable text-to-image model, utilizing a diffusion transformer architecture for greatly improved performance in multi-subject prompts, image quality, and spelling abilities.

Today, we are opening the waitlist for early preview. This phase… pic.twitter.com/FRn4ofC57s
— Stability AI (@StabilityAI) February 22, 2024

Новая ИИ-модель будет иметь большое количество улучшений, включая повышенное качество изображения и дополнительные возможности для промтов. В частности, разработчики сосредоточились на ее способности генерировать надписи на изображениях без ошибок.

Сгенерированное изображение по промту: «Эпическое аниме-изображение волшебника на вершине горы ночью, бросающего в темное небо космическое заклинание с надписью “Stable Diffusion 3”, созданное из разноцветной энергии». Источник: Stability.ai.

Stable Diffusion 3 будет доступна в нескольких вариантах с разным количеством настраиваемых параметров: от 800 млн до 8 млрд.

Для тяжелых моделей, способных создавать яркие и сложные сцены, потребуется большая вычислительная мощность. Легкие можно будет запускать на компьютере без помощи облачных сервисов.

«Такой подход направлен на соответствие нашим основным ценностям и демократизацию доступа. Мы предоставляем пользователям различные варианты для наилучшего удовлетворения их творческих потребностей», — заявили представители Stability AI.

Открытый исходный код позволит получить прямой доступ к базовой архитектуре моделей. Желающие протестировать Stable Diffusion 3 могут подать заявку в список ожидания.

Напомним, в августе 2023 года Stability AI запустила бесплатный аналог ChatGPT.

Крипто әлеміндегі жаңалықтар

Stability AI научил Stable Diffusion генерировать текст на изображениях