Stability AI научил Stable Diffusion генерировать текст на изображениях
Стартап в области искусственного интеллекта Stability AI Ltd. анонсировал Stable Diffusion третьего поколения.
Announcing Stable Diffusion 3, our most capable text-to-image model, utilizing a diffusion transformer architecture for greatly improved performance in multi-subject prompts, image quality, and spelling abilities.
— Stability AI (@StabilityAI) February 22, 2024
Today, we are opening the waitlist for early preview. This phase… pic.twitter.com/FRn4ofC57s
Новая ИИ-модель будет иметь большое количество улучшений, включая повышенное качество изображения и дополнительные возможности для промтов. В частности, разработчики сосредоточились на ее способности генерировать надписи на изображениях без ошибок.
Stable Diffusion 3 будет доступна в нескольких вариантах с разным количеством настраиваемых параметров: от 800 млн до 8 млрд.
Для тяжелых моделей, способных создавать яркие и сложные сцены, потребуется большая вычислительная мощность. Легкие можно будет запускать на компьютере без помощи облачных сервисов.
«Такой подход направлен на соответствие нашим основным ценностям и демократизацию доступа. Мы предоставляем пользователям различные варианты для наилучшего удовлетворения их творческих потребностей», — заявили представители Stability AI.
Открытый исходный код позволит получить прямой доступ к базовой архитектуре моделей. Желающие протестировать Stable Diffusion 3 могут подать заявку в список ожидания.
Напомним, в августе 2023 года Stability AI запустила бесплатный аналог ChatGPT.