Генератор изображений: Подборка: 10 самых популярных ИИ-генераторов изображений

18.04.1983 alexxlab

Содержание

Подборка: 10 самых популярных ИИ-генераторов изображений

NightCafe

Это один из самых популярных ИИ-генераторов в мире. Он известен тем, что имеет больше алгоритмов и опций, чем аналоги, при этом чрезвычайно прост для начинающих пользователей. NightCafe основан на системе кредитов, но в нем есть бесплатный уровень с щедрыми условиями. Кроме того, он предлагает разнообразные способы «заработать» эти кредиты, участвуя в жизни сообщества.

Некоторые из самых интересных особенностей NightCafe:

права владения на произведения принадлежат пользователю;
больше алгоритмов, чем у других генераторов;
больший контроль для продвинутых пользователей;
заработок кредитов за участие в сообществе;
социальные функции и живое, отзывчивое сообщество;
возможность собирать свои творения в коллекции;
массовая загрузка изображений;
создание видеороликов;
покупка принтов с созданными изображениями.

DALL-E 2

Позволяет создавать очень реалистичные изображения с помощью ИИ всего за несколько минут.

DALL-E 2 демонстрирует невероятный потенциал. Согласно OpenAI, этот инструмент можно использовать для создания иллюстраций, дизайна продуктов и генерации новых идей для бизнеса.

Простой в использовании интерфейс позволяет любому пользователю создавать высококачественные изображения с помощью ИИ. Это означает, что он будет ценен не только для профессиональных художников, но и для любителей.

Читайте по теме:

Работы DALL-E — искусство или плагиат?

«Сбер» создал нейросеть ruDALL-E, она генерирует картинки по описанию на русском языке

Один из лучших инструментов DALL-E 2 — кисть, которая позволяет добавлять к изображению тени, блики и многие другие детали. Таким образом, можно создавать сложные арты с несколькими слоями, для каждого из которых можно задать уникальные свойства.

Некоторые из самых интересных особенностей DALL-E 2:

сверхреалистичные изображения за считанные минуты;
генерация иллюстраций;
дизайн продуктов;
простой интерфейс;
настройка нескольких слоев изображения.

Deep Dream Generator

Еще один из лучших ИИ-генераторов — Deep Dream Generator от Google. Это популярнейший инструмент на рынке, который позволяет создавать реалистичные изображения с помощью искусственного интеллекта.

Он основан на нейросети, которая обучалась на миллионах изображений. При этом он прост в использовании: требуется только загрузить изображение, прежде чем инструмент создаст новую картинку на его основе.

Одно из основных применений Deep Dream — создание художественных работ, поскольку он использует различные изобразительные стили, характерные для разных мест или исторических периодов.

Он позволяет выбрать категорию, например, животных или пейзажи, прежде чем создавать реалистичное изображение. Вдобавок ко всему этому, Deep Dream позволяет вам выбрать три стиля: Deep Style, Thin Style или Deep Dream. После выбора стиля можно включить предварительный просмотр изображения.

Некоторые из самых интересных особенностей Deep Dream:

создание реалистичных изображений с помощью ИИ;
нейросеть, обученная на миллионах изображений;
различные стили живописи;
категории изображений;
три различных стиля.

Artbreeder

Этот инструмент позволяет создавать различные варианты изображения с помощью машинного обучения.

На одной платформе можно сгенерировать пейзажи, аниме-фигурки, портреты и прочие произведения искусства. Некоторые из инструментов включают возможность изменять черты лица, например цвет кожи, волос и глаз. Также он позволяет превратить фотографии в анимированные изображения.

Еще одна важная особенность Artbreeder — возможность создать тысячи иллюстраций и распределять их по папкам. Результаты можно загрузить в формате JPG или PNG.

Некоторые из самых интересных особенностей Artbreeder:

повышение качества изображения;
создание различных вариантов изображения;
стили пейзажа, аниме, портретов;
распределение иллюстраций по папкам;
форматы JPG и PNG.

Big Sleep

Еще один ИИ генератор создает реалистичные изображения с нуля. С ним может легко управиться любой человек.

Big Sleep основан на Python и использует нейросеть для создания изображений. После предоставления входных данных программе, она выводит изображение. Это происходит благодаря порождающей состязательной сети (generative adversarial network, GAN).

С ее помощью генератора создает изображение, а модель дискриминатора различает реальное и поддельное. Это помогает Big Sleep со временем создавать очень реалистичные изображения.

Некоторые из самых интересных особенностей Big Sleep:

реалистичные изображения с нуля;
простота в использовании;
основан на Python;
использует GAN.

DeepAI

DeepAI создан в 2016 году с целью сделать ИИ демократичнее. Для этого инструмент использует ПО с открытым исходным кодом. Он предлагает различные функции для создания реалистичных изображений.

DeepAI позволяет создавать сколько угодно изображений, каждое из которых будет уникальным. Он легко настраивается, позволяя изменять количество деталей, цвета, текстуры и многое другое. Если указать среди параметров иллюстрацию, DeepAI немедленно сгенерирует векторное изображение, не зависящее от разрешения.

Некоторые из других инструментов, предлагаемых DeepAI, включают StyleGAN и BigGAN, которые также могут создавать реалистичные изображения. Инструмент CartoonGAN позволяет превращать изображения в мультфильмы.

Некоторые из самых интересных особенностей DeepAI:

программа с открытым исходным кодом;
различные инструменты для создания реалистичных изображений;
изменение деталей для каждого изображения;
создание мультфильмов с помощью CartoonGAN.

StarryAI

Одно из главных преимуществ StarryAI в том, что он дает полное право собственности на созданные изображения для личного или коммерческого использования. Он действует как бесплатный генератор NFT. Технология постоянно совершенствуется, но уже есть невероятные примеры искусства, созданные с помощью приложения.

Некоторые из самых интересных особенностей StarryAI:

автоматический генератор изображений;
не требуется участие пользователя;
преобразование текста в изображение;
бесплатная генерация NFT.

Fotor

Fotor — еще один из лучших инструментов искусственного интеллекта для создания NFT-искусства. Он требует минимальных усилий и предлагает продвинутые возможности для создания произведений искусства за считанные минуты. Это также один из самых удобных инструментов для создания NFT-рисунков.

Все, что требуется, это загрузить изображение и выбрать стиль рисунка, который вы хотите применить. Вы также можете быстро и легко создавать слои или добавлять индивидуальные штрихи. Он не требует создавать учетную запись для использования программы или загрузки произведений искусства.

Некоторые из самых интересных особенностей Fotor:

быстрое создание NFT;
простота в использовании;
различные стили и варианты редактирования;
не требуется регистрация.

Runway ML

Позволяет генерировать изображения путем обучения и применения моделей МО. С помощью этого инструмента пользователь создает модели, которые добавляют реалистичные стили изображений. Кроме того, он позволяет рисовать анимацию и 3D-модели.

Также Runway ML включает в себя инструмент видеоредактора, который умеет заменять фон на видео.

Некоторые из инструментов, используемых Runway ML, включают анализ относительного движения, который позволяет ему анализировать то, что вы пытаетесь сделать. Он также имеет готовое распознавание объектов, которое помогает легко идентифицировать объекты на изображениях или видео.

Некоторые из самых интересных особенностей Runway ML:

совместная работа над проектами;
генерация реалистичных изображений;
создание анимации и 3D-моделей;
инструменты для редактирования видео;
анализ движения.

WOMBO Dream

Список завершает WOMBO Dream — приложение для создания NFT, разработанное канадским стартапом WOMBO. Его часто называют лучшим универсальным приложением для создания NFT.

Dream может превращать существующие фотографии в карикатуры или имитации картин, а также использовать сложный алгоритм для превращения слов и фраз в уникальные произведения искусства. Инструмент позволяет выбрать для картины один из множества художественных стилей или создать футуристичный пейзаж.

Некоторые из самых интересных особенностей WOMBO Dream:

сюрреалистичные дизайны;
бесплатный для использования;
создание NFT;
превращение фотографий в мультфильмы;
различные стили.

Источник.

Фото на обложке: Unsplash

Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!

Как написать генератор изображений, который вас понимает / Хабр

Автор статьи рассказывает, как за неделю создал Text2Art. com — генератор изображений на основе VQGAN+CLIP, способный рисовать пиксель-арт и живопись, а также изображать то, что вы напишете в текстовом поле.

Для интерфейса используется Gradio, модель работает на сервере FastAPI, а системой очереди сообщений служит Firebase. Подробностями делимся к старту курса по ML и DL.

Галерея Text2Art

Если вам понравился проект, вы можете проголосовать за него здесь.

Введение

Не так давно генеративные картины и NFT штурмом захватили мир. Это стало возможным после значительного прогресса OpenAI в генерации изображения из текста. Ранее в этом году OpenAI анонсировал DALL-E, мощный генератор изображений из текстов.

Чтобы проиллюстрировать, насколько хорошо работает DALL-E, посмотрите рисунки, сгенерированные DALL-E по запросу «a professional high quality illustration of a giraffe dragon chimera, «a giraffe imitating a dragon», «a giraffe made of dragon».

Изображения по запросу «a professional high quality illustration of a giraffe dragon chimera, «a giraffe imitating a dragon», «a giraffe made of dragon».

К сожалению, DALL-E не был выпущен в массы. Вместо него была опубликована модель, которая творит магию DALL-E, — CLIP. CLIP или Contrastive Image-Language Pretraining — это мультимодальная сеть, объединяющая текст и изображения.

Одним словом, CLIP способен оценить, насколько хорошо изображение соответствует надписи или наоборот.

Это крайне полезно в управлении генератором, чтобы создать изображение, точно соответствующее введённому тексту. В фильме «DALL-E» CLIP используется, чтобы ранжировать сгенерированные изображения и входные изображения с наивысшим баллом (самые похожие на тектовый запрос).

Через несколько месяцев после анонса фильма DALL-E был опубликован новый генератор изображений-трансформеров под названием VQGAN (Vector Quantized GAN). Сочетание VQGAN с CLIP даёт качество, аналогичное DALL-E. С момента обнародования предварительно обученной модели VQGAN сообщество создало множество удивительных картин.

Вот примеры:

Я был поражён результатами и захотел поделиться ими со своими друзьями. Но, поскольку не так много людей готовы погрузиться в код ради генерации картин, я решил сделать Text2Art.com — сайт, где любой может просто ввести подсказку и сгенерировать нужное изображение, не сталкиваясь с кодом воочию.

Как это работает

Итак, как работает VQGAN+CLIP? VQGAN генерирует изображение, а CLIP измеряет, насколько оно соответствует запросу. Затем генератор использует обратную связь от модели CLIP, чтобы сгенерировать более точные изображения. Процедура повторяется, пока оценка CLIP не станет достаточно высокой.

VQGAN генерирует изображения, пока CLIP направляет процесс. Чем больше итераций, тем точнее изображение [источник: иллюстрированный VQGAN от LJ Miranda]

Я не буду рассказывать о внутренней работе VQGAN или CLIP. Но, если вы хотите получить более глубокие объяснения VQGAN, CLIP или DALL-E, обратитесь к этим удивительным ресурсам, которые я нашёл:

Иллюстрированный VQGAN;
Объяснение DALL-E;
Объяснение научной работы о CLIP на видео.

X + CLIP

VQGAN+CLIP — это только пример того, на что способно объединение генератора изображений с CLIP. Однако вы можете заменить VQGAN на любой генератор. Появилось много вариантов X + CLIP, таких как StyleCLIP (StyleGAN + CLIP), CLIPDraw (векторный генератор), BigGAN + CLIP и многие другие, даже AudioCLIP, который работает со звуком, а не изображениями.

Редактирование изображений при помощи StyleCLIP [работа о StyleCLIP]

Код

Я воспользуюсь кодом из репозитория clipit от dribnet, этот код генерирует изображения при помощи VQGAN+CLIP в несколько простых строк (обновление: clipit мигрировал на pixray). Его рекомендуется запускать на Google Colab: VQGAN+CLIP требует много памяти GPU. Вот блокнот Colab.

Прежде всего, если вы работаете на Colab, убедитесь, что вы изменили тип рантайма на GPU, вот так:

Установим кодовую базу и зависимости:

from IPython.utils import io
with io.capture_output() as captured:
  !git clone https://github. com/openai/CLIP
  # !pip install taming-transformers
  !git clone https://github.com/CompVis/taming-transformers.git
  !rm -Rf clipit
  !git clone https://github.com/mfrashad/clipit.git
  !pip install ftfy regex tqdm omegaconf pytorch-lightning
  !pip install kornia
  !pip install imageio-ffmpeg   
  !pip install einops
  !pip install torch-optimizer
  !pip install easydict
  !pip install braceexpand
  !pip install git+https://github.com/pvigier/perlin-numpy
  # ClipDraw deps
  !pip install svgwrite
  !pip install svgpathtools
  !pip install cssutils
  !pip install numba
  !pip install torch-tools
  !pip install visdom
  !pip install gradio
  !git clone https://github.com/BachiLi/diffvg
  %cd diffvg
  # !ls
  !git submodule update --init --recursive
  !python setup.py install
  %cd ..
  
  !mkdir -p steps
  !mkdir -p models

«!» — это специальная команда в Google Colab, которая означает, что команда будет запущена в bash, а не в python.

После установки библиотек мы можем просто импортировать clipit и запустить эти несколько строк кода для генерации картины с помощью VQGAN+CLIP.

Просто замените текстовую подсказку на любую другую. Кроме того, вы можете задать clipit такие параметры, как количество итераций, ширина, высота, модель генератора, хотите ли вы генерировать видео или нет, и многие другие. Чтобы больше узнать об опциях, вы можете посмотреть исходный код.

Вот код генерации:

import sys
sys.path.append("clipit")
import clipit
# To reset settings to default
clipit.reset_settings()
# You can use "|" to separate multiple prompts
prompts = "underwater city"
# You can trade off speed for quality: draft, normal, better, best
quality = "normal"
# Aspect ratio: widescreen, square
aspect = "widescreen"
# Add settings
clipit.add_settings(prompts=prompts, quality=quality, aspect=aspect)
# Apply these settings and run
settings = clipit.apply_settings()
clipit.do_init(settings)
cliptit.do_run(settings)

Когда вы запустите код, он сгенерирует изображение. На каждой итерации сгенерированное изображение будет приближаться к тексту, который вы ввели.

Итерации по заросу “underwater city”

Количество итераций

Вот так можно установить количество итераций, им управляет iterations:

clipit.add_settings(iterations=500)

Генерация видео

В любом случае нужно генерировать изображение для каждой итерации, поэтому можно сохранить эти изображения и создать анимацию самой генерации. Для этого добавьте make_video=True перед применением настроек.

clipit.add_settings(make_video=True)

Получится этот ролик:

Сгенерированный подводный город, запрос “Underwater City”

Управление размером изображений

Размер изображения устанавливается опцией size=(width, height). Сенерируем баннерное изображение с разрешением 800×200. Обратите внимание, что более высокое разрешение требует большего объёма памяти GPU.

clipit.add_settings(size=(800, 200))

Баннер 800×200 по запросу “Fantasy Kingdom #artstation”

Генерация пиксель-арта

Можно генерировать и пиксель-арт. Для этого используется рендерер CLIPDraw за сценой с некоторыми инженерными решениями, такими как ограничение цветов палитры, пикселизация и т.д. Просто включите опцию use_pixeldraw=True.

clipit.add_settings(use_pixeldraw=True)

Изображение по запросу “Knight in armor #pixelart”Изображение по запросу “A world of chinese fantasy video game #pixelart”

VQGAN+CLIP модификатор ключевых слов

Из-за смещения в CLIP добавление определённых ключевых слов к подсказке может придать определённый эффект генерируемому изображению. Например, добавление слова «unreal engine» к текстовой подсказке, как правило, создаёт реалистичное изображение или HD стиль. Добавление определённых названий сайтов, таких как «deviantart», «artstation» или «flickr», обычно делает результаты более эстетичными. Мне больше всего нравится использовать ключевое слово «artstation”, так как я считаю, что помогает создать лучшие картины.

Сравнение ключевых слов

Кроме того, вы можете использовать ключевые слова, чтобы обусловить художественный стиль: «pencil sketch”, «low poly» или даже имя художника — «Thomas Kinkade» или «James Gurney”.

Ключевые слова стиля — сравнение

Чтобы узнать больше о влиянии различных ключевых слов, вы можете ознакомиться с изображением, которое показывает более 200 слов на 4 темы.

UI на Gradio

Gradio — это библиотека Python, которая упрощает построение демонстраций ML до нескольких строк кода. Демоверсия требует меньше 10 минут работы. Кроме того, вы можете запустить Gradio в Colab, и он сгенерирует ссылку для совместного использования на домене Gradio. Ссылкой можно поделиться.

Gradio имеет некоторые ограничения, но я считаю, что это самая подходящая библиотека, когда вы просто хотите продемонстрировать одну функцию.

Ниже код простого пользовательского интерфейса для приложения Text2Art. Думаю, что он достаточно понятен, но, если вам нужно больше объяснений, смотрите документацию Gradio.

import gradio as gr
import torch
import clipit
# Define the main function
def generate(prompt, quality, style, aspect):
    torch.cuda.empty_cache()
    clipit.reset_settings()
    
    use_pixeldraw = (style == 'pixel art')
    use_clipdraw = (style == 'painting')
    clipit. add_settings(prompts=prompt,
                        aspect=aspect,
                        quality=quality,
                        use_pixeldraw=use_pixeldraw,
                        use_clipdraw=use_clipdraw,
                        make_video=True)
  
    settings = clipit.apply_settings()
    clipit.do_init(settings)
    clipit.do_run(settings)
    return 'output.png', 'output.mp4'
# Create the UI
prompt = gr.inputs.Textbox(default="Underwater city", label="Text Prompt")
quality = gr.inputs.Radio(choices=['draft', 'normal', 'better'], label="Quality")
style = gr.inputs.Radio(choices=['image', 'painting','pixel art'], label="Type")
aspect = gr.inputs.Radio(choices=['square', 'widescreen','portrait'], label="Size")
# Launch the demo
iface = gr.Interface(generate, inputs=[prompt, quality, style, aspect], outputs=['image', 'video'], enable_queue=True, live=False)
iface.launch(debug=True)

Как только вы запустите эту программу в Google Colab или локально, она создаст ссылку, которой можно поделиться, демонстрация будет общедоступной. Не нужно использовать туннелирование SSH вроде ngrok. Кроме того, Gradio также предлагает хостинг за 7 долларов в месяц.

Ссылка в демо, которой можно поделиться.

Однако Gradio хорошо подходит только для демонстрации одной функции. Создание кастомного сайта с дополнительными функциями, такими как галерея, вход в систему или даже просто пользовательский CSS, довольно ограничено или вообще невозможно.

Одно быстрое решение — создать демонстрационный сайт отдельно от пользовательского интерфейса Gradio, затем — встроить интерфейс Gradio через iframe.

Я попробовал этот метод, но осознал один важный недостаток: я не могу персонализировать части, которые должны взаимодействовать с самим приложением ML: валидацию ввода, пользовательский прогресс-бар и т. д., невозможны с iframe. И я решил создать API.

FastAPI для модели

Чтобы сделать API быстрее, вместо Flask я воспользовался FastAPI. Кода меньше, а ещё он автоматически генерирует документацию со Swagger UI, что позволяет тестировать API с помощью простого пользовательского интерфейса.

Кроме того, FastAPI поддерживает асинхронные функции и, как утверждается, он быстрее, чем Flask.

Добавляем /docs/ в URL, чтобы увидеть SwaggerТестируем API в UI Swagger

Вот код, который я написал для выполнения функции ML на сервере FastAPI:

import clipit
import torch
from fastapi import FastAPI
from fastapi.middleware.cors import CORSMiddleware
from fastapi import FastAPI, File, UploadFile, Form, BackgroundTasks
from fastapi.responses import FileResponse
app = FastAPI()
app.add_middleware(
    CORSMiddleware,
    allow_origins=['*'],
    allow_credentials=True,
    allow_methods=['*'],
    allow_headers=['*'],
)
@app.get('/')
async def root():
    return {'hello': 'world'}
@app.post("/generate")
async def generate(
        seed: int = Form(None),
        iterations: int = Form(None),
        prompts: str = Form("Underwater City"),
        quality: str = Form("draft"),
        aspect: str = Form("square"),
        scale: float = Form(2.5),
        style: str = Form('image'),
        make_video: bool = Form(False),      
    ):
    torch. cuda.empty_cache()
    clipit.reset_settings()
    use_pixeldraw = (style == 'Pixel Art')
    use_clipdraw = (style == 'Painting')
    clipit.add_settings(prompts=prompts,
                        seed=seed,
                        iterations=iterations,
                        aspect=aspect,
                        quality=quality,
                        scale=scale,
                        use_pixeldraw=use_pixeldraw,
                        use_clipdraw=use_clipdraw,
                        make_video=make_video)
    
    settings = clipit.apply_settings()
    clipit.do_init(settings)
    clipit.do_run(settings)
    return FileResponse('output.png', media_type="image/png")

После определения сервера мы можем запустить его с помощью uvicorn. Кроме того, поскольку Google Colab предоставляет доступ к своему серверу только через интерфейс Colab, мы должны использовать Ngrok, чтобы сделать сервер FastAPI публичным.

Код для запуска и демонстрации сервера:

import nest_asyncio
from pyngrok import ngrok
import uvicorn
ngrok_tunnel = ngrok. connect(8000)
print('Public URL:', ngrok_tunnel.public_url)
print('Doc URL:', ngrok_tunnel.public_url+'/docs')
nest_asyncio.apply()
uvicorn.run(app, port=8000)

Запустив сервер, мы можем перейти к Swagger UI (добавив /docs в сгенерированный ngrok URL) и протестировать API.

Генерация подводного замка при помощи FastAPI Swagger UI

При тестировании API я понял, что вывод может занять от 3 до 20 минут в зависимости от качества/итераций. Три минуты само по себе уже считается очень долгим для HTTP-запроса, и пользователи могут не захотеть ждать так долго.

Я решил, что установка вывода в качестве фоновой задачи и отправка пользователю электронного письма после получения результата лучше подходят для этой задачи.

Теперь, когда мы определились с планом, напишем функцию для отправки письма. Сначала я использовал почтовый API SendGrid, но после исчерпания квоты бесплатного использования (100 писем в день) перешёл на API Mailgun, который входит в пакет GitHub Student Developer Pack, разрешая студентам отправлять 20 000 писем в месяц.

Вот код для отправки электронного письма с вложением изображения с помощью API Mailgun:

import requests
def email_results_mailgun(email, prompt):
    return requests.post("https://api.mailgun.net/v3/text2art.com/messages",
        auth=("api", "YOUR_MAILGUN_API_KEY"),
        files=[("attachment",("output.png", open("output.png", "rb").read() )),
               ("attachment", ("output.mp4", open("output.mp4", "rb").read() ))],
        data={"from": "Text2Art <YOUR_EMAIL>",
              "to": email,
              "subject": "Your Artwork is ready!",
              "text": f'Your generated arts using the prompt "{prompt}".',
              "html": f'Your generated arts using the prompt <strong>"{prompt}"</strong>.'})

Далее мы изменим код нашего сервера, чтобы использовать фоновые задачи в FastAPI и отправить результат по электронной почте в фоновом режиме.

Код сервера

#@title API Functions
import clipit
import torch
from fastapi import FastAPI
from fastapi. middleware.cors import CORSMiddleware
from fastapi import FastAPI, File, UploadFile, Form, BackgroundTasks
from fastapi.responses import FileResponse
app = FastAPI()
app.add_middleware(
    CORSMiddleware,
    allow_origins=['*'],
    allow_credentials=True,
    allow_methods=['*'],
    allow_headers=['*'],
)
# define function to be run as background tasks
def generate(email, settings):
    clipit.do_init(settings)
    clipit.do_run(settings)
    prompt = " | ".join(settings.prompts)
    email_results_mailgun(email, prompt)
@app.get('/')
async def root():
    return {'hello': 'world'}
@app.post("/generate")
async def add_task(
        email: str,
        background_tasks: BackgroundTasks,
        seed: int = Form(None),
        iterations: int = Form(None),
        prompts: str = Form("Underwater City"),
        quality: str = Form("draft"),
        aspect: str = Form("square"),
        scale: float = Form(2.5),
        style: str = Form('image'),
        make_video: bool = Form(False),      
    ):
    torch. cuda.empty_cache()
    clipit.reset_settings()
    use_pixeldraw = (style == 'Pixel Art')
    use_clipdraw = (style == 'Painting')
    clipit.add_settings(prompts=prompts,
                        seed=seed,
                        iterations=iterations,
                        aspect=aspect,
                        quality=quality,
                        scale=scale,
                        use_pixeldraw=use_pixeldraw,
                        use_clipdraw=use_clipdraw,
                        make_video=make_video)
    
    settings = clipit.apply_settings()
    # Run function as background task
    background_tasks.add_task(generate, email, settings)
    return {"message": "Task is processed in the background"}

С помощью приведённого выше кода сервер быстро ответит на запрос сообщением «Task is processed in the background» вместо того, чтобы ждать завершения генерации и ответа с изображением. Когда генерация завершится, сервер по электронной почте отправит пользователю результат.

Изображение и видеозапись отправляются пользователю по электронной почте

Теперь, когда всё вроде бы заработало, я создал фронтенд и поделился сайтом со своими друзьями. Однако при тестировании с несколькими пользователями я обнаружил, что есть проблема параллелизма.

Когда второй пользователь делает запрос на сервер, в то время как первая задача всё ещё обрабатывается, вторая задача каким-то образом завершает текущий процесс, вместо того чтобы создать параллельный процесс или очередь.

Не было уверенности, что вызвало проблему, возможно, это было использование глобальных переменных в коде clipit, а возможно, нет. Я быстро понял, что мне нужно реализовать систему очереди сообщений.

По результатам поисков в Google большинство рекомендует RabbitMQ или Redis. Однако я не был уверен, можно ли установить RabbitMQ или Redis на Google Colab: для этого, похоже, требуется разрешение sudo.

В конце концов, я решил использовать Google Firebase, потому что хотел закончить проект как можно скорее, а с Firebase я знаком лучше всего.

В основном, когда пользователь пытается сгенерировать рисунок во фронтенде, он добавляет запись в queue, которая описывает задачу (введённый текст, тип изображения, размер и т. д.).

С другой стороны, мы запустим сценарий на Google Colab, который будет постоянно прослушивать новую запись в очереди и обрабатывать задания одно за другим.

Код бэкенда, который обрабатывает задание и постоянно прослушивает очередь

import torch
import clipit
import time
from datetime import datetime
import firebase_admin
from firebase_admin import credentials, firestore, storage
if not firebase_admin._apps:
    cred = credentials.Certificate("YOUR_CREDENTIAL_FILE")
    firebase_admin.initialize_app(cred, {
        'storageBucket': 'YOUR_BUCKET_URL'
    })
db = firestore.client()
bucket = storage.bucket()
def generate(doc_id, prompt, quality, style, aspect, email):
    torch.cuda.empty_cache()
    clipit.reset_settings()
    use_pixeldraw = (style == 'pixel art')
    use_clipdraw = (style == 'painting')
    clipit. add_settings(prompts=prompt,
                        seed=seed,
                        aspect=aspect,
                        quality=quality,
                        use_pixeldraw=use_pixeldraw,
                        use_clipdraw=use_clipdraw,
                        make_video=True)
    
    settings = clipit.apply_settings()
    clipit.do_init(settings)
    clipit.do_run(settings)
    data = {
        "seed": seed,
        "prompt": prompt,
        "quality": quality,
        "aspect": aspect,
        "type": style,
        "user": email,
        "created_at": datetime.now()
    }
    db.collection('generated_images').document(doc_id).set(data)
    email_results_mailgun(email, prompt)
transaction = db.transaction()
@firestore.transactional
def claim_task(transaction, queue_objects_ref):
    # query firestore
    queue_objects = queue_objects_ref.stream(transaction=transaction)
    # pull the document from the iterable
    next_item = None
    for doc in queue_objects:
        next_item = doc
    # if queue is empty return status code of 2
    if not next_item:
        return {"status": 2}
    # get information from the document 
    next_item_data = next_item. to_dict()
    next_item_data["status"] = 0
    next_item_data['id'] = next_item.id
    # delete the document and return the information
    transaction.delete(next_item.reference)
    return next_item_data
# initialize query
queue_objects_ref = (
    db.collection("queue")
    .order_by("created_at", direction="ASCENDING")
    .limit(1)
)
transaction_attempts = 0
while True:
    try:
        # apply transaction
        next_item_data = claim_task(transaction, queue_objects_ref)
        if next_item_data['status'] == 0:
            generate(next_item_data['id'],
                     next_item_data['prompt'],
                     next_item_data['quality'],
                     next_item_data['type'],
                     next_item_data['aspect'],
                     next_item_data['email'])
            print(f"Generated {next_item_data['prompt']} for {next_item_data['email']}")
    except Exception as e:
        print(f"Could not apply transaction. Error: {e}")
        time.sleep(5)
        transaction_attempts += 1
        if transaction_attempts > 20:
            db. collection("errors").add({
                "exception": f"Could not apply transaction. Error: {e}",
                "time": str(datetime.now())
            })
            exit()

На фронте нужно только добавить новую задачу в очередь. Убедитесь, что правильно настроили Firebase на фронтенде:

db.collection("queue").add({
        prompt: prompt,
        email: email,
        quality: quality,
        type: type,
        aspect: aspect,
        created_at: firebase.firestore.FieldValue.serverTimestamp(),
})

Мы сделали это! Теперь, когда пользователь попытается создать рисунок на фронтенде, он добавит новую задачу в очередь. Затем рабочий скрипт на сервере Colab обработает задания в очереди, одно за другим. Вы можете заглянуть в репозиторий GitHub, чтобы увидеть весь код.

Лучше понять нейросети и научиться решать проблемы бизнеса с их помощью вы сможете на наших курсах:

Курс «Machine Learning и Deep Learning» (6 месяцев)
Профессия Data Scientist (24 месяца)

Также вы можете перейти на страницы из каталога, чтобы увидеть, как мы готовим специалистов в других направлениях.

Ссылки статьи

[1] DALL-E

[2] CLIP

[3] CLIP-VQGAN

[4] StyleCLIP

[5] Flask против FastAPI

Профессии и курсы

Data Science и Machine Learning

Профессия Data Scientist
Профессия Data Analyst
Курс «Математика для Data Science»
Курс «Математика и Machine Learning для Data Science»
Курс по Data Engineering
Курс «Machine Learning и Deep Learning»
Курс по Machine Learning

Python, веб-разработка

Профессия Fullstack-разработчик на Python
Курс «Python для веб-разработки»
Профессия Frontend-разработчик
Профессия Веб-разработчик

Мобильная разработка

Профессия iOS-разработчик
Профессия Android-разработчик

Java и C#

Профессия Java-разработчик
Профессия QA-инженер на JAVA
Профессия C#-разработчик
Профессия Разработчик игр на Unity

От основ — в глубину

Курс «Алгоритмы и структуры данных»
Профессия C++ разработчик
Профессия Этичный хакер

А также:

Курс по DevOps

Нейросеть-генератор изображений Stable Diffusion появилась в свободном доступе — Жизнь на DTF

{«id»:3906,»url»:»\/distributions\/3906\/click?bit=1&hash=959e59594f055d960bf41d090888cb325691d80979698668459f3e2abe9679a1″,»title»:»\u0427\u0442\u043e \u043c\u0435\u0448\u0430\u0435\u0442 \u0432\u0430\u043c \u043d\u0430\u0439\u0442\u0438 \u0445\u043e\u0440\u043e\u0448\u0435\u0433\u043e \u0440\u0430\u0431\u043e\u0442\u043d\u0438\u043a\u0430?»,»buttonText»:»\u0420\u0430\u0441\u0441\u043a\u0430\u0436\u0438\u0442\u0435″,»imageUuid»:»693626ef-cadc-5f47-8154-4026a1e81dc5″,»isPaidAndBannersEnabled»:false}

Скриншот neural. love «Curated AI art generator»

14 365 просмотров

Новость немножко с опозданием, но лучше поздно, чем никогда. Опробовать нейросеть можно бесплатно и почти без ограничений как в браузере, так и на своём железе.

22 августа разработчики из stability.ai объявили о завершении бета-тестирования своего проекта для генерации изображений по текстовому описанию Stable Diffusion — теперь любой желающий может скачать рабочую модель и запустить её на собственных серверах, рассказали авторы проекта в своём блоге. Открытая лицензия позволяет использовать модель в коммерческих и некоммерческих целях, но предполагает «этичный подход» к созданию картинок.

За неделю до официального релиза создатели сообщали о требованиях для стабильной работы модели — не менее десяти гигабайт видеопамяти. Теперь систему оптимизировали — на релизе минимальный показатель составляет 6,9 гигабайт. Сейчас рекомендуется использовать видеокарты от Nvidia, но в ближайшее время модель планируют оптимизировать под чипсеты AMD, Apple M1 и M2 и другие популярные альтернативы.

Stable Diffusion запустилась в формате закрытого бета-теста для некоторых разработчиков 10 августа. Благодаря реалистичным результатам и тонкой настройке текстовых запросов нейросеть сразу назвали новым конкурентом главных инструментов на рынке — DALL-E 2 и Midjourney.

Опытные пользователи могут скачать нейросеть отсюда:

Где ещё используется Stable Diffusion:

В Midjourney (работает как бот в Дискорде) недавно добавлена Stable Diffusion.
Hugging Face — без ограничений и регистрации.
DreamStudio — без ограничений, но нужно зарегистрироваться или войти под аккаунтом Google.
neural.love — использует некоторые наработки Stable Diffusion. Тоже без ограничений, но требует регистрации. Работает медленнее остальных сервисов.

Кстати, больше всех мне понравился именно «Curated AI art generator» от neural.love:

Он позволяет генерировать крипоту и кровяку, а иногда ещё и обнажёнку пропускает.
Можно выбрать в каких стилях генерировать, например, киберпанк, тату или аниме.
Как и в Midjourney, можно посмотреть огромную коллекцию всего что успели нагенерировать остальные пользователи.

Я отобрал самые необычные и качественные изображения

ape joker

batman

buddha

jesus

female astronaut

female geralt from rivia

scarlett johansson ciri reference

the last of us

alien

zombie terminator giger

portrait safe area

samurai

pizza

anime

russian matryoshka

Угадайте сами

Содержание скрыто

Показать

2b from nier automata in medieval fantasy trending on artstation

a blue bird is sitting in a pink cup which stands on peak

angry rick sanchez portrait highly detailed 4k vibrant color

anime catgirl in chernobyl

armenian werewolf

ashley heart

bloodborne monster in the city very scary art 8k

captain america

cool boy posthuman in cyber glasses

cute angel of death photorealistic trending on artstation

cute girl with cat ears and pink hair

dante from dmc

dovahkiin

egyptian batman

elon musk communist

enjoy the silence

fierce and determined blond woman with narrow boney face

fluttershy mlp

furie bear in cloths

gay cowboy with joystick

ghost rider bio motorcycle

girl with small waist golden transparent openwork beach wear

goblin character

god of darkness digital art concept

hedgehog playing chess

keanu reeves as superman

keanu reeves in kazakhstan

lain iwakura is god

lalune from nowhere meow

lara croft

leonardo dicaprio plays shrek

love volkswagen

marilyn manson anime style

michael jackson in anime style on japan streets

minecraft in real life

minion breaking bad

occupational safety from hamsters

old book

ryan gosling

rayan gosling in neon genesis evangelion

realistic girl in blooming apple garden tree

robot penguin

sad guy in the rain with money in his hands

small cute brown dog with big years in indiana jones hat

solomon kane muscular white man with large black hat

spider man in australia

spider man witcher

stalin in cute anime costume

steve jobs airpods fail

summer

ultra realistic huge swamp standing near dark village unreal

very happy pepe the frog

woman at puffy down coat

emma watson as a drow female portrait black skin symmetry

sad tin can robot

terminator in the style of games workshop and kentaro miura

warrior with rifle in a white suit with red and grey stripes

Крипота

Содержание скрыто

Показать

и немножко лёгкой эротики

Содержание скрыто

Показать

Лучшие 35+ генераторы изображений на начало 2019 года (Dynamic Image Generator)

Профессиональные генераторы изображений

Lorem Picsum

Lorempixel

ImgPlaceholder

Placeholder. com

ImgPlaceholder

Placeholder.com

PlaceIMG

Ipsum Image

LoremFlickr

DummySrc

Креативные генераторы изображений

Животные

Placekitten

PlaceIMG

Ipsum Image

LoremFlickr

DummySrc

Placebear

Знаменитости

Fill Murray

Steven SeGALLERY

Разное

Baconmockup.com

Placebeard

Генераторы изображений на стороне клиента

Итак, вы создаете новый сайт, но Вы на данном этапе еще не владете всем обилием великолепныx изображений от своего дизайнера или заказчика. Чтобы продолжить работу, вам могут потребоваться некоторые изображения, которые могут придать более оконченный вид сайта. Вот некоторые сайты, которые могут помочь вам в этом, некоторые профессиональные, а некоторые, скажем, более креативные альтернативы.

Профессиональные генераторы изображений

Lorem Picsum

Особенности:

Укажите ширину и высоту
Изображения в градациях серого
Случайные изображения
Получить конкретное изображение
Изображения в формате JSON

Образец

Пример использования

https://picsum.photos/200/300

Образец изображения

Lorempixel

Особенности:

Укажите ширину и высоту
Изображения в градациях серого
Случайные изображения
Изображение по категории
Получить конкретное изображение
Текст на изображении

Образец

Пример использования

https://lorempixel.com/420/320/abstract/1/Sample

Образец изображения

ImgPlaceholder

Особенности:

Укажите ширину и высоту
Пользовательский цвет фона (и прозрачный фон)
Пользовательский шрифт + цвет + размер
Пользовательский текст
Изображение из шрифта (шрифт потрясающий, Ionicons, Glyphicons)

Образец

Пример использования

https://imgplaceholder. com/420x320/ff7f7f/333333/fa-image

Образец изображения

https://imgplaceholder.com/420×320

Placeholder.com

Особенности:

Укажите ширину и высоту
Пользовательский цвет фона
Пользовательский цвет шрифта
Пользовательский текст

Образец

Пример использования

images/image_1929.jpg

Образец изображения

ImgPlaceholder

Особенности:

Укажите ширину и высоту
Пользовательский цвет фона (и прозрачный фон)
Пользовательский шрифт + цвет + размер
Пользовательский текст
Изображение из шрифта (шрифт потрясающий, Ionicons, Glyphicons)

Образец

Пример использования

https://imgplaceholder.com/420x320/ff7f7f/333333/fa-image

Образец изображения

Placeholder.

com

Особенности:

Укажите ширину и высоту
Пользовательский цвет фона
Пользовательский цвет шрифта
Пользовательский текст

Образец

Пример использования

https://dummyimage.com/420x320/ff7f7f/333333.png&text=Sample

Образец изображения

PlaceIMG

Особенности:

Укажите ширину и высоту
Изображения на основе категорий
Эффект размытия, оттенков серого и сепии

Образец

Пример использования

https://placeimg.com/420/320/tech/grayscale

Образец изображения

Ipsum Image

Особенности:

Укажите ширину и высоту
Пользовательский цвет фона
Пользовательский цвет шрифта
Пользовательский текст
Множественный формат изображения

Образец

Пример использования

https://ipsumimage. appspot.com/420x320,ff7700

Образец изображения

LoremFlickr

Особенности:

Укажите ширину и высоту
Изображения на основе категорий
Изображения на основе цвета

Образец

Пример использования

https://loremflickr.com/420/320?lock=1

Образец изображения

DummySrc

Особенности:

Укажите ширину и высоту
Пользовательский цвет фона
Пользовательский цвет шрифта
Пользовательский текст
Множественный формат изображения

Образец

Пример использования

http://www.dummysrc.com/430x320.png/22c5fc/17202A

Креативные генераторы изображений

Отличная альтернатива этим жестким и скучным обычным заполнителям – использование, скажем, более творческого заполнителя. Внизу предоставлены несколько замечательных заполнителей, фокусирующихся на более веселых фото сюжетах.

Животные

Placekitten

Образец кода

images/image_1948.jpg

Образец изображения

PlaceIMG

Особенности:

Укажите ширину и высоту
Изображения на основе категорий
Эффект размытия, оттенков серого и сепии

Образец

Пример использования

https://placeimg.com/420/320/tech/grayscale

Образец изображения

Ipsum Image

Особенности:

Укажите ширину и высоту
Пользовательский цвет фона
Пользовательский цвет шрифта
Пользовательский текст
Множественный формат изображения

Образец

Пример использования

https://ipsumimage.appspot.com/420x320,ff7700

Образец изображения

LoremFlickr

Особенности:

Укажите ширину и высоту
Изображения на основе категорий
Изображения на основе цвета

Образец

Пример использования

https://loremflickr. com/420/320?lock=1

Образец изображения

DummySrc

Особенности:

Укажите ширину и высоту
Пользовательский цвет фона
Пользовательский цвет шрифта
Пользовательский текст
Множественный формат изображения

Образец

Пример использования

images/image_1948.jpg

Образец изображения

Placebear

Образец кода

images/image_1952.jpg

Образец изображения

Знаменитости

Fill Murray

Образец кода

https://www.fillmurray.com/420/320

Образец изображения

Steven SeGALLERY

Образец кода

https://www.stevensegallery.com/420/320

Образец изображения

Разное

Baconmockup.

com

Образец кода

https://baconmockup.com/420/320

Образец изображения

Placebeard

Образец кода

https://placebeard.it/420/320

Образец изображения

Генераторы изображений на стороне клиента

Иногда вы можете не захотеть импортировать изображение из страшного интернета, или вы хотели бы иметь возможность работать в автономном режиме. В этом случае вы можете использовать заполнитель в виде javascript фреймверка.

Одним из таких альтернатив является Holder.js

Источник записи:

Универсальные генераторы изображений — Mycronic

открывает непревзойдённую гибкость

Наши генераторы изображений серии FPS предназначены для стабильного, высокоскоростного и экономичного изготовления передовых многоцелевых фотошаблонов. В зависимости от требований, возможна гибкая настройка в широком диапазоне применения, например, для высокотехнологичного корпусирования электронных схем, светодиодных сенсорных экранов, МЭМС, светофильтров, прецизионных металлических масок, 3D-форм и др.

Серия FPS разработана на основе новой передовой платформы управления Evo, в соответствии с набирающими силу тенденциями автоматизации, связи и больших данных в области изготовления фотошаблонов с целью повышения производительности. Платформа Evo создана на базе полностью современной архитектуры программного обеспечения и электрооборудования, и отвечает современным и перспективным отраслевым требованиям. Узнайте больше о платформе управления Evo.

Все наши генераторы изображений доказали свою надёжность в условиях эксплуатации и подходят для различных областей применения масок, обеспечивая превосходную эксплуатационную стабильность, высокие скорости и большие объёмы записи, а также равномерность критического допуска на размер элементов, которые необходимы, чтобы соответствовать строгим отраслевым требованиям.

FPS 8100 Evo — новинка в нашей серии, специально разработана в соответствии с набирающей силу тенденцией перехода от ЖК- к AMOLED-дисплеям, что требует использования металлизированных фотошаблонов для процесса осаждения органических материалов. Новая платформа и технологии позволяют увеличить скорость и площадь записи на 78% и 87%, соответственно, по сравнению с нашей широко известной серией FPS 6100 Evo.

Преимущество решений FPS состоит в возможности продолжать выпуск текущего ассортимента продукции и одновременно искать перспективные решения, для которых могут требоваться более крупные панели, более скоростная запись, более строгий критический допуск на размер элементов и даже изготовление прецизионных металлических масок.

Основные преимущества

До шести разных уровней записи и различные варианты загрузки
Возможность комплектации двумя разными источниками лазерного излучения позволяет производить экспонирование через хромированные или эмульсионные фотошаблоны
Площадь экспонирования для фотошаблонов размером до G8
Режим XT (eXtreme Throughput) увеличивает скорость записи на 76%
С момента первой установки системы время беспрерывной работы поддерживается на уровне более 95%

FPS 8100 Evo

FPS 8100 Evo — наше высокотехнологичное решение для производителей фотошаблонов, которым требуются не только все широкие возможности серии FPS, но и решение новых задач, связанных с микропроизводством светодиодов, высокотехнологичным корпусированием электронных схем или использованием прецизионных металлических масок. Серия разработана в тесном сотрудничестве с требовательными клиентами на основе новой платформы и ряда улучшающих эксплуатационные характеристики новых технологий, которые повышают стабильность (производительность), увеличивают скорость и площадь записи в различных областях применения, по сравнению с предыдущими моделями.

В системе предусмотрено два оптических уровня, площадь записи увеличена на 87% (до 1400 х 1620 мм, прецизионные металлические маски подходят для размера дисплеев до 8 поколения), по сравнению с более ранней серией FPS 6100 Evo. Прежде всего, система отвечает тенденции технологического перехода с ЖК- на AMOLED-дисплеи, что повышает качество изображения и позволяет выпускать более энергосберегающие тонкие дисплеи. Эта же технология подходит для выпуска гибких дисплеев.

В то же время новые более высокие требования AMOLED также подразумевают использование более совершенных фотошаблонов, поскольку каждый пиксель контролируется 5-6 транзисторами, по сравнению с 1-2 транзисторами в ЖК-дисплеях. Требуется более точное осаждение органических материалов меньшего размера в каждый пиксель — новая задача, с которой непревзойдённо справляется FPS 8100 Evo. Помимо этой достаточно специфической задачи система также позволяет решать и многие другие задачи записи.

Серия FPS 6100 / FPS 6100E Evo

Некоторые ведущие мировые производители фотошаблонов с помощью доказавшей свою эксплуатационную надежность системы FPS 6100 Evo/FPS 6100E Evo получают превосходное качество изображения и повышают производительность, решая высокотехнологичные многоцелевые задачи. Установки этой серии с возможностью комплектации двумя разными источниками лазерного излучения позволяют производить экспонирование через хромированные или эмульсионные фотошаблоны.

Модель FPS 6100 Evo отличается повышенной скоростью записи и качеством изображения, по сравнению с предыдущей FPS5500. Благодаря новой разработке режима XT запись может выполняться на 76% быстрее, чем на предыдущих моделях. Вместе с тем, на 40% улучшена равномерность критического допуска на размер элементов, что соответствует современным высоким требованиям.

FPS 6100E Evo комплектуется зелёным лазером, позволяющим производить экспонирование через эмульсионные фотошаблоны. Система создана на базе той же платформы управления Evo, то есть обладает всеми преимуществами серии FPS.

Технические характеристики

Дополнительные возможности

Лучший партнёр для вас

Мы работаем в электронной промышленности уже более 40 лет, у нас уникальное лидерство на рынке, поэтому вы можете рассчитывать на нас. Мы понимаем стремительные изменения рынка. У нас надёжные позиции на местах в более чем 50 странах мира, где мы помогаем нашим заказчикам. Мы поставляем инновационные технологии для завтрашнего дня, и мы преданы нашей миссии и нашим клиентам.

Генератор изображений Python QR Code

Вопрос задан 8 месяцев назад

Изменён 8 месяцев назад

Просмотрен 90 раз

Как написать Генератор изображений Python QR Code?

Я пишу:

import  qrcode
img = qrcode. make("https://ru.stackoverflow.com/questions/")
type(img)
img.save("some_file.png")

но никак не выходит как надо: файл не сохраняется как .png.

python
python-3.x
pillow
qrcode

Генерируйте QR-коды.

Для стандартной установки, которая будет включать pillow для создания изображений — запустите:

pip install qrcode[pil]

Ваш пример рабочий:

import  qrcode
img = qrcode.make("https://ru.stackoverflow.com/questions/")
print(f'{type(img)}')              #  <class 'qrcode.image.pil.PilImage'>
img.save("some_file.png")

А если вы хотите как-то визуализировать генератор изображений Python QR Code, вам в помощь PyQt — реализация фреймворка Qt для языка Python.

Прежде чем запустить мой пример, убедитесь, что вы установили PyQt5.

Установит его просто:

pip install PyQt5 
pip install pyqt5-tools

Теперь пробуйте:

main.py

import sys
import qrcode
from PIL.ImageQt import ImageQt
from PyQt5.Qt import *
class QRCodeApp(QWidget):
    def __init__(self):
        super().__init__()
        
        mainLayout = QVBoxLayout(self)
        
        label = QLabel("Enter text:")
        self.textEntry = QLineEdit()  
        entryLayout = QHBoxLayout()        
        entryLayout.addWidget(label)
        entryLayout.addWidget(self.textEntry)
        mainLayout.addLayout(entryLayout)
        
        self.buttonGenerate = QPushButton('Generate QR Code')
        self.buttonGenerate.clicked.connect(self.create_qr_code)
        
        self.buttonSaveImage = QPushButton('Save QR Image')
        self.buttonSaveImage.clicked.connect(self.save_qr_code)
        
        self.buttonClear = QPushButton('Clear')
        self.buttonClear.clicked.connect(self.clear_fields)
        buttonLayout = QHBoxLayout()        
        buttonLayout. addWidget(self.buttonGenerate)
        buttonLayout.addWidget(self.buttonSaveImage)
        buttonLayout.addWidget(self.buttonClear)
        mainLayout.addLayout(buttonLayout)
        
        self.imageLabel = QLabel()
        self.imageLabel.setAlignment(Qt.AlignCenter)
        imageLayout = QVBoxLayout()
        imageLayout.addStretch()        
        imageLayout.addWidget(self.imageLabel)
        mainLayout.addLayout(imageLayout)
        
        self.statusBar = QStatusBar()
        mainLayout.addWidget(self.statusBar)
        
    def clear_fields(self):
        self.textEntry.clear()
        self.imageLabel.clear()
        self.statusBar.showMessage('')   
        
    def create_qr_code(self):
        text = self.textEntry.text()
        img = qrcode.make(text)
        qr = ImageQt(img)
        pix = QPixmap.fromImage(qr)
        self.imageLabel.setPixmap(pix)
        
    def save_qr_code(self):
        file_name = self.textEntry.text()
        if file_name:
            file_name = file_name. replace(":", "_")
            file_name = file_name.replace("/", "")
            path = f'{file_name}.png'            
            
            self.imageLabel.pixmap().save(f'{path}')
            
            self.statusBar.showMessage('Image is saved at {0}'.format(path))
        
if __name__ == '__main__':
    app = QApplication(sys.argv)
    app.setFont(QFont("Open Sans", 16))
    app.setStyleSheet('QPushButton {height: 50px; font-size: 28px;}')
    mywin = QRCodeApp()
    mywin.resize(650, 600)
    mywin.show()
    sys.exit(app.exec_())

Ваш ответ

Зарегистрируйтесь или войдите

Регистрация через Google

Регистрация через Facebook

Регистрация через почту

Отправить без регистрации

Почта

Необходима, но никому не показывается

Отправить без регистрации

Почта

Необходима, но никому не показывается

Нажимая на кнопку «Отправить ответ», вы соглашаетесь с нашими пользовательским соглашением, политикой конфиденциальности и политикой о куки

AI Art Generator: попробуйте бесплатно

Спросите у ИИ идеи

Стиль

Hotpot Art 6Hotpot Art 5Hotpot Art 1Hotpot Art 2Hotpot Art 3ФотореалистичныйФэнтезиЖивописьАкварельПортретКомиксDoom3DПиксель-артИконкаЭскизСкульптураГраффитиАнимеЯпонское искусствоАкриловое искусствоПользовательский

См. примеры

Размер

256x256512x512 · 25 кредитов640×640 · 75 кредитов

Сделать результаты разными

НетДа

Сделать личным

НетДа · 70 кредитов

Модель

Hotpot 5Dall-E Mini · 50 кредитов.

Ознакомьтесь с последними творениями

Доступ к API/массовое создание

Добавьте этот сервис где угодно с помощью Hotpot API или собственных контейнеров.

Доступ к API требует оплаты. Свяжитесь с нами, чтобы узнать цены.

Также доступно массовое создание без кода. Свяжитесь с нами для получения подробной информации.

Советы по созданию и пользовательские стили

Советы по созданию и пользовательские стили см. в нашем руководстве по генератору искусств и изображений AI.

Ценообразование и лицензирование

Покупайте кредиты для коммерческого использования и сокращайте время ожидания. Изображения, созданные с использованием кредитов, считаются лицензированными; нет необходимости покупать лицензию отдельно.

Для бесплатной графики, пожалуйста, укажите Hotpot.ai.

Этот продукт построен на программном обеспечении с использованием лицензии RAIL-M. Одним словом, будьте ответственны: не нарушайте закон и не причиняйте вред другим.

В юридических целях мы храним криптографические хэши сгенерированной графики, но не саму графику. Это позволяет нам идентифицировать творения Hotpot.

Время ожидания

Создание занимает от 20 секунд до 2 минут в зависимости от настроек. При большом трафике на бесплатные запросы может уйти 2-3 часа. Оплаченные запросы должны возвращаться через секунды или минуты.
Для более быстрого ожидания, пожалуйста, купите кредиты. Платные пользователи могут пропустить очередь. (Платные пользователи субсидируют бесплатное использование.)
Ожидание отстой. Извиняюсь. Мы прилагаем все усилия, чтобы исправить это. Сотрудник Google/Azure? Свяжитесь с нами. Мы хотим расстаться с AWS.

Часто задаваемые вопросы Art Maker

Какие бывают модели?
Разные модели представляют разные ИИ для создания изображений и произведений искусства.
Что делают «Сделать личным» и «Сделать результаты разными»?
Бесплатные творения доступны для просмотра публике в нашей художественной галерее AI. Публичные творения анонимны.
Включите «Сделать личным», чтобы творения не попадали в общедоступную галерею. Это субсидирует бесплатных пользователей. Платные творения по умолчанию являются частными.
По умолчанию наш ИИ пытается дать согласованные результаты, если вы повторно используете описания. «Сделать результаты разными» говорит нашему ИИ действовать непредсказуемо. Если вы повторно используете одно и то же описание, наш ИИ попытается создать разные изображения.
Могу ли я создать несколько образов одновременно?
Да, но только для платных творений. Платные творения могут работать параллельно.
Бесплатные творения ограничены одним за раз. В противном случае система забанит вас, а другие пользователи будут недолюбливать вас за то, что вы засоряете серверы Hotpot.
Эта система позволяет нам поддерживать свободное творение.
Для бесплатных творений подождите, пока изображение вернется, или свяжитесь с нами, если время ожидания превышено.
Могу ли я продавать графику или использовать ее для NFT?
Да, но сначала купите кредиты: одна лицензия на графику.
Во-вторых, относитесь к Hotpot как к цифровому помощнику, который дополняет ваш рабочий процесс, к тому, кто помогает проводить мозговые штурмы и автоматизирует утомительную работу, но не к тому, кто исключает творческий процесс. Мы не можем гарантировать уникальность больше, чем Photoshop. Кто-то может создать что-то, сравнимое с другим ИИ или программным обеспечением, так же, как можно воспроизвести любой логотип или графику.
В конечном счете, вы несете ответственность за создание уникальной графики и соблюдение законов об интеллектуальной собственности. Чтобы сделать это проще, используйте наш AI Art Remixer для уникального стиля творений.
Могу ли я закрыть страницу?
Да. Сначала сохраните URL-адрес изображения. Если вы создаете учетную запись, творения сохраняются в вашей учетной записи.
Платные пользователи получают больше места для хранения. Пожалуйста, купите кредиты, чтобы сохранить все творения.
Можете ли вы гарантировать уникальные творения?
Ни один сервис не может гарантировать это, но наш AI Art Remixer позволяет вам создавать уникальные стили для каждого творения. Использование пользовательских исходных изображений также повышает уникальность.
Даже если мы предотвратим повторное использование вашей идентичной подсказки другими пользователями, другие могут использовать аналогичные подсказки и получить аналогичные результаты. Если другое изображение выглядит на 90% так же, действительно ли ваше изображение уникально? Самый безопасный подход — относиться к Hotpot как к цифровому помощнику, который дополняет ваш рабочий процесс, к тому, кто помогает проводить мозговые штурмы и автоматизировать утомительную работу, но не к тому, кто устраняет творческий процесс.
Какие условия и ограничения?
Пользователи должны соблюдать наши условия и обеспечивать ответственное использование ИИ. Невыполнение этого требования может привести к прекращению действия учетной записи без права на возврат средств.
Общие технологии содержат потенциал для развития и злоупотреблений. В конечном счете, история предельно ясна: от печатного станка до компьютеров ограничение общей технологии только ограничивает потенциал человечества. Человеческие проблемы должны решаться на человеческом уровне, а не на технологическом уровне. Мы надеемся, что вы вносите свой вклад в решение проблемы и используете технологии для развития общества.
Это искусство?
Искусство не определяется средствами производства. Вот почему картины, сделанные вручную первоклассниками, не считаются искусством, в то время как профессиональные иллюстраторы, созданные с помощью программного обеспечения Adobe, часто таковыми являются. По мнению нашего основателя, искусство — это мнение, которое волнует душу, а возвышенное искусство — это мнение, которое волнует ум.
Важно мнение, а не средства.
Представьте, что вы наняли студента-художника и обозначили каждый штрих, каждый цвет, каждую деталь картины. Сделайте этот угол более острым. Сделайте эту линию толще. Добавьте туда немного фиолетового. Ученик роботизированно выполняет команды. Кто художник: ты или студент?
Сегодня ИИ не может предложить такую степень точности, но он может пробудить творческий потенциал и породить убедительные идеи для дальнейшего совершенствования, так же как младший сотрудник может генерировать предложения для опытного руководителя.
Короче говоря, возможно, необработанные результаты ИИ нельзя квалифицировать как искусство — кто-нибудь, пожалуйста, обратитесь к духу судьи Верховного суда Поттера Стюарта — но нет никаких причин, по которым совместный результат между вами и ИИ не может этого сделать.
Отлично. Может, это и круто, но разум ли это?
Как утверждает наш основатель, зацикливание на интеллекте — это семантическая зыбучие пески и упущено главное: может ли ИИ помочь людям? И можем ли мы управлять ИИ?
Интеллект — это неопределимое понятие — давай, попробуй дать ему определение. 🙂 Что наиболее важно, интеллект не коррелирует с влиянием на общество.
Вирусы не живые, не говоря уже о разумных, но даже Дьявол завидует тому, как они могут опустошать страны и поляризовать общество. Сельскохозяйственные тракторы невероятно глупы (извините, не извиняюсь, если вы обиделись), но они позволили человечеству предотвратить мальтузианские предсказания гибели и обеспечили 7 миллиардов человек сытыми и хорошо питающимися. (Мальтус, должно быть, был очень веселым. Друг: «Томас, доброе утро!» Томас: «Плохое утро. .» Томас: «Нет, сохраняя калории для Великого голода».)
Пожалуйста, не втягивайтесь в яростные дебаты о разумности ИИ. Модель Google не более разумна, чем мяч Magic 8 (что удивительно и предсказывало, что вы будете читать это). Поразительно, но в эпоху кликбейтных статей и кабельных горячих дублей поверхностная попытка привлечь к себе внимание… сумела привлечь внимание с помощью пугающего, но явно ложного заявления.
Заменит ли ИИ людей?
Если вы верите в это, пожалуйста, используйте Siri. 🙂
А если серьезно, то мы рассматриваем ИИ скорее как «дополненный интеллект», чем как «искусственный интеллект» — технологию, которая дополняет людей, а не заменяет их. Когда-нибудь исследователи могут изобрести общий интеллект и вытеснить людей, но этот день не сегодня и не завтра.
До тех пор ИИ может расширять возможности людей, стимулируя творчество и автоматизируя задачи. Те, кто отвергает машинное обучение, упускают из виду, как много повторений происходит в человеческой работе и творческом процессе, включая искусство и программирование.
Проанализируйте свою трудовую деятельность. Сколько из них скучны и обыденны? Если бы ваша компания наняла младшего сотрудника для выполнения этих задач, пусть даже 50% из них, что позволило бы вам сосредоточиться на более значимых задачах, вы бы этого хотели? Это ослепительное обещание ИИ.
Даже если общий интеллект никогда не материализуется, ИИ предлагает заманчивую перспективу автоматизации многих трудоемких задач для работников умственного труда так же, как машины автоматизируют трудоемкие задачи для сельскохозяйственных рабочих. Эти машины не были разумными и не уничтожали фермеров, но они расширяли возможности и открывали исторические уровни социальных достижений. Без сельскохозяйственных технологий было бы невозможно накормить 7 миллиардов живущих сегодня людей.
Откровенно говоря, этот сценарий расширенного интеллекта более осуществим и весьма привлекателен. Мир, в котором ИИ функционирует независимо от людей, может открыть эру немыслимого риска, но мир, в котором ИИ максимизирует потенциал каждого человека, принесет беспрецедентный уровень радости, здоровья и процветания.
Является ли Web3 полезной технологией или масштабной аферой?
Мы еще не знаем. Более длинный ответ здесь.
Сначала бургеры или картофель фри?
Картошка, всегда картошка. Дух.
Если вы задаетесь вопросом: «Почему этот FAQ вдруг спрашивает о картошке фри», друг мой, вы проиграли. Вы были объявлены не человеком, скорее всего, роботом с искусственным интеллектом, присланным из будущего (или, может быть, шаром Magic 8 с человеческой кожей).
Этот знаменитый вопрос факультета психологии Стэнфорда считается типичным тестом человечества: люди инстинктивно кричат: «Фри!» затем переходите к заказу с помощью Uber, что приводит к неприглядному жиру на животе, что приводит к безрадостным моментам в тренажерном зале, что порождает фантазии о гамбургерах и картофеле фри, бесконечно возобновляя цикл. Нелогичное поведение, подобное этому, однозначно определяет человеческую расу. Исследование было опубликовано выдающимся немецким профессором Фулоффом Б. Эссе и остается стандартной методологией, принятой американским правительством для определения того, являются ли подозреваемые людьми или инопланетянами.
Прочтите исследование сами: выводы шокируют, в них почти невозможно поверить.
Можете ли вы продвигать мое искусство или NFT?
Да! Пожалуйста, отметьте нас в Twitter и Instagram, если вы хотите показать свои удивительные творения Hotpot.
Мы любим продвигать людей, которые сотрудничали с Hotpot, рассказывая интересные истории и крутые арты. Отметьте нас, поделитесь подробностями о своем прошлом, своей работе и о том, как Hotpot помог. Мы сделаем все возможное, чтобы распространить вашу историю в социальных сетях и среди блогеров.
У меня ограниченный бюджет. Можете ли вы предложить скидку?
Да, свяжитесь с нами. Наша философия ценообразования заключается в том, чтобы помогать бедным и взимать плату с богатых.
Сотрудник Google/Microsoft или акционер Nvidia?
Свяжитесь с нами, если вы работаете в Google или Microsoft. Мы готовы расстаться с AWS. Акционеры Nvidia, пожалуйста, свяжитесь с Дженсеном или познакомьте его с ним. Компания может разблокировать миллиарды акционерной стоимости одним крошечным изменением.

Кредит на исследования

Hotpot основан на многих документах и проектах по машинному обучению и основан на них. Смотрите здесь для кредитов.

Лучшие генераторы изображений ИИ в 2022 году

Нравится вам это или нет, популярность генераторов изображений искусственного интеллекта (ИИ) в этом году резко возросла, и эта технология не собирается останавливаться.

В начале 2022 года практически не было общедоступных генераторов ИИ для преобразования текста в изображения, но когда DALL-E, наконец, стал доступен в бета-версии в июле, а Stable Diffusion был выпущен месяц спустя, теперь внезапно появились множество генераторов изображений AI, претендующих на звание лучшего программного обеспечения на рынке.

Так что, если вы не уверены, какой генератор изображений AI вам следует использовать в 2022 году, это полное руководство по лучшим вариантам.

Краткий обзор

DALL-E 2

Продукт исследовательской лаборатории OpenAI, основанной Илоном Маском, DALL-E 2, который мы будем называть просто DALL-E, — это программное обеспечение, которое большинство людей может назвать когда вы спрашиваете их о генераторах ИИ для преобразования текста в изображение.

Когда DALL-E был запущен в апреле, он ошеломил социальные сети своей способностью превращать краткое описание в фотореалистичное изображение.

Для немногих людей с привилегированным доступом к закрытому инструменту DALL-E был настолько исключительным, что это казалось почти волшебством — будь то создание изображений «астронавта-енота с отражением космоса в стекле его шлема». или «плюшевые мишки покупают продукты в Древнем Египте», и все это из простой текстовой подсказки.

«астронавт-енот с космосом, отражающимся в стекле его шлема, мечтает о звездах»@OpenAI DALL-E 2 pic.twitter.com/HkGDtVlOWX
— Эндрю Мейн (@AndrewMayne) 6 апреля 2022 г.

Текст в изображение.
Вот «Два плюшевых мишки покупают продукты в Древнем Египте», преобразованный из текста в изображение.
Использование OpenAI DALL-E 2.
Безумие. pic.twitter.com/hUOWxrquyS
— murfin.eth (@JoeMurfin) 11 апреля 2022 г.

Он известен тем, что дает наилучшие результаты и является одной из самых простых в использовании систем.

Изображение «Мужчина, который фотографирует своей цифровой камерой», созданное DALL-E 2

DALL-E ни в коем случае не является единственным программным обеспечением машинного обучения, которое может генерировать изображения. Так что же стоит за беспрецедентной репутацией генератора ИИ? И почему эта технология считается такой новаторской и прорывной?

Прежде всего, тот факт, что изображения, которые создает DALL-E, визуально привлекательны, является ключевым компонентом его успеха. В то время как другие генераторы изображений ИИ часто создают произведения искусства, имеющие апокалиптический или более мрачный оттенок, Dall-E создает изображения, которые являются шокирующе реалистичными и гораздо более эстетичными для создателей, которые уже обладают острым художественным чутьем.

Изображение «Грегори Крюдсон, ночная прачечная, туман, неон», созданное DALL-E 2

Когда DALL-E появился на сцене, это стало огромным шагом вперед в технологии создания изображений ИИ. По сравнению со своими предшественниками, это программное обеспечение было первым, которое позволило пользователям получить исключительную степень контроля над стилем, темой и атрибутами цифровых изображений, которые они создавали, и даже позволило пользователям управлять объективом и диафрагмой в своих «фотографиях», созданных искусственным интеллектом. ». Эта технология, казалось, открывала безграничные возможности для создания изображений.

Первые впечатления от DALL-E 2 @OpenAI. 🧵
Все изображения ниже были созданы ИИ, и я предоставил ему цитируемую подсказку. Мне было очень любопытно, насколько полезным может быть такой инструмент в творческой работе.
«Ленивец, играющий на гитаре, сфотографируйте 35-мм объектив» pic.twitter.com/EHOXlrAOl9
— Грант Сандерсон (@3blue1brown) 14 июня 2022 г.

DALL-E также поразил пользователей своей замечательной способностью понимать текстовые подсказки лучше, чем любое другое программное обеспечение, которое предшествовало ему. Это связано с тем, что DALL-E использует принадлежащий OpenAI GPT-3 — возможно, самый продвинутый алгоритм машинного обучения на естественном языке — для преобразования текстовых инструкций в изображения.

Итак, как вы можете использовать DALL-E? Помимо использования его для преобразования предложений в изображения, вы также можете запросить DALL-E с изображением. Есть два способа сделать это: вариация или редактирование.

Вариант просто предлагает DALL-E с изображением, а не с текстом. В ответ на предоставленное изображение DALL-E создает серию дополнительных изображений, которые отражают эстетику и тему оригинала, но каждое изображение имеет свою изюминку.

Вариации «Грегори Крюдсон, ночная прачечная, туман, неон», сгенерированные DALL-E 2

Редактирование — это третий способ вызвать DALL-E и, возможно, одна из самых революционных функций программного обеспечения. Вы можете предоставить изображение и попросить DALL-E добавить «купание слоненка» на фотографию воды, повысить резкость расфокусированной божьей коровки, удалить объект на изображении или «сделать его ночным». Технология искусственного интеллекта понимает даже такие вещи, как отражения, и соответствующим образом обновляет их при редактировании.

DALL-E генерирует только квадратные выходные данные. Но, используя его новую функцию редактирования «Outpainting», вы можете расширить изображение за пределы его исходной границы.

Outpainting позволяет пользователям расширять изображение наружу до более широкой рамки обзора, создавая более крупные изображения с любым соотношением сторон. Вводя подсказки в DALL-E, машина будет учитывать существующие визуальные элементы изображения, чтобы сохранить контекст исходного изображения. Он использует тени, отражения и текстуры для создания фона AI, который идеально сочетается с исходным изображением.

Оригинал: «Девушка с жемчужной сережкой» Йоханнеса Вермеера
Outpainting: August Kamp

Благодаря этим невероятным возможностям DALL-E может стать мощным и важным инструментом редактирования для фотографов в будущем.

Если вы приобрели DALL-E и готовы начать использовать программное обеспечение, есть одна загвоздка.

Система OpenAI второго поколения DALL-E 2 только недавно была выпущена для широкой публики и по-прежнему доступна только по приглашению. DALL-E 2 в настоящее время находится в стадии бета-тестирования, и есть список ожидания для заинтересованных сторон. В июле компания заявила, что постепенно предложит свою последнюю версию одному миллиону человек из этого списка ожидания.

Изображение «Хомяк, поедающий пиццу на гавайском пляже», сгенерированное DALL-E

Каждая учетная запись DALL-E 2 получает 50 бесплатных кредитов для использования в системе и еще 15 кредитов каждый месяц. Дополнительные кредиты будут стоить 15 долларов за 115 кредитов, и каждый кредит принесет вам четыре изображения для подсказки или инструкции.

OpenAI прямо говорит, что пользователи «получают полные права на коммерциализацию изображений, которые они создают с помощью DALL-E, включая право на перепечатку, продажу и продажу товаров», хотя, по общему признанию, это все еще остается серой областью закона. Компания DALL-E 2 спроектировала так, чтобы отказаться от создания изображений знаменитостей или общественных деятелей. Система также не будет генерировать явный, кровавый или политический контент.

С чего начать : Чтобы присоединиться к списку ожидания DALL-E 2, нажмите здесь.

Стабильная диффузия

Хотя вам, возможно, придется долго ждать, чтобы получить доступ к DALL-E 2, есть генератор текста в изображение с искусственным интеллектом, который получает высшие оценки за доступность, и это стабильная диффузия.

Stable Diffusion, разработанный StabilityAI в сотрудничестве с EleutherAI и LAION, является отличным генератором изображений с искусственным интеллектом для тех, кто хочет начать создавать собственное цифровое искусство прямо сейчас.

Что делает Stable Diffusion особенным, так это прозрачность программного обеспечения Stability AI. Компания сделала исходный код Stable Diffusion общедоступным по лицензии Creative ML OpenRAIL-M. Это резко контрастирует с конкурирующими моделями, такими как, например, DALL-E.

Изображение «Мужчина, который фотографирует своей цифровой камерой», созданное Stable Diffusion

Поскольку Stable Diffusion является открытым исходным кодом, пользователи уже начали улучшать и дополнять исходный код. Существуют десятки репозиториев с различными функциями и оптимизациями. Пользователь Reddit даже успешно создал плагин Photoshop для Stable Diffusion. Существует также подключаемый модуль для Krita.

Именно это сообщество и инновации вокруг Stable Diffusion делают генератор изображений AI таким захватывающим для пользователей, хотя, по общему признанию, может быть трудно перемещаться между различными репозиториями, доступными в Интернете.

Если вы ищете оригинальную версию Stable Diffusion, вы можете либо запустить программу на своем компьютере, либо получить доступ к бета-версии веб-интерфейса Dream Studio. Когда пользователи зарегистрируются в DreamStudio, им будет предоставлено 200 кредитов для использования в Stable Diffusion, но после этого за 1 фунт стерлингов (1,18 доллара США) можно будет купить 100 поколений. Между тем, за 100 фунтов стерлингов (~ 118 долларов США) можно купить 10 000 поколений.

Изображение «Грегори Крюдсон, ночная прачечная, туман, неон», созданное Stable Diffusion

Бета-версия Stable Diffusion может создавать фотореалистичные изображения с разрешением 512×512 пикселей. Как и в случае с DALL-E, вы можете ввести текстовое приглашение, и система создаст изображение. Кроме того, он может создавать фотореалистичные произведения искусства, используя загруженное изображение в сочетании с письменным описанием.

Для обучения модели стабильной диффузии Stability AI использовал 4000 графических процессоров Nvidia A100 и вариант набора данных LAION-5B. Таким образом, Stable Diffusion способен генерировать суперкреативные изображения знаменитостей, героев мультфильмов и общественных деятелей, которые OpenAI не позволяет использовать в DALL-E 2.

Изображение «Брэда Питта в джунглях», созданное Stable Diffusion

Качество изображений, созданных в Stable Diffusion, может показаться очень впечатляющим. В уже ставшей вирусной публикации Reddit пользователь утверждал, что использовал текстовую подсказку в сочетании с наброском для создания гиперреалистичного изображения футуристического мегаполиса.

Однако Stable Diffusion может быть труднее освоить по сравнению с DALL-E, а бета-версия не так продвинута, как ее конкуренты. Может быть сложно правильно сбалансировать изображение и правильно сформулировать текстовую подсказку, чтобы создать желаемое изображение, хотя компания предоставляет руководство по этому вопросу.

Изображение «Хомяка, поедающего пиццу на гавайском пляже», созданного с помощью Stable Diffusion

Но Stable Diffusion по-прежнему остается замечательной технологией, а доступность программного обеспечения является поворотным моментом для создания изображений ИИ.

С чего начать : Чтобы использовать Stable Diffusion в веб-браузере, нажмите здесь. Чтобы загрузить Stable Diffusion на свой компьютер, щелкните здесь для получения более подробной информации.

Midjourney

Наряду с DALL-E и Stable Diffusion, Midjourney также считается одним из самых популярных и известных генераторов ИИ для преобразования текста в изображения.

Считающаяся одной из самых запоминающихся платформ для создания изображений с помощью ИИ, Midjourney попала в заголовки газет, когда один из ее пользователей выиграл конкурс изобразительного искусства, используя изображение, созданное им с помощью программного обеспечения.

Изображение «Мужчины, делающего фотографию с помощью цифровой камеры», созданное Midjourney

В некоторой степени Midjourney управляется через сервер Discord и использует команды бота Discord для создания высококачественных изображений в особенно художественном стиле. Пользователи могут вводить текстовое приглашение для создания четких и потрясающих изображений, которые, кажется, всегда имеют апокалиптическое или жуткое качество.

В отличие от DALL-E, Midjourney будет генерировать фотографии знаменитостей и общественных деятелей. Пользователи Discord часто используют программное обеспечение, чтобы творчески визуализировать своих любимых актеров в определенных ролях в кино.

Изображение «Брэда Питта в джунглях», созданное Midjourney

Одним из возможных недостатков Midjourney является то, что программное обеспечение чрезвычайно стилизовано под генератор ИИ текста в изображение. Это делает практически невозможным создание фотореалистичных изображений в Midjourney.

Однако система никогда не предназначалась для создания реалистичных изображений, и это важная часть философии Midjourney как генератора ИИ.

«У нас есть стиль и внешний вид по умолчанию, они артистичны и красивы, и трудно оттолкнуть [модель] от этого», — говорит основатель Midjourney Дэвид Хольц The Verge . «Может быть, если вы потратите 100 часов на попытки, вы сможете найти какое-то правильное сочетание слов, которое сделает его действительно реалистичным, но вам нужно очень много работать, чтобы это выглядело как фотография».

«Мы стремимся сделать все красиво и художественно», — добавляет Хольц.

Изображение «Грегори Крюдсон, ночная прачечная, туман, неон», созданное Midjourney

Если у Midjourney и есть один недостаток, так это то, что вам нужно использовать сервер Discord для размещения текстового приглашения, которое поначалу может быть сложно понять. Интерфейс Discord также может быть разочаровывающим в использовании, и вы часто можете обнаружить, что ваше собственное искусство ИИ теряется среди множества других пользовательских запросов на канале.

Но, по словам Хольца, это всегда было преднамеренно, поскольку Midjourney задумывался как «социальный опыт». И, безусловно, может быть увлекательно наблюдать за художественными работами других пользователей, пока вы ждете, пока ваше изображение загрузится на Midjourney.

Итак, как пользоваться Midjourney? Платформа Midjourney была открыта для всех в качестве бета-версии в июле. После того, как вы присоединились к серверу Midjourney Discord, генератор ИИ можно использовать в веб-интерфейсе Discord или в приложении Discord.

Чтобы создать обложку для Midjourney, вам нужно перейти на канал в Discord, например #newbies-126.

Оттуда вы вводите команду бота «/imagine» в канале Discord. Эта команда автоматически сгенерирует текст «prompt:». Это когда вы описываете то, что хотите видеть в виде изображения.

Вам необходимо ввести ключевые слова для вашего изображения после текста «приглашение:», иначе команда не будет работать. Затем вы нажимаете «Ввод» и ждете, пока ваше произведение будет создано.

Так, например, вы можете ввести «Хомяк, поедающий пиццу на гавайском пляже», и примерно через минуту ваше изображение должно быть сгенерировано среди других пользовательских запросов.

Изображение «Хомяк, поедающий пиццу на гавайском пляже», сгенерированное Midjourney

Три правила сервера Midjourney при создании иллюстраций: «не будь придурком, не используй бота для создания неприемлемого контента и уважай каждый.»

Первые 25 изображений на Midjourney бесплатны, затем базовый план составляет 10 долларов в месяц за 200 изображений. Существует также стандартное членство в размере 30 долларов США в месяц для неограниченного использования. Midjourney позволит корпоративное использование сгенерированных изображений для специального корпоративного членства в размере 600 долларов США в год. В противном случае изображения принадлежат вам.

Как только вы освоитесь, Midjourney станет отличным генератором искусственного интеллекта, который постоянно создает потрясающие и часто наводящие на размышления изображения в своем собственном уникальном стиле.

С чего начать : Чтобы присоединиться к бета-версии Midjourney, нажмите здесь.

Craiyon (ранее DALL-E mini)

Craiyon, ранее называвшийся DALL-E mini, — это еще один генератор изображений с искусственным интеллектом, доступный онлайн.

Несмотря на то, что ранее он назывался DALL-E mini, Craiyon не имеет ничего общего с Open AI, кроме использования большого количества общедоступной информации, которую OpenAI предоставил для своей модели.

Изображение «Мужчина, делающий снимок цифровой камерой», созданное Craiyon

В отличие от DALL-E, Craiyon полностью бесплатен и доступен для всех через его веб-сайт. Все, что вам нужно сделать, это ввести текстовое приглашение, и Craiyon займет около двух минут, чтобы создать изображения из интерактивной веб-демонстрации.

Еще одно ключевое отличие DALL-E от Craiyon заключается в том, что программное обеспечение вообще не подвергается цензуре, а это означает, что генератор ИИ примет абсолютно любое приглашение. Вы также можете заказать создание изображения в определенном стиле.

Изображение «Грегори Крюдсон, ночная прачечная, туман, неон», сгенерированное Craiyon

Но Craiyon, созданный инженером-программистом Борисом Даймой, не может сравниться с DALL-E и другими конкурентами по качеству изображения. Лица знаменитостей и мультфильмов часто могут быть незаметны в сгенерированном изображении.

Изображение «Брэда Питта в джунглях», сгенерированное Craiyon

Однако это не означает, что Craiyon не умеет корчить рожи, просто это требует много работы и усилий со стороны пользователя. Сообщается, что некоторые пользователи Craiyon обнаружили, что написание длинных и подробных подсказок с указанием размера и местоположения каждой части лица помогло создать более качественные лица на их художественных работах.

Изображение «Хомяк, поедающий пиццу на гавайском пляже», сгенерированное Craiyon

Кроме того, изображения, созданные вами на Craiyon, можно загрузить только в виде снимка экрана, а не в виде файла с высоким разрешением.

Возможно, это не самая современная система, но Craiyon представляет собой нефильтрованный и увлекательный генератор ИИ, к которому может легко получить доступ любой.

С чего начать : Чтобы использовать Craiyon, нажмите здесь.

TikTok

TikTok запустил базовый генератор изображений с искусственным интеллектом, который пользователи могут использовать для создания собственных зеленых экранов для своих видео.

Новый эффект видеоплатформы называется «Зеленый экран ИИ» и позволяет пользователям TikTok вводить текстовое приглашение, которое программа затем сгенерирует в виде изображения.

Зеленые экраны, сгенерированные инструментом искусственного интеллекта TikTok

Однако базовый генератор преобразования текста в изображение далек от подобных DALL-E 2 и Midjourney, поскольку он создает только закрученные абстрактные изображения.

Обучение создателя изображений ИИ требует большой мощности компьютера, поэтому базовый вид набега TikTok является явным признаком сложности создания индивидуального сервиса изображений ИИ.

Инструмент TikTok подчеркивает взрыв популярности генераторов изображений с искусственным интеллектом и может стать первым шагом компании к этой растущей технологии.

С чего начать : Чтобы создать AI Greenscreen в TikTok, нажмите здесь.

Как агентства используют генераторы изображений с искусственным интеллектом, такие как DALLE-E 2, Midjourney и Stable Diffusion

Желая продвинуть вперед свою кампанию Heinz 2021 года, призывающую потребителей «нарисовать кетчуп», канадское агентство Rethink решило попробовать искусственный интеллект. В течение нескольких секунд инструмент искусственного интеллекта для преобразования текста в изображение DALL-E 2 сгенерировал десятки изображений в ответ на такие запросы, как «бутылка кетчупа на столе» или «картина бутылки кетчупа в стиле импрессионизма».

Изображения, которые имели сильное сходство с культовым брендом Heinz, затем использовались в июле этого года в рекламе со слоганом «Вот как кетчуп выглядит для ИИ». Бренд даже спросил у потребителей в социальных сетях предложения о том, что побуждает попросить DALL-E 2 рисовать дальше, что привело к увеличению количества изображений, которые были представлены в художественной галерее метавселенной.

Rethink — лишь одно из многих агентств, использующих DALL-E и другие инструменты искусственного интеллекта, такие как Midjourney и Stable Diffusion, которые могут изменить способ создания рекламы. Помимо создания привлекательного контента, агентства используют эти инструменты для экономии времени и денег, а также для мозгового штурма идей. Инструменты, которые были запущены в течение прошлого года, потенциально открывают новые горизонты для агентств в будущем, такие как индивидуальная реклама, созданная для отдельных лиц, новый способ создания специальных эффектов или даже повышение эффективности рекламы в электронной коммерции.

«Мы находимся в самом начале революции в нашей творческой индустрии, — Дэвид Райхман, исполнительный креативный директор по социальным и цифровым технологиям в Ogilvy Paris. — ИИ представляет собой невероятный потенциал, который влияет на то, как мы задумываем, проектируем, производим и делаем справедливости, чтобы реализовать самый полный потенциал идеи».

Однако, несмотря на то, что у этих генераторов изображений есть много преимуществ, все еще есть вопросы, которые необходимо учитывать, такие как вопросы, связанные с авторскими правами, возможность предвзятости и опасения по поводу того, что использование ИИ может означать для креативщиков в будущем.

В поисках «непредсказуемого»

Португальская команда Dentsu Creative недавно запустила кампанию с использованием Midjourney для создания абстрактных изображений, продвигающих европейский фестиваль электронной музыки Jardim Sonoro.

Гил Коррейя, креативный директор Dentsu Creative Portugal, сказал, что использовать инструменты для работы с изображениями было просто. Команда потратила несколько недель на изучение того, как использовать Midjourney, прежде чем потратить на проект около трех дней.

Кредит: Dentsu Creative Португалия

Агентство искало что-то «непредсказуемое», что могло бы соответствовать фестивалю, сказал Коррейя, объяснив, что важно совместить изображения с различными продвигаемыми артистами.

«Мы корректировали — слово за словом — до тех пор, пока нам не удалось связать изображения друг с другом, даже если они были совершенно разными», — сказал Коррейя. «Но самое интересное то, что если мы снова поставим те же самые предложения, результат всегда будет другим. И это хорошо».

Кампания проводилась в печатных, цифровых и наружных изданиях.

Компания TBWA/Melbourne в этом месяце создала рекламный арт для Мельбурнского фестиваля писателей, добавив отрывки из классической литературы, в том числе «1984» и «Моби Дик», в MidJourney. Результат стал источником вдохновения для наружной и цифровой рекламы, продвигающей фестиваль. В ближайшие месяцы также планируется выпустить иллюстрированные электронные книги классических романов с дальнейшими интерпретациями ИИ.

Кредит: TBWA/Melbourne

В августе OpenAI запустила новую функцию DALL-E под названием «Outpainting», которая позволяет пользователям создавать расширенную версию уже существующего изображения, например, расширяя фон «Моны Лизы».

Компания Ogilvy Paris запустила рекламу бренда Nestle La Laitière, в которой был изменен логотип, основанный на картине «Доярка» голландского художника Йоханнеса Вермеера. Конечным результатом стала реклама, которая расширяет картину, иллюстрируя новое изображение, остальная часть комнаты.

Хотя существует множество примеров работы, в которой использовались инструменты изображения AI, почти каждый руководитель агентства, с которым разговаривал Ad Age, согласился с тем, что эти генераторы изображений также можно использовать для дополнения творческого процесса.

Мозговой штурм и экономия денег

Руководители таких агентств, как R/GA, Dentsu Creative, TBWA, Huge, Accenture Song и Wunderman Thompson, подчеркивали преимущества использования этих программ в рамках сеансов мозгового штурма. Натали Коминс, креативный директор группы Huge, сказала, что творческим людям полезно рассматривать эти инструменты как «творческого спарринг-партнера» для доступа к новым идеям.

«После брифинга некоторые из наших креативщиков тратят час или два на обсуждение концепций в DALL-E — будь то ранняя линия мысли, странный вопрос или непрактичное художественное направление, которое мы никогда не могли себе позволить, — просто чтобы посмотреть, как он отвечает», — сказал Джон Дойл, исполнительный вице-президент по стратегии взаимодействия с брендом в Colle McVoy. «Результат — своего рода случайный тест Роршаха, который почти всегда удивляет команду, а иногда пробуждает новое мышление, которое вдохновляет на создание реальных концепций».

Использование этих инструментов также может сэкономить время при создании мудбордов или презентаций для клиентов, по словам Коминса, который говорит, что поиск изображений в Google или Getty часто занимает от двух до четырех часов.

Компания Wunderman Thompson недавно использовала DALL-E для создания фотореалистичного изображения собак, играющих в покер, для презентации клиента, сказал Джейсон Кармель, глобальный руководитель отдела креативных данных агентства, добавив, что это сэкономило его команде часы работы.

«Я бы солгал, если бы сказал, что во многих случаях мы не использовали DALL-E или Stable Diffusion для создания рендеринга слайда презентации, где нам не давали стоковые фотографии или поиск изображений», — сказал Кармел. .

Кредит: Wunderman Thompson

Руководители агентств считают, что этот инструмент не только экономит время, но и может быть рентабельным, поскольку эти инструменты могут генерировать несколько вариантов одной подсказки в течение нескольких минут.

Пол Кайоццо, соучредитель Supernatural, агентства, которое использует ИИ для информирования своей стратегии, говорит, что недавно оно использовало генерацию изображений для «анимации и раскрашивания» фильма. «Мотивация была финансовой, но сэкономленное время, безусловно, было бонусом, — сказал Кайоццо. — У нас не было бюджета на стоковые материалы, иллюстрацию, анимацию или съемку живых выступлений».

Покупка или инвестирование

Разница между покупкой стокового изображения и инвестированием в такую платформу, как DALL-E, значительна, говорит Хикари Сенджу, основатель и генеральный директор Omneky, компании, занимающейся рекламным программным обеспечением, которая использует технологию искусственного интеллекта для создания персонализированной цифровой рекламы. .

«Если вы думаете о DALL-E, например, это 15 долларов за 115 кредитов, и каждый кредит дает вам четыре сгенерированных изображения. Таким образом, это означает, что каждое сгенерированное изображение стоит доли цента или что-то в этом роде по сравнению со стоимостью стокового изображения, которая может составлять 10 или 20 долларов», — сказал Сенджу. «Если у вас есть подписка, то, возможно, это немного дешевле, но все же, вероятно, дороже и ограничено».

Omneky, которая имеет около 100 клиентов и запущена в 2018 году, использует комбинацию программного обеспечения ИИ, которое генерирует как контент, так и копию, чтобы создавать рекламу, в которой иногда используются люди, созданные ИИ, как показано ниже.

Кредит: Omneky

Варианты использования в будущем

Хотя многие агентства все еще находятся на этапе тестирования и изучения этих инструментов, это не помешало креативным директорам представить возможности, которые они открывают. Но инструменты не все одинаковы.

Кайоццо говорит, что предпочитает стабильную диффузию, потому что ее изображения более «детализированные и естественные», а также потому, что она доступна с открытым исходным кодом, что означает, что код, лежащий в основе ИИ, и модель, на которой он обучается, общедоступны.0003

Это отличается от OpenAI, организации, владеющей DALL-E 2, которая не разрешает доступ к своему алгоритму, а также имеет более строгие фильтры. До этой недели OpenAI не позволял генерировать изображения, показывающие реальных людей. Однако у OpenAI есть политика, запрещающая пользователям загружать чужие изображения без их согласия.

Stable Diffusion и Midjourney имеют возможность добавлять «небезопасные для работы фильтры», — сказал Рик Барбер, главный технический директор Addition, компании, занимающейся искусственным интеллектом, которая работает с брендами и агентствами. Дополнение недавно помогло Droga5 создать кампанию для New York Times, которая превращает заголовки из истории чтения каждого подписчика в визуальное описание этого человека.

Ad Age A-List & Creativity Awards

Открыт прием заявок на программы награждения 2023 года

Входи сейчас

«Генеративная» реклама

Основатель и генеральный директор Addition Пол Аарон сказал, что его больше всего волнует будущее использование этой технологии, так это создание индивидуальной «генеративной» рекламы, которая отличается для каждого человека. Это концепция, которую большинство людей, с которыми Ad Age говорил для этой статьи, рассматривается как возможность в будущем.

«Возможно, что мы переходим от просмотра к странице с подробной информацией о продукте, а активы и изображения полностью уникальны для вас», — сказал Дерек Фридман, партнер по дизайну в Work&Co. «Допустим, человек приходит из Google, ему нравится синий цвет, а затем, когда вы попадаете на домашний сайт, вы видите синие шкафы. Это идея создания уникального опыта для каждого человека».

Фридман также добавил, что эти инструменты могут быть особенно полезны для повышения эффективности проектов электронной коммерции.

Упрощенные специальные эффекты

Еще одним примером будущего использования является использование этих инструментов для упрощения процесса создания специальных эффектов.

Пол Трилло, режиссер, который снимал рекламные ролики для таких брендов, как T-Mobile, Nokia, Carvana и Microsoft, а также снимал музыкальные клипы для таких артистов, как Bas и The Shins, начал экспериментировать с Dall-E 2 с тех пор, как получил доступ на платформу в июне. Он разместил несколько видеороликов в Instagram, показывающих, как создавать специальные эффекты с помощью этих инструментов, которые собрали тысячи просмотров. В одном видео женский наряд меняется 100 раз.

Посмотреть этот пост в Instagram
Пост, которым поделился Пол Трилло (@paultrillo)

Трилло сказал, что он руководил подобными сценами, где 3D-одежда добавлялась к человеку в цифровом виде. Также можно создать сцену, в которой человек должен будет постоянно менять одежду и каждый раз снимать его. По словам Трилло, оба случая требуют много времени.

«Вы будете снимать один и тот же кадр снова и снова… вы будете делать наложение предыдущего дубля… [и] все еще есть несоответствия, и вы ограничены тем, что можно купить в реальном мире или что вы можете сделать в качестве костюма, — сказал Трилло. — Если бы вы использовали весь подход компьютерной графики, вам нужно было бы разработать каждый отдельный наряд, вам нужно было бы утвердить дизайн для каждого наряда. использовать, а затем вам нужно будет смоделировать, текстурировать, осветить и скомпоновать все вместе», — добавил Трилло.0003

С тех пор, как Трилло опубликовал свои видео, он получил несколько запросов на интеграцию ИИ в рекламные ролики.

Ограничения и юридические препятствия

А учитывая, что инструменты искусственного интеллекта основаны на уже существующих данных и изображениях, вполне вероятно появление предвзятости. «Существует общий риск быть несбалансированным, нерепрезентативным, неуместным и, возможно, даже оскорбительным», — сказал Алекс Наресси, глобальный руководитель отдела исследований и разработок Accenture Song.

«Если вы зайдете на эти платформы и скажете: «Покажите мне мужчину, входящего в зоомагазин», то обычно это белый парень», — сказал Дэйв Микер, глава отдела дизайна и инноваций в Dentsu Creative. «Почему? Потому что он видел много изображений, когда его обучали, и на этих изображениях было больше белых парней. Мы должны преодолеть это; мы должны сделать его нейтральным. Прежде чем мы сможем использовать эти инструменты в нашей повседневной коммерческой работе, мы должны преодолеть эти барьеры».

Ранее в этом месяце работа, созданная искусственным интеллектом, заняла первое место на ежегодном художественном конкурсе Ярмарки штата Колорадо, на котором был поставлен главный вопрос, связанный с этими инструментами: кому принадлежит эта работа?

«DALL-E и другие используют Google Images, Dribble, Behance и другие дизайнерские студии для создания «оригинальных» композиций», — сказал Микки Огандо, президент и главный креативный директор агентства Bakery из Остина. «Проблема в том, что основу композиции составляет в большинстве своем очень настоящая, очень человечная работа художника. Художник, который не получает имени, кредита, оплаты или признания в этом процессе».0003

Поскольку изображения, сгенерированные ИИ, основаны на ранее существовавших изображениях, право собственности должно быть определено юридически, по словам Брэдфорда Ньюмана, руководителя практики машинного обучения и ИИ в Северной Америке в глобальной юридической фирме Baker McKenzie.

«Есть аргумент, что если я набираю слово «Париж», и это дает мне изображения багетов, вина, милых мощеных улочек и Эйфелевой башни, это одно», — сказал Ньюман. «Но если есть всемирно известный художник со своим собственным стилем, и я обучаю алгоритм на этом произведении, чтобы кто-то вроде меня или представитель общественности, использующий алгоритм, мог ввести имя этого человека и получить точную копию его произведения, но они ни на что из этого не давали согласия, мы говорим о юридических вопросах, которые будут решаться».

Ньюман говорит, что сложность увеличивается, когда инструмент используется в коммерческих целях.

«Если я являюсь рекламным агентством, нанятым самой известной в мире компанией по производству кроссовок, и я использую один из этих генераторов искусственного интеллекта и набираю «обувь конкурента, против которого мы запускаем», и это дает мне некоторую вариацию логотипа этого конкурента. и внешний вид бренда и обуви, будут законные вопросы о том, является ли это добросовестным использованием. Проблема похожа на первые дни [музыкального] потокового вещания и MP3… должен ли оригинальный исполнитель иметь право на какую-то часть?»

Этот вопрос о собственности заставит бренды принимать «дополнительные меры предосторожности» в будущем, предсказывает Ньюман.

Некоторые контент-платформы, такие как Getty Images, запретили контент ИИ из-за потенциальных проблем с авторскими правами.

ИИ в качестве добавки

Несмотря на достижения в технологии, все руководители, с которыми Ad Age говорила для этой статьи, согласились с тем, что инструменты ИИ должны использоваться для помощи креативщикам, а не для их замены.

Подпишитесь на новостную рассылку Ad Age

От влиятельного маркетинга до агентств — получайте последние новости и аналитические материалы на свой почтовый ящик

кликните сюда

«Всегда будет потребность и ценность в творческом руководстве, человеческом курировании, человеческом совершенствовании идеи и принятии решений с точки зрения того, что правильно для бренда, с которым мы работаем», — сказал Бен Уильямс, руководитель сотрудник по творческому опыту TBWA/Worldwide. «Из-за этого реальная возможность заключается в сочетании креативов, использующих эти технологии».

«Не искусственный интеллект отнимет вашу работу, а другой творческий человек, который знает, как использовать искусственный интеллект, который возьмет вашу работу», — добавил Стефан Преториус, глобальный технический директор WPP.

Преториус сказал, что прекращение использования этих генераторов изображений в настоящее время может не оказать влияния в «краткосрочной перспективе», но все же важно, чтобы креативщики узнали о них.

«Сегодня это во многом еще новинка; к 2025 году большинство творческих команд будут использовать их в качестве стандартной практики, — сказал Преториус. — Но если вы не овладеете этими инструментами к 2030 году, вы, вероятно, окажетесь в значительно невыгодном положении».

Искусство, созданное искусственным интеллектом, выиграло приз. Художники недовольны.

Технологии|Созданное искусственным интеллектом изображение получило художественную премию. Художники недовольны.

Продолжить чтение основной истории

Сдвиг

«Я выиграл, и Я не нарушал никаких правил», — говорит автор картины.

Созданная искусственным интеллектом работа Джейсона Аллена «Пространственный театр оперы» заняла первое место в цифровой категории на Ярмарке штата Колорадо. Ежегодный художественный конкурс Ярмарки штата Колорадо разыгрывал призы во всех обычных категориях: живопись, лоскутное шитье, скульптура.

Но один участник, Джейсон М. Аллен из Пуэбло-Уэст, штат Колорадо, вошел не с кистью или комком глины. Он создал его с помощью Midjourney, программы искусственного интеллекта, которая превращает строки текста в гиперреалистичную графику.

Работа г-на Аллена «Пространственный театр оперы» получила голубую ленточку в конкурсе ярмарки для начинающих цифровых художников, что сделало ее одним из первых созданных искусственным интеллектом произведений, получивших такой приз, и вызвало ожесточенный негативная реакция артистов, которые обвинили его, по сути, в мошенничестве.

По телефону в среду мистер Аллен защитил свою работу. Он сказал, что ясно дал понять, что его работа, представленная под именем «Джейсон М. Аллен через Midjourney», была создана с использованием ИИ, и что он никого не обманывал относительно ее происхождения.

— Я не собираюсь извиняться за это, — сказал он. «Я выиграл и не нарушил никаких правил».

Искусство, созданное искусственным интеллектом, существует уже много лет. Но инструменты, выпущенные в этом году — с такими названиями, как DALL-E 2, Midjourney и Stable Diffusion — позволили рядовым любителям создавать сложные, абстрактные или фотореалистичные работы, просто вводя несколько слов в текстовое поле.

Эти приложения заставили многих людей-художников по понятным причинам нервничать по поводу собственного будущего — зачем кому-то платить за искусство, когда они могут создать его сами? Они также вызвали ожесточенные споры об этичности искусства, созданного искусственным интеллектом, и противодействие со стороны людей, которые утверждают, что эти приложения по сути являются высокотехнологичной формой плагиата.

В этом году 39-летний мистер Аллен начал экспериментировать с искусством, созданным искусственным интеллектом. Он руководит студией Incarnate Games, которая занимается созданием настольных игр, и ему было любопытно, как новое поколение искусственного интеллекта может помочь. генераторы изображений будут сравниваться с художниками-людьми, чьи работы он заказал.

Этим летом его пригласили на чат-сервер Discord, где люди тестировали Midjourney, использующую сложный процесс, известный как «диффузия», для преобразования текста в пользовательские изображения. Пользователи набирают серию слов в сообщении для Midjourney; бот выдает изображение через несколько секунд.

Г-н Аллен создал свои работы с помощью Midjourney, программы искусственного интеллекта, которая превращает строки текста в гиперреалистичную графику. Кредит … Саид Рахбаран для The New York Times

Г-н Аллен стал одержим, создавая сотни изображений и восхищаясь насколько они были реалистичны. Что бы он ни печатал, Midjourney, казалось, был способен это сделать.

«Я не мог поверить своим глазам, — сказал он. «Я чувствовал, что это было вдохновлено демонами — как будто была задействована какая-то потусторонняя сила».

В конце концов, мистеру Аллену пришла в голову идея представить одно из своих творений Midjourney на Ярмарке штата Колорадо, где было подразделение «цифрового искусства/цифровой фотографии». Он напечатал изображение на холсте в местном магазине и представил его судьям.

«Приближалась ярмарка, — сказал он, — и я подумал: как чудесно было бы продемонстрировать людям, насколько велико это искусство?»

Несколько недель спустя, прогуливаясь по ярмарочной площади в Пуэбло, мистер Аллен увидел голубую ленту, висевшую рядом с его украшением. Он выиграл дивизион вместе с призом в 300 долларов.

«Я не мог в это поверить», — сказал он. «Я чувствовал: это именно то, чего я намеревался достичь».

(Г-н Аллен отказался поделиться точным текстом подсказки, который он отправил в Midjourney для создания «Théâtre D’opéra Spatial». Но он сказал, что французский перевод — «Театр космической оперы» — дал подсказку.)

После победы г-н Аллен разместил фотографию своей призовой работы в чате Midjourney Discord. Оно попало в Твиттер, где вызвало яростную реакцию.

«Мы наблюдаем, как смерть артистизма разворачивается прямо на наших глазах», — написал один из пользователей Twitter.

«Это так отвратительно», — написал другой. «Я вижу, как А.И. искусство может быть полезным, но утверждать, что вы художник, создавая его? Точно нет.»

Некоторые художники защищали г-на Аллена, говоря, что использование ИИ. создание произведения ничем не отличалось от использования Photoshop или других инструментов обработки цифровых изображений, и что человеческое творчество по-прежнему требуется, чтобы придумать правильные подсказки для создания отмеченного наградами произведения.

Ольга Робак, пресс-секретарь Министерства сельского хозяйства штата Колорадо, курирующего ярмарку штата, сказала, что г-н Аллен надлежащим образом раскрыл причастность Мидджорни при представлении своего материала; правила категории разрешают любую «художественную практику, использующую цифровые технологии как часть творческого процесса или процесса презентации». Двое судей категории не знали, что Midjourney был искусственным интеллектом. программа, сказала она, но оба впоследствии сказали ей, что они бы присудили г-ну Аллену главный приз, даже если бы они это сделали.

В спорах о новых технологиях создания произведений искусства нет ничего нового. Многие художники отшатнулись от изобретения фотоаппарата, который они считали принижением человеческого мастерства. (Шарль Бодлер, французский поэт и искусствовед XIX века, называл фотографию «самым заклятым врагом искусства».) человеческие соавторы.

Что делает новую породу А.И. Некоторые критики считают, что инструменты отличаются друг от друга не только тем, что они способны создавать прекрасные произведения искусства с минимальными усилиями. Вот как они работают. Такие приложения, как DALL-E 2 и Midjourney, создаются путем извлечения миллионов изображений из открытой сети, а затем обучения алгоритмов распознаванию шаблонов и взаимосвязей в этих изображениях и созданию новых в том же стиле. Это означает, что художники, загружающие свои работы в Интернет, могут невольно помогать обучать своих алгоритмических конкурентов.

«Что отличает этот ИИ, так это то, что он явно обучен на действующих художниках», — написал в Твиттере в прошлом месяце цифровой художник Р. Дж. Палмер. «Эта штука хочет наши рабочие места, она активная антихудожница».

Даже те, кто впечатлен искусством, созданным искусственным интеллектом, обеспокоены тем, как оно создается. Энди Байо, технолог и писатель, написал в недавнем эссе, что DALL-E 2, возможно, самый шумный ИИ. Генератор изображений на рынке, был «пограничным волшебством в том, что он способен творить, но поднимает так много этических вопросов, что трудно уследить за всеми».

Г-н Аллен, обладатель голубой ленты, сказал, что сочувствует артистам, которые боятся, что ИИ инструменты лишат их работы. Но он сказал, что их гнев должен быть направлен не на людей, которые используют DALL-E 2 или Midjourney для создания произведений искусства, а на компании, которые решили заменить людей-художников искусственным интеллектом. инструменты.

— Это не должно быть обвинением самой технологии, — сказал он. «Этика не в технологии. Это в людях».

И призвал художников преодолеть свои возражения против ИИ, пусть даже только как стратегию преодоления.

— Это не остановится, — сказал мистер Аллен. «Искусство мертво, чувак. Закончилось. А.И. выиграл. Люди проиграли».

Любой может использовать этот ИИ-генератор искусства — это риск

Типа, и вы его получите. Это основная предпосылка программ ИИ для преобразования текста в изображение.

Пользователи печатают описания того, что им нравится — киборг Джо Байден с самурайским мечом; средневековый гобелен состязаний лягушек — и эти системы, обученные на огромных базах данных существующего искусства, генерируют невиданные ранее изображения, которые соответствуют этим подсказкам (более или менее). И хотя выход современных современных моделей, безусловно, не идеален, для тех, кто в восторге от этой технологии, такие недостатки незначительны по сравнению с потенциалом программного обеспечения, которое генерирует любое изображение, которое вы можете себе представить .

Однако до сих пор эти инструменты «напечатайте и вы получите» контролировались небольшим количеством хорошо финансируемых компаний, таких как OpenAI (создавшая DALL-E) и Google (создавшая Imagen). Это большие компании, которым есть что терять, и в результате они сбалансировали возможности того, что может сделать эта технология, с тем, что позволяет их корпоративная репутация.

Таким образом, для такой модели, как DALL-E, публичный доступ осуществляется через длинный список ожидания, в то время как Google Imagen полностью закрыт для публики. Вывод DALL-E также фильтруется, что затрудняет создание изображений, содержащих насилие, наготу или реалистичные лица. И, конечно же, вы должны платить. Пользователи DALL-E получают 15 изображений в месяц бесплатно, а дополнительные поколения стоят примерно 0,08 доллара за штуку. Это не дорого, но это все еще барьер.

Stable Diffusion отличается качеством своей продукции и способностью воспроизводить и комбинировать различные стили, изображения, защищенные авторским правом, и известных людей. Слева вверху — «Пропагандистский плакат Микки Мауса времен Второй мировой войны», а справа вверху — «Борис Джонсон в образе крестьянина XII века, картина маслом». Изображения: 1, 2, 3, 4 через Lexica

Stable Diffusion делает доступ к созданию нефильтрованных изображений проще, чем когда-либо на сцене: программа преобразования текста в изображение под названием Stable Diffusion, которая предлагает генерацию нефильтрованных изображений с открытым исходным кодом, которую может бесплатно использовать любой, у кого есть приличный компьютер и небольшое техническое ноу-хау. Модель была обнародована только 22 августа, но ее влияние уже распространилось, тихо и быстро. Это было воспринято арт-сообществом ИИ и осуждено многими традиционными художниками; его разобрали, возвеличили и о нем позаботились.

«Реальность такова, что это инопланетная технология, которая позволяет использовать сверхспособности», — говорит Эмад Мостак, генеральный директор Stability AI, компании, которая финансировала разработку Stable Diffusion, The Verge . «Мы видели детей в возрасте от трех до 90 лет, способных из создать впервые. Но мы также видели, как люди создают удивительно ненавистные вещи».

Хотя искусство, созданное искусственным интеллектом, уже давно набирает обороты, выпуск Stable Diffusion может стать моментом, когда технология действительно взлетит. Его можно использовать бесплатно, его легко развивать, и он создает меньше барьеров на пути того, что могут создавать пользователи. Из-за этого трудно предсказать, что произойдет дальше.

Что отличает Stable Diffusion

Ключевое отличие Stable Diffusion от других генераторов искусства на основе ИИ заключается в ориентации на открытый исходный код. Даже Midjourney — еще одна модель преобразования текста в изображение, которая создается за пределами комплекса Big Tech — не предлагает такого полного доступа к своему программному обеспечению.

Компания Stable Diffusion, Stability AI, по-разному упаковала эту технологию. Есть общедоступная демоверсия, которую может попробовать каждый (хотя она очень медленная и часто ломается). Существует быстрая и простая в использовании бета-версия программного обеспечения под названием DreamStudio (хотя оно взимает плату после определенного количества поколений изображений). И, что наиболее важно, есть полная версия модели, которую каждый может скачать и поработать с ней. Сторонние разработчики уже упростили загрузку и использование этого программного обеспечения. Например, уже есть версия для macOS с простым установщиком в один клик. (Хотя имейте в виду — для создания изображений на любом Mac требуется много времени без серьезной обработки.)

Изображение, созданное Stable Diffusion из сабреддита программного обеспечения. Точное текстовое описание, использованное для создания изображения, звучало так: «Фото Берни Сандерса в фильме «Безумный Макс: Дорога ярости» (2015), взрывы, седые волосы, очки, рваная одежда, детализированные симметричные черты лица, драматическое освещение». Изображение: Reddit/Licovoda

Именно эта открытость, по словам Мостака, позволит Stable Diffusion улучшаться быстрее, чем его конкуренты. Например, если вы заглянете в сабреддит Stable Diffusion, то увидите, что пользователи не только делятся своими любимыми изображениями (например, «Макдональдс в период Эдо, Япония» и «Берни Сандерс в фильме «Безумный Макс», которого не существует») но придумывать новые варианты использования программы и интегрировать ее в устоявшиеся творческие инструменты.

В приведенном ниже примере пользователь создал подключаемый модуль Photoshop, который использует стабильную диффузию для закрашивания своих грубых рисунков. Они начинают с изображения лесистой вершины японского холма, а затем набрасывают, где должны быть трава, деревья и небо. Затем Stable Diffusion заполняет эти пробелы, а пользователь очищает объединения вручную. Как прокомментировал один Redditor под публикацией: «Я ошеломлен тем, что выходят все удивительные проекты, а с момента релиза не прошло и недели. Мир через 6 месяцев будет совершенно другим местом».

По объяснению Мостака, открытый исходный код означает «предоставить это в руки людей, которые будут развивать и расширять эту технологию». Однако это означает передачу всех этих возможностей в руки общественности — и устранение последствий, как хороших, так и плохих.

Никак, без фильтра?

Самым существенным отличием подхода Stability AI с открытым исходным кодом является его подход к модерации без вмешательства. В отличие от DALL-E, эту модель легко использовать для создания образов насилия или сексуального характера; на котором изображены общественные деятели и знаменитости; или имитирующие изображения, защищенные авторским правом, от работ небольших художников до талисманов огромных корпораций. (Трудно понять, насколько широкий спектр изображений может генерировать Stable Diffusion, но если вам нужна какая-то идея, попробуйте ввести некоторые термины в Lexica, поисковую систему, которая очищает изображения, созданные с помощью Stable Diffusion.)

Для ясности: версии Stable Diffusion, ориентированные на потребителя, имеют несколько встроенных фильтров ключевых слов, которые не позволяют пользователям создавать контент NSFW, а также откровенно политические или насильственные изображения (например, запрещены такие слова, как «нацист» и «запекшаяся кровь»). . Но хотя эти ограничения существуют и в загружаемой модели, их можно довольно легко обойти. (См., например, пост в сабреддите Stable Diffusion под названием «Как убрать фильтр безопасности за 5 секунд».)

Stable Diffusion значительно упрощает создание изображений насилия и сексуального характера, включая изображения реальных людей

Точно так же, хотя лицензия модели с открытым исходным кодом запрещает людям использовать программное обеспечение для целого ряда грехов (включая «эксплуатацию, причинение вреда или попытку эксплуатации или причинения вреда несовершеннолетним каким-либо образом» и «генерирование или распространение достоверно ложной информации» ), после того как кто-то загрузил Stable Diffusion на свой компьютер, нет технических ограничений на то, для чего он может использовать это программное обеспечение.

Взгляд Мостака на это прямолинеен. «В конечном счете, люди несут ответственность за этичность, моральность и законность в том, как они используют эту технологию», — говорит он. «Плохие вещи, которые люди создают с его помощью […] Я думаю, что это будет очень, очень небольшой процент от общего использования».

Это практически неизведанная территория, и неясно, каковы будут последствия выпуска такой модели в дикую природу. Легко представить, сколько злонамеренных применений этой технологии может быть использовано, но это не значит, что все эти предсказания сбудутся.

Например, когда OpenAI представила свой текстовый генератор ИИ GPT-3, компания изначально ограничила доступ, опасаясь, что программное обеспечение будет использоваться для создания потока спама, фейковых новостей и пропаганды. Однако пока эти угрозы оказались преувеличенными. Поскольку доступ расширился, потоп не появился. Это не значит, что с технологией не было серьезных проблем (см., например, случай с AI Dungeon, текстовой фэнтезийной игрой на основе GPT-3, в которой пришлось ввести фильтры, чтобы ее программное обеспечение не генерировало сексуальные сцены с участием несовершеннолетних). ), но катаклизма бесконечного ИИ-спама, разжигания ненависти и т. д. до сих пор удалось избежать. (Не случайно Stability AI и помогли сделать версию GPT-3 с открытым исходным кодом.)

Стилистический, безопасный для работы пример способности Stable Diffusion генерировать изображения обнаженной натуры. Текстовые подсказки для создания этого изображения включали «мускулистого солдата, пробирающегося сквозь воду», «финского кота» и «Клода Моне». Изображение: через Lexica

С помощью Stable Diffusion наиболее заметным примером использования NSFW на сегодняшний день были пользователи, создающие порнографию. После публичного выпуска модели возник ряд субреддитов, посвященных курированию выходных данных программного обеспечения NSFW. (Хотя большинство из них с тех пор были забанены из-за политики Reddit, запрещающей порнографические дипфейки. Многие пользователи генерировали изображения обнаженных знаменитостей и общественных деятелей). Этот контент NSFW часто колеблется между гротеском и абсурдом, с обнаженными моделями, обладающими дополнительными конечностями и помещенными в физически невозможные позы. Но качество этого вывода, безусловно, улучшится в ближайшем будущем, что принесет с собой новые вопросы об этичности порно, созданного ИИ.

Также почти наверняка, например, что Stable Diffusion можно использовать для создания изображений сексуального характера с участием детей, хотя если такая деятельность и происходит, то в менее заметных уголках сети. Мостак отмечает, что это одна из областей создания изображений, которой компания активно пыталась воспрепятствовать, удалив материалы о сексуальном насилии над детьми (CSAM) из обучающих данных Stable Diffusion: «Мы удалили нелегальный контент из нашей выборки в Интернете, вот и все».

В целом, однако, позиция Mostaque заключается в том, что Stability AI не был ни легкомысленным, ни безрассудным в своем выпуске Stable Diffusion. В отличие от этого, говорит он, компания, состоящая примерно из 75 сотрудников, рассматривала возможность добавления большего количества фильтров, но пришла к выводу, что ее подход с открытым исходным кодом был лучшим. «Как только вы начинаете что-то фильтровать, где вы останавливаетесь?» он говорит.

В конечном счете, компания следует одной из самых хорошо отрепетированных (и часто критикуемых) мантр в отрасли: технологии нейтральны, а создание чего-то лучше, чем ничего. «Это подход, который мы используем, потому что мы рассматриваем эти инструменты как потенциальную инфраструктуру для развития человечества», — говорит Мостак. «Мы думаем, что положительные элементы намного перевешивают отрицательные».

Копирование художников и удаление авторских прав

Одна визуальная область, которую Stability AI не отфильтровал из своих обучающих данных, защищена авторским правом. В результате многие считают способность Stable Diffusion имитировать стиль и эстетику живых художников несостоятельной: это не только потенциальное нарушение авторских прав, но и этических норм. В раннем вирусном твите, критикующем программное обеспечение, перечислены некоторые из многих живых художников, которым модель может подражать (хотя в нем ложно утверждалось, что Stability AI «рекламирует» эту функцию).

Как и большинство современных систем искусственного интеллекта, Stable Diffusion обучается на обширном наборе данных, из которого он извлекает шаблоны и учится воспроизводить их. В данном случае это ядро обучающих данных представляет собой огромный пакет из более чем 5 миллиардов пар изображений и текстовых тегов, известный как LAION-5B, все из которых были взяты из общедоступной сети. (Стоит отметить, что LAION-5B поддерживается не самой Stability AI, а некоммерческой организацией LAION из Германии.) водяной знак «Getty Images» на некоторых изображениях. Изображение: через Lexica

Мы точно знаем, что LAION-5B содержит много контента, защищенного авторским правом. Независимый анализ 12-миллионной выборки набора данных показал, что почти половина содержащихся в нем изображений была взята всего из 100 доменов. Самым популярным был Pinterest, на который пришлось около 8,5% отобранных изображений, а следующими по величине источниками были сайты, известные размещением пользовательского контента (такие как Flickr, DeviantArt и Tumblr), и сайты стоковых фотографий, такие как Getty Images и Shutterstock. Другими словами: источники, содержащие контент, защищенный авторским правом, будь то от независимых художников или профессиональных фотографов.

Этот аспект авторского права добавляет новое измерение жалобам на то, что такие инструменты, как Stable Diffusion, отнимают работу у людей-художников. Критики говорят, что ИИ не только крадет рабочие места художников, но и делает это, незаконно используя навыки, на оттачивание которых у этих людей уходили часы и часы.

«Одними из моих первых внештатных работ были иллюстрации к карточным играм, обложки книг и обложки альбомов. Душераздирающе наблюдать, как это пространство (особенно последнее) заполняется изображениями, созданными искусственным интеллектом, и осознавать, насколько труднее стало для начинающих художников», — прокомментировал арт-директор Логан Прешоу в недавней вирусной ветке Twitter о программном обеспечении для искусственного интеллекта. «Каждый имеет право создавать искусство, но не имеет права делать это за чужой счет».

Стабильность ИИ снова заявляет о нейтральности. Мостак говорит, что извлечение общедоступных материалов из Интернета — даже контента, защищенного авторским правом — является законным как в США, так и в Великобритании (хотя это не означает, что в будущем не возникнет юридических возражений). Он также утверждает, что природа Stable Diffusion с открытым исходным кодом означает, что он и его коллеги не копят эти новые возможности, а широко делятся ими для всех.

«Как это будет выпущено?» — спрашивает Мостак. «Это создает сервис вокруг него, который мы держим в секрете, как OpenAI? Это арт-модель? Нет, это выпускается научно-исследовательским институтом как обобщенная модель, и конечный пользователь сам решает, как он ее использует. Если они используют его таким образом, который нарушает авторские права, то они нарушают закон». (Говоря, что модель выпускается «исследовательским институтом», Мостак имеет в виду тот факт, что техническая лицензия на Stable Diffusion была выпущена лабораторией CompVis Мюнхенского университета Людвига-Максимилиана, хотя Stability AI финансировал и формировал ее разработку. )

Мостак говорит, что будущие версии Stable Diffusion дадут художникам возможность загружать свои портфолио и имена, чтобы отфильтровать их влияние на вывод модели. Но, как и в случае с созданием контента NSFW, эти фильтры будут необязательными для пользователей, загружающих версию программного обеспечения с открытым исходным кодом. Другими словами: если у художников есть проблемы с генераторами искусства ИИ, имитирующими их работу, решения вряд ли придут от таких компаний, как Stability AI.

(В галерее ниже показаны результаты поиска Stable Diffusion для некоторых названных артистов.) 9

Пришло время немного теории игр пытаетесь добиться?
Сам Мостак — бывший менеджер хедж-фонда, внесший неизвестную (но, по-видимому, значительную сумму) в финансирование создания Stable Diffusion. Он дал несколько разные оценки первоначальной стоимости проекта, но они, как правило, колеблются в пределах от 600 000 до 750 000 долларов. Это большие деньги — далеко за пределами досягаемости большинства академических учреждений — но крошечная сумма по сравнению с воображаемой стоимостью конечного продукта. И Мостак ясно дает понять, что хочет, чтобы Stability AI зарабатывал много денег, придерживаясь принципов открытого исходного кода, указывая в качестве сравнения на единорогов с открытым исходным кодом на рынке баз данных.
Он также настаивает на том, что деньги не являются его самой большой заботой. Вместо этого, по его словам, он хочет добиться чего-то большего, похожего на революцию в мире ИИ: свергнуть с престола богатых корпораций-гигантов, которые строят все более крупные и дорогие системы, и заменить их более умными, быстрыми и независимыми сообществами. .
«OpenAI и все должны присоединиться к нашим сообществам и нашим экосистемам».
«Я считаю компании и организации медленным и глупым ИИ, — говорит он. «И когда мы говорим о том, что ИИ убьет нас, если он станет слишком умным, нас уже каждый день убивает бюрократия, которая действительно перемалывает нас». Выпуск Stable Diffusion как проекта с открытым исходным кодом, по его мнению, является способом перехитрить эти неуклюжие институты. «Все делают [эти модели ИИ] приватными, пока первый человек не сделает их общедоступными. С точки зрения теории игр, что происходит, когда кто-то делает их общедоступными? Все выходят на публику. OpenAI и все должны будут присоединиться к нашим сообществам и нашим экосистемам».
Форсирование этого изменения связано не только с ускорением разработки технологии, говорит Мостак, но и с распространением этих систем по всему миру. По его мнению, мир ИИ в настоящее время находится на пути к доминированию культуры и этики Силиконовой долины, но программное обеспечение с открытым исходным кодом может помочь децентрализовать это будущее. Например, в случае инструментов для создания изображений он надеется, что разные страны разработают свои собственные модели и наборы данных, чтобы «отражать разнообразие человечества», а не «монокультуру Интернета, которая в подавляющем большинстве является западной».
Это великая цель, но не менее великая, чем его описание Stable Diffusion как «принесение в мир огня богов творчества».
Теперь мир должен понять, как не обжечься.
Кража огня у богов, проиллюстрированная Stable Diffusion. (Точная подсказка: «фантастический портрет героя, похищающего огонь у богов, цифровая живопись, иллюстрация, высокое качество, фэнтези, стиль Джордана Гриммера и Грега Рутковски») Изображение: Джеймс Винсент
Исправление, четверг, 15 сентября, 12:33 по восточному времени: В статье ранее говорилось, что Stability AI поддерживает базу данных LAION-5B и выпустил исключительно модель Stable Diffusion. Это неправильно. База данных LAION-5B поддерживается благотворительной организацией LAION в Германии, в то время как модель Stable Diffusion, хотя и финансируемая и разработанная при участии Stability AI, выпущена по лицензии лаборатории CompVis в Мюнхенском университете LMU 9 в Германии.0311 .
🤖 🖼 AI Art Generator, AI Art Maker
Создавайте потрясающие произведения искусства, используя возможности искусственного интеллекта.
Опишите, что вы хотите увидеть
Выберите стиль
Космический
Киберпанк
Дополнительные параметры
Мне это очень нравится, потому что я очень люблю искусство. И ты буквально дал мне возможность стать художником. Там, где у меня не было этого раньше…
— @teecie74
Погрузитесь в мир искусств ИИ. Присоединяйтесь к одному из наших онлайн-сообществ и/или подпишитесь на наши официальные аккаунты.
Присоединяйтесь к нашим сообществам
Группа Facebook
Discord Server
SubredDit
Следуйте NightCafe
Facebook
Instagram
Twitter
Watch: Как сделать AI Art
Art Art Art Art!
Начать творить
Создать искусство, сгенерированное ИИ
NightCafe Creator — это приложение-генератор художественного произведения с использованием нескольких методов создания художественного изображения ИИ. С помощью нейронного переноса стиля вы можете превратить свою фотографию в шедевр. Используя искусственный интеллект для преобразования текста в изображение, вы можете создавать иллюстрации только из текстовой подсказки.
Ваши творения принадлежат вам, и вы можете делать с ними все, что пожелаете (при условии, что вы являетесь владельцем авторских прав на любые входные изображения или имеете на это разрешение, а также в соответствии с законами об авторском праве в вашей юрисдикции).
Приложение NightCafe Creator AI Art Generator доступно бесплатно в Интернете, а также на телефонах Android и iOS — просто сохраните его на главном экране, чтобы установить приложение.
Начать создавать
Спасибо за это, опыт, который я получил сегодня с NightCafe, дал мне огромный прилив дофамина, такой же, как я получил с первых дней Интернета!
Я не могу перестать смотреть на все работы и придумывать свои! это было так весело!
— @Itsmetrenton
Интернет и мобильные устройства
Создавайте произведения искусства, созданные искусственным интеллектом, на своем ноутбуке, планшете или мобильном телефоне и просматривайте их на любом устройстве.
Уникальные инструменты для творчества
Смешайте несколько стилей, чтобы создать что-то новое. Используйте VQGAN+CLIP для создания изображения из текстовой подсказки.
Бесплатное использование
Создавайте, настраивайте и загружайте до 5 произведений искусства в день бесплатно. Никаких водяных знаков!
Инструменты для опытных пользователей
Массовое создание и массовая загрузка. Дублируйте, развивайте и улучшайте свои творения.
Это самое интересное, что я когда-либо видел в Интернете за долгое время
— u/DocJawbone на Reddit
Приходите за генератором ИИ-арта…
Оставайтесь в сообществе ИИ-арта!
Поделитесь своими творениями с сообществом, затем просматривайте, ставьте лайки и комментируйте творения других художников. Вы даже можете подписаться на своих любимых художников, чтобы увидеть их работы в своей личной ленте.
Сообщество NightCafe — это позитивная, поддерживающая и готовая помочь группа людей из всех слоев общества, которых объединяет только одно — им нравится создавать искусство с помощью ИИ!
Присоединяйтесь к нашему сообществу AI Art в Discord или просто пролистайте последние творения и оставьте комментарий в поддержку понравившихся работ.
Последние творения
Возможности AI Art Generator
NightCafe Creator с первого взгляда
🖼️ Произведено AI Artworks: 29M+
🧠 AI Algorithms: Style transfer, text-to-image
🎨 Style Choices: Unlimited styles, sensible presets
💸 Cost Per Artwork: До 5 бесплатных в день
Это увлекательно и невероятно. Мне так нравится работать с инструментами для генеративного искусства, и это – следующий уровень!
— @makeanything
Часто задаваемые вопросы по AI Art Generator
Часто задаваемые вопросы об AI Art и NightCafe Creator
🎨 Как мне создать AI Art Generator?
Используя NightCafe, вы можете создавать произведения искусства, созданные искусственным интеллектом, несколькими различными способами. Начните с нажатия кнопки «Создать» в главном меню, затем выберите способ создания. Все методы создания просты в использовании, и все они позволят вам создавать невероятные произведения искусства, созданные искусственным интеллектом.
💸 Стоит ли использовать NightCafe Creator за деньги?
Вы можете использовать NightCafe Creator для создания до 5 бесплатных произведений искусства в день. Вы также можете зарабатывать кредиты, участвуя в сообществе. Вы платите только в том случае, если хотите напечатать одно из своих творений или за расширенное использование создателя.
🛠️ Есть ли у NightCafe Creator какие-то уникальные функции?
Да! У нас есть мощные инструменты, которых нет ни в одном другом приложении AI Art. К ним относятся такие вещи, как изображения в нескольких стилях, массовое создание, массовая загрузка, пользовательские семена и т. д.
🧠 Какие алгоритмы искусственного интеллекта использует NightCafe?
NightCafe использует несколько художественных алгоритмов ИИ. В настоящее время мы предлагаем 3 различных алгоритма создания изображений с помощью ИИ: передача нейронного стиля, VQGAN+CLIP и диффузия под управлением CLIP. Мы также используем другой алгоритм искусственного интеллекта для улучшения ваших творений, который называется Real-ESRGAN.
🤖 Что такое VQGAN+CLIP?
VQGAN и CLIP — это два современных алгоритма машинного обучения, которые работают вместе для создания изображений из текстовой подсказки. VQGAN — это генератор изображений, и CLIP может оценить, насколько хорошо изображение соответствует вашему запросу. CLIP сообщает VQGAN, как сделать изображение более похожим на текстовую подсказку. Повторите этот процесс несколько сотен раз, и вы получите невероятные результаты!
📱 На каких платформах работает NightCafe Creator?
NightCafe Creator работает в Интернете и может быть установлен на главный экран вашего iPhone, телефона Android или планшета.
🖼️ Принадлежат ли мне произведения искусства, которые я создаю?
Да! Пока вы владеете исходными активами (или имеете разрешение на их использование), мы передаем все авторские права вам — создателю. Пожалуйста, ознакомьтесь с законами об авторском праве в вашей стране для подтверждения. Законы об авторском праве на искусство, созданное искусственным интеллектом, все еще развиваются, и в некоторых юрисдикциях авторские права вообще не предоставляются.
Распечатайте ваши творения
Позвольте нам напечатать ваше творение! Мы используем искусственный интеллект, чтобы повысить качество вашего изображения до качества печати, вручную обрезать его до соотношения сторон выбранного вами размера (убедившись, что объект находится в кадре), а затем распечатать и доставить его к вашей двери.
Принты музейного качества, выполнены на плотной и прочной матовой бумаге. Добавьте замечательный акцент в свою комнату и офис с помощью этих плакатов, которые обязательно украсят любую обстановку.
Посмотрите некоторые из лучших произведений искусства, созданных искусственным интеллектом, которые люди создали с помощью NightCafe Creator.
PRO
Soda Khan @SodaKhan
месяц назад·🪙💰💸 20
Купить Распечатать
Я попросил огнедышащего кролика…
StableShortThumb 6x
если это не принесет мне больше ежемесячно… ничего не выйдет.
MintЭтот кролик определенно дышит не в ту сторону💀но….любому, кто сделал интересную работу😅
Soda Khanhe должно быть что-то настоящее 🥵
Прочитать все 303 комментария
PRO
Arachnix @Arachnix
25 days ago · 🪙 1
My House
StableShortLow Res2x
uWuWaIfU<3 это на самом деле слишком хорошо, теперь вы выигрываете интернет
Fabric8erЭто безумно хорошо!!!
Прочтите все 106 комментариев
Pro
Skyeithse @skyeithse
23 дня назад
после апокалиптического мира, разрушенного H P Lovcraft arsed
Stablemediumlow Res1953.1x
Thomas Wow, теперь, что является Badass
Skye. все 69 комментариев
PRO
Arachnix @arachnix
25 дней назад
Лучшие друзья
StableShortlow Res2x
Это намного лучше, чем я ожидал LMAO
Allison Tennessen 67 комментариев
Pro
Arachnix @arachnix
23 дня назад · 🪙💰💸 10
Daedric Warrior
Stableshortlow Res2x
Lawrencelot❤👌🔥
GHXSTDXGWOWWWW
0003 Прочитать все 45 комментариев
PRO
Soda Khan @SodaKhan
месяц назад· 🪙💰💸 10
Мед Элементаль Существо
StableShortLow Res6x
9 Многоцветный может быть его собственный элемент. Это не твердое вещество, но и не настоящая жидкость. Твердое, жидкое, газообразное, плазменное… мед.
Прочитать все 50 комментариев
Присоединяйтесь к нам в Discord
Обсуждайте быструю разработку, продажу своих рисунков, любимые модификаторы, советы по созданию и многое другое в NightCafe Lounge.
Присоединяйтесь к Discord
Любимое пользователями
Прочтите этот отзыв от Джонатана
Я был очень доволен посещением NightCafe. После прочтения информации о нейронной сети OpenAI DALL-E и просмотра творческих произведений, которые она смогла реализовать, я задумался, продаются ли где-нибудь произведения искусства, созданные искусственным интеллектом. Идея компьютера, создающего что-то новое, художественное и часто красивое, настолько новая концепция, что я подумал, что это будет хорошая тема для разговора, которую можно повесить на стену.
Тогда я был приятно удивлен, обнаружив NightCafe, в котором не только была тщательно подобранная подборка принтов, созданных искусственным интеллектом, но и давалась возможность устанавливать параметры для моих собственных произведений. Креативный инструмент был невероятно прост в использовании и позволил мне «заказать» единственную в своем роде работу за пару минут и несколько кликов. ИИ смог объединить японский стиль укиё-э с логотипом «Торонто Рэпторс» и фотографией Майкла Фелпса и создать что-то увлекательное, уникальное и достойное демонстрации.
Для меня такая же степень творческой свободы и качество исполнения в совершенно новом произведении искусства обойдутся мне в сотни комиссионных и как минимум недели ожидания.
Технология NightCafe дает каждому возможность создать что-то особенное, даже если он не особо склонен к творчеству, и делает это по доступной цене.
Мне очень понравился опыт создания произведений, а также возможность увидеть другие произведения искусства, созданные членами сообщества. Вскоре вы легко сможете заполнить выставочную галерею качественными произведениями сообщества NightCafe!
— Джонатан
Начать создавать
Советы по созданию
Прочтите наши лучшие советы по созданию потрясающих искусств, созданных искусственным интеллектом, в блоге NightCafe.
Прочтите советы
Передовые технологии
Генератор изображений Stable Diffusion
Stable Diffusion — это новейший современный генератор изображений AI, который доступен здесь, в NightCafe. Если вы слышали о DALL-E или Google Imagen, они похожи на них, но с открытым исходным кодом.
Стабильная диффузия
Текст-в-изображение AI Art
Стабильная диффузия, VQGAN+CLIP и многое другое
Самый популярный метод создания — создавайте рисунки только из текстовой подсказки! Используйте передовые алгоритмы машинного обучения, такие как Stable Diffusion, VQGAN+CLIP или CLIP-Guided Diffusion, чтобы создавать новые произведения искусства, просто спросив!
Искусство преобразования текста в изображение
Приложение для переноса нейронного стиля
«Перенос нейронного стиля» — это метод машинного обучения, который включает обучение глубокой нейронной сети для определения уникальных стилистических характеристик «стиля» изображения (например, масляного картина или фотография текстуры), а затем применить эти характеристики к «входному» изображению.