Google представляет Whisk. Вы устали от утомительного написания подсказок для генераторов изображений? Новинка создана для вас
Несмотря на то, что мы уже довольно давно умеем генерировать изображения из текстовых описаний, для получения удовлетворительных результатов часто приходится тратить некоторое время на создание соответствующей подсказки. Этот процесс требует изучения нескольких правил, и это дополнительное обучение, которое многие люди могут не захотеть делать. Google запускает новый сервис, который упростит все шаги. Вместо текстовых описаний вы можете использовать изображения, чтобы обозначить основные аспекты.
Google собирается сделать процесс создания изображений очень простым. С Whisk вам больше не нужно писать «стену текста», чтобы определить все аспекты вашей графики — просто используйте эталонные изображения.
Новый генератор видео 4K от Google может оказаться лучше, чем Sora от OpenAI. Компания также улучшила модель изображения Imagen 3.
Новый продукт все еще находится на ранней стадии, и доступность ограничена США — хотя это только теория, так как все, что вам нужно сделать, это использовать VPN, и сервис Whisk будет открыт для вас и, что интересно, почти полностью. на польском языке. В чем же дело? Используя конкретные изображения, мы должны определить стиль, сцену и тему создаваемой графики — она может быть создана в трех «пропорциях»: пейзажной, портретной или квадратной. Whisk основан на улучшенной модели изображения Imagen 3. Решение извлекает основные функции из загружаемых нами изображений, создает расширенное описание и генерирует выходные графики. Поэтому он не всегда будет создавать то, что мы ожидаем, поскольку он не строго придерживается заданных шаблонов, но после создания изображения мы можем просмотреть его подсказку и изменить ее, хотя перед этим процессом мы можем добавить дополнительную информацию. Если захотим, то еще можем описать стиль, сцену и тему в тексте. Так что возможностей много.
Veo — новый генератор видео, использующий возможности искусственного интеллекта от Google. Грядёт первый серьёзный конкурент Соры от OpenAI
Результаты более чем удовлетворительные, в чем мы можем убедиться, посмотрев прилагаемые примеры. Если у нас нет идеи, мы можем использовать три случайных графика, которые определят упомянутые выше аспекты. Хотим ли мы превратить стиль реалистичной фотографии автомобиля в стиль комиксов? Без проблем. Или, может быть, мы намереваемся изменить декорации для какой-то конкретной вещи, персонажа или животного, но все это должно быть не очень реалистично? Этот процесс также не вызовет у нас особых затруднений. Whisk — действительно интересный сервис, который обязательно стоит попробовать. Если мы ищем бесплатный VPN, который позволит нам подключаться к зарубежным серверам, стоит попробовать TunnelBear (лично я пользуюсь им уже давно, так как каждый месяц вы бесплатно получаете 2 ГБ — и ведь , в случае с Whisk вам просто нужно подключиться к моменту с сервером в США, а после входа в сервис вы можете от него отключиться).
Большинство «входных» изображений взято с Pixabay, одно — скриншот из видеоигры, другое — от Google, а последний пример основан на случайных изображениях из Whisk.
Источник: Гугл