Microsoft наконец-то продемонстрировала собственный ИИ. Генератор изображений MAI-Image-1 уже атакует конкурентов и занимает 9 место в рейтинге

Рынок технологий уже несколько месяцев обсуждает MAI-1, мощную языковую модель Microsoft, которая должна была бросить вызов доминированию OpenAI. Тем временем гигант из Редмонда вместо того, чтобы раскрыть все свои карты, сделал неожиданный ход. Без помпы и громких заявлений он представил на публичное тестирование модель MAI-Image-1. Это не конкурент GPT-4, по крайней мере, не прямой конкурент. Это специализированный блок для генерации изображений.

MAI-Image-1 — это первый шаг Microsoft к полной технологической независимости в области искусственного интеллекта. После своего дебюта эта модель заняла 9 место в престижном рейтинге LMArena.

Это конец фотошопа? Google выпускает Nano Banana на всех своих платформах. ИИ изменит способ редактирования фотографий

MAI-Image-1 был полностью создан в лабораториях Microsoft AI как ответ на растущие потребности создателей и в то же время манифест технологической независимости компании. Модель дебютировала с результатом 1096 баллов в рейтинге LMArena, уступив сразу таким признанным гигантам, как Google Gemini-2.5-Flash или Seedream-3, и в то же время опередив многие известные модели-конкуренты. Важнейшим преимуществом MAI-Image-1 является сочетание скорости и качества фотореализма. Microsoft намеренно сосредоточилась на создании изображений с высоким уровнем реализма, уделяя особое внимание правильному воспроизведению освещения, отражений, рассеянного света и сложных световых эффектов. Это все равно, что перейти с компактной камеры на зеркальную. Разница в качестве детализации видна сразу. Компания сосредоточилась на строгом отборе данных, то есть тщательном отборе обучающих данных, чтобы избежать общих, повторяемых результатов, типичных для многих конкурирующих моделей. Вместо создания тысяч одинаковых изображений MAI-Image-1 призван предложить настоящее визуальное разнообразие и практическую ценность для профессионалов.

Видеогенератор Sora 2 использует лазейки в политике конфиденциальности для создания дипфейков умерших звезд музыки и кино.

Модель является третьим элементом расширенной экосистемы искусственного интеллекта Microsoft, которая ранее была дополнена MAI-1-preview (текстовая модель, состоящая из нескольких экспертов, обученная на 15 000 системах NVIDIA H100) и MAI-Voice-1 для генерации речи. Эта стратегия похожа на создание полного набора инструментов. Каждый элемент имеет свою специализацию, но все они работают вместе под одним видением. Самой большой проблемой для MAI-Image-1 станет конкуренция с Midjourney, известной своим художественным стилем, Stable Diffusion, предлагающей открытые решения, и DALL-E от OpenAI. Каждая из этих моделей имеет свои сильные стороны. Midjourney в креативности, Stable Diffusion в доступности, DALL-E в универсальности. Microsoft фокусируется на скорости и фотореалистичности как своих отличительных преимуществах. В долгосрочной перспективе MAI-Image-1 может определить новый стандарт в отрасли, где важно не только конечное качество, но и эффективность творческого процесса. Возможность быстро воплощать идеи и передавать результаты в другие инструменты — это функциональность, которая нужна профессионалам. Если Microsoft выполнит свои обещания по интеграции со своими собственными продуктами, MAI-Image-1 может стать не просто генератором изображений, но и важной частью рабочего процесса миллионов пользователей Office и инструментов разработчика.

Источник: Microsoft ИИ.