Gemini 2.0 — дебют нового семейства ИИ-моделей от Google. Улучшенные мультимодальные возможности и глубокие исследования

Google только что представил новое семейство моделей искусственного интеллекта, которые в конечном итоге откроют новые возможности. Имеет, потому что на данный момент в публичном доступе находится только один вариант и он не обеспечивает доступ ко всем функциям. Gemini 2.0 предложит расширенные собственные мультимодальные возможности, а эта серия позволит нам использовать агентов искусственного интеллекта. Мы можем рассчитывать на лучшую производительность и меньшие задержки, чем раньше.

Новая модельная серия AI Gemini 2.0 теперь частично доступна. Более быстрая работа сопровождается расширенными мультимодальными возможностями. Вся семья породит ИИ-агентов и помощника, который будет расследовать за нас сложные вопросы.

Gemini — Google представляет новую мультимодальную модель искусственного интеллекта. Его возможности превосходят ChatGPT.

Из нового семейства Gemini 2.0 в настоящее время доступен только Gemini 2.0 Flash Experimental. Мы можем использовать его через чат-бота Gemini, выбрав соответствующую опцию в левом верхнем углу. Он оптимизирован для чата и вскоре будет доступен и в мобильном приложении. Кроме того, разработчики могут получить к нему доступ через Gemini API в Google AI Studio и Vertex AI. В то же время представлен новый Multimodal Live API, который способен обрабатывать данные в реальном времени и позволяет использовать несколько подключенных инструментов. Так чего же нам ожидать от новой версии?

Gemini 1.5 Flash — новая версия чат-бота доступна бесплатно. Google борется с галлюцинациями и увеличивает возможности сервиса

Предполагается, что Gemini 2.0 Flash будет работать в два раза быстрее, чем Gemini 1.5 Pro, и при этом покажет лучшие результаты в некоторых тестах. Отличается поддержкой мультимодальных входных и выходных данных. Таким образом, он может анализировать изображения, видео и звуки, а также способен «генерировать изображения в сочетании с текстом и управляемым звуком TTS на нескольких языках». Для него не будет проблемой воспользоваться поисковой системой Google, выполнить определенный код или запустить внешние функции, которые будут указаны пользователем. Кроме того, доступна опция «Глубокое исследование» (только для пользователей Gemini Advanced), благодаря которой мы сможем исследовать более сложные проблемы и получать по ним отчеты. Ожидается, что Gemini 2.0 Flash станет общедоступным в январе 2025 года, по крайней мере, таков план Google. Экспериментальная версия чат-бота Gemini, похоже, не предлагает всех обсуждаемых функций. Gemini 2.0 также будет использоваться для создания ИИ-агентов, но об этом мы сможем прочитать в следующем материале.

Источник: Гугл