Мета отложил премьеру LLAM 4. Технические проблемы в мультимодальном развитии AI замедляют технологическую гонку

AI Meta должна была революционизировать рынок благодаря LLAM 4, но планы были отложены. Что стоит за проблемами с флагманской моделью Бегемота? Является ли это временной школьной или сигналом более глубоких проблем в гонке ИИ? Тема вызывает эмоции, потому что мета конкурирует с такими гигантами, как Openai и Google, и на карту поставлено будущее технологий. Есть ли в этом бою с открытым исходным кодом? Как вы влияете на инновации ИИ и что это значит для пользователей и разработчиков.
Llama 4 должен был стать прорывом, но трудности с производительностью заставили нас снова взглянуть на наш подход — Meta AI Engineer.
Meta AI бросает вызов Chatgpt. Новое приложение с каналом Discover теперь доступно на Android и iOS
Финишная черта борется с серьезными проблемами при создании своей флагманской модели LLAM 4 Behemoth, которая заставила компанию отложить свою премьеру, первоначально запланированную весной 2025 года. Согласно The Wall Street Journal, модель не соответствовала ожиданиям в самых важных тестах, особенно в задачах, требующих рассуждения и математических расчетов. Это вызвало разочарование среди руководства, а также разговоры о потенциальных изменениях в команде искусственного интеллекта. Премьера была перенесена на осень или позже, в то время как в апреле 2025 года уже были выпущены меньшие модели LLAM 4, Scout и Maverick, предлагая мультимодальные возможности и контекст для 10 миллионов токенов. Meta AI подчеркивает, что Llama 4 использует архитектуру смешанных экспертов (MOE) и «раннего слияния» для интеграции текста, изображений и видео. Это должно было сделать бегемот одной из самых мощных моделей в мире. Тем не менее, это, вероятно, производительность производительности в таких задачах, как голосовые разговоры у ученого, аналогичную естественной, а также конкуренции со стороны OpenNai и DeepSeek, которые предлагают более эффективные модели, заставили мета переоценить стратегию. Например, DeepSeek R-1 достигает результатов, сравнимых с GPT-4 с гораздо более низкими затратами, и это увеличивает давление на отделку. Компания, несмотря на трудности, подчеркивает ее участие в открытом исходном коде, хотя лицензия LLAM 4 накладывает ограничения, например, Для компаний с более чем 700 миллионами пользователей в месяц. Это вызывает противоречие в сообществе разработчиков.
Мета-очки из лучей с ИИ с функциями ИИ. Живые переводы и интеграция с Instagram доступны в последующих странах
Задержка бегемота LLAM 4 поднимает вопросы о будущем финиша в гонке ИИ и последствиях для пользователей и разработчиков. С одной стороны, модели разведчиков и индивидуализации, доступные на таких платформах, как обнимание лица или коллега AWS, предлагают впечатляющие возможности, такие как обслуживание 12 языков и анализ больших объемов данных, что делает их привлекательными для предприятий и исследователей. С другой стороны, проблемы бегемота указывают на трудности в масштабировании мультимодальных моделей искусственного интеллекта, которые должны конкурировать с такими лидерами, как GPT-4O или Gemini 2.0. Придает ли подход с открытым исходным кодом, несмотря на ограничения лицензии, все еще дает преимущество перед закрытыми моделями, или компания теряет позиции для более гибких конкурентов, таких как DeepSeek? Должны ли пользователи бояться, что задержки повлияют на инновации в мета -приложениях, таких как WhatsApp или Instagram? Или это шанс для других игроков доминировать на рынке? Также стоит рассмотреть этические аспекты. Является ли стремление к все большему количеству моделей, таких как бегемот с 2 триллионами параметров, сбалансированным с точки зрения затрат и воздействия на окружающую среду? Обсуждение по этим вопросам может помочь определить, сколько мы зависим от быстрого прогресса в ИИ и сможет ли финиш восстановить положение лидера.
https://www.youtube.com/watch?v=beoax3cxte8
Источник: WSJ, Engadget, Meta