Генерация музыки из текста и аудио. OpenAI входит в экосистему звука AI после успеха Sora и будет конкурировать с Suno и Lyria
Едва улеглась пыль после знаменитой премьеры модели Sora, способной создавать реалистичные короткометражки, а у OpenAI уже появилась другая цель. Компания, совершившая революцию в мире текста и изображений, потихоньку разрабатывает мощный инструмент, который позволит создавать целые песни и инструментальное сопровождение на основе простых текстовых или аудиокоманд. Увидим ли мы «Сору для ушей», которая изменит способы создания саундтреков к видео, рекламных джинглов и песен?
OpenAI после успеха текстовых и видеомоделей агрессивно входит в сегмент генерации музыки с использованием ИИ, что усилит рыночную борьбу с такими пионерами, как Suno и Udio, и гигантами, такими как Google Lyria.
Модель OpenAI Sora 2 с Cameo позволяет вставлять себя в любое видео AI. Посмотрите, как это работает на практике
OpenAI, недавно оцененная в рекордные 500 миллиардов долларов, не замедляет темпы своего расширения. После успеха видеогенератора Sora, который всего за пять дней скачали миллион пользователей, создатели ChatGPT готовят очередной ход, на этот раз на музыкальный рынок. По данным The Information, OpenAI работает над технологией генерации музыки из текстовых и аудиоподсказок, что может напрямую угрожать таким стартапам, как Suno или Udio. Хотя компания уже имеет опыт работы в этой области со своими моделями MuseNet и Jukebox, ожидается, что новый проект будет гораздо более продвинутым и коммерциализированным. OpenAI работает с отдельными студентами престижной Джульярдской школы в Нью-Йорке, чтобы комментировать музыкальные партитуры, которые могут служить обучающими данными для будущей модели. Однако стоит прояснить важный вопрос. Сам университет официально опроверг институциональное сотрудничество с компанией, подчеркнув, что в ней участвовали только избранные студенты, действовавшие самостоятельно. Эта неточность вызвала волну дезинформации в СМИ, ошибочно предположивших официальное партнерство со знаменитой музыкальной школой.
Новая политика OpenAI. ChatGPT сможет генерировать эротический контент после внедрения системы проверки возраста
Новый инструмент позволит пользователям создавать музыку на основе текстовых описаний или аудиосэмплов. OpenAI якобы тестирует такие функции, как добавление гитарного аккомпанемента к существующим вокальным трекам и создание саундтреков к видео. Это выходит далеко за рамки текущих возможностей ChatGPT, который может только писать тексты или последовательности аккордов, но не создает полноценные музыкальные произведения с вокалом и инструментами. Для сравнения: стартап Suno, основанный всего три года назад, сейчас получает около 150 миллионов долларов годового дохода от подписок на свой музыкальный генератор. Это четырехкратный рост по сравнению с прошлым годом, что показывает масштаб рыночного спроса на подобные технологии. OpenAI ясно видит этот потенциал. Компания отстает от Google, который в мае 2024 года выпустил второе поколение своей модели Lyria, доступной через Google Cloud для бизнес-клиентов, включая рекламные агентства.
Новая политика OpenAI. ChatGPT сможет генерировать эротический контент после внедрения системы проверки возраста
Остается проблема авторских прав, которая уже вызывает бурю. RIAA, которая представляет крупные звукозаписывающие компании Universal Music Group, Sony и Warner Bros., в июне 2024 года подала в суд на Suno и Udio, обвинив их в обучении моделей на защищенных песнях без согласия или компенсации. Каждая явно нарушенная работа может стоить до 150 000 злотых. долларов компенсации, которая потенциально исчисляется миллиардами. OpenAI осознает эту угрозу. Генеральный директор Сэм Альтман уже заявил о готовности делиться доходами с правообладателями, а после премьеры «Соры» компания заблокировала возможность создавать видеоролики с историческими личностями по требованию наследников. Остается вопрос о форме реализации. Будет ли генерация музыки идти напрямую в ChatGPT или Sora, или OpenAI создаст отдельное приложение. У компании уже было две музыкальные модели: MuseNet 2019 года и Jukebox 2020 года, но ни одна из них не была коммерчески доступна пользователям. На этот раз ставки выше. Имея более 800 миллионов пользователей и растущую потребность в диверсификации доходов, OpenAI не может позволить себе отставать от конкурентов в быстро растущей индустрии генеративного искусственного интеллекта.
Регуляторы США хотят получить от OpenAI, Meta и Character.AI информацию о защите чат-ботов для молодых пользователей
Ситуация напоминает гонку вооружений. Каждая крупная технологическая компания старается охватить как можно больше аспектов цифрового творчества. OpenAI позиционирует себя как универсальная платформа для авторов: от текста, изображений и видео до музыки. Это рискованная стратегия, поскольку она требует совершенства во всех областях, но потенциально она является самой прибыльной. Если создатель сможет создать полноценную видеопродукцию с музыкой, не выходя из экосистемы OpenAI, ценность платформы для пользователя возрастет во много раз.
Источник: Информация