Google AI Edge Eloquent для iOS включает локальное распознавание речи, улучшение текста и дополнительное облако Gemini Cloud.

Google загрузил новое приложение в App Store и сделал это без какой-либо помпы, как если бы это было всего лишь незначительное любопытство. Между тем, дело обстоит гораздо серьезнее. Google AI Edge Eloquent пытается поразить не своим масштабом, а своей полезностью. Он записывает речь, очищает ее от ошибок и возвращает текст, который можно сразу вставить в электронное письмо, заметку или любой мессенджер. Это шаги, которые могут вызвать наибольшие потрясения на рынке.

Google показал не очередную игрушку искусственного интеллекта, а вполне конкретное доказательство того, что локальные модели начинают терять смысл в подписках для простых продуктивных задач.

Apple Vision Pro с официальной ссылкой Steam. Valve открывает VisionOS для библиотеки игр для ПК

Самое интересное в Google AI Edge Eloquent — не сама диктовка, а то, как ловко Google смещает акцент с впечатляющего ИИ на повседневное удобство. Приложение работает на iPhone, использует модели Gemma, запускаемые локально, и может переписывать заявление в режиме реального времени, а затем удалять различные включения, такие как ууу, эээ, амммавтозамена в середине предложения и другие следы хаоса в речи. Он также добавляет сокращение, удлинение, формализацию и выделение наиболее важных моментов. Для пользователя это означает меньше ручного редактирования и меньше отправки необработанного, разорванного текста. Однако есть одна загвоздка. Сегодня это практически англоязычный инструмент, а полная интеграция клавиатуры с iOS еще впереди.

Это не очередной чат-бот для геймеров. Valve готовит инструмент SteamGPT, который может изменить способ работы поддержки Steam

На фоне конкурентов шаг Google выглядит исключительно агрессивным, поскольку поражает не своей функцией, а своей бизнес-моделью. Wispr Flow предлагает бесплатный план для iPhone с лимитом в 1000 слов в неделю и план Pro за 15 долларов в месяц, в то время как Google предлагает отсутствие комиссий и работу в автономном режиме с самого начала. В свою очередь, системный диктант Apple проще и не так четко разъясняет речь. Это хорошо вписывается в темы, которые мы затронули с Gemma 4, а также с реализацией Gemini в Android 16. Предполагается, что ИИ будет перемещаться из облака на устройства и выполнять конкретные задачи быстрее, дешевле и с меньшей зависимостью от серверов.

Ubuntu 26.04 LTS — новая версия системы имеет более высокие требования к оборудованию, чем Windows 11, в том числе: спасибо GNOME 50

В долгосрочной перспективе это может привести к появлению чего-то большего, чем просто еще одно нишевое приложение. Если Google сохранит свои темпы развития, платным сервисам диктовки придется делать больше, чем просто расшифровывать голос в текст. В то же время оффлайн-пароль не решает всего вопроса конфиденциальности, поскольку опциональное подключение аккаунта Google и метки конфиденциальности в App Store напоминают нам, что локальная обработка не всегда означает нулевую телеметрию. Тем не менее, направление ясно. Рынок созревает до того момента, когда пользователь будет не спрашивать, работает ли ИИ в телефоне, а почему за него все равно нужно доплачивать каждый месяц.

Источник: Apple App Store, TechCrunch, Google DeepMind, TechSkillz 99-го уровня (YT).