Google предоставляет VaultGemma 1B, которая является первой языковой моделью с полной защитой конфиденциальности с использованием Diffferent Private

Пользователи и компании все больше задаются вопросом, является ли информация, обработанная с помощью Advanced Algoritms, полностью безопасной. В ответ на эти технологические страхи Гиганты ищут новые методы обучения моделей, которые сведут к минимуму риск утечки конфиденциальной информации. Существуют решения со встроенными защитными механизмами на фундаментальном уровне, которые могут полностью изменить подход к созданию ИИ.

Vaultgemma представляет собой значительный шаг вперед в создании искусственного интеллекта, который также является мощным и частным с нуля — сказано Google Research.

Анализ влияния обзоров Google AI на органическое движение. Снижение CTR на 19,4 процента в польских поисковых системах в соответствии с Senuto

Google представила Vaultgemma, последнюю крупную языковую модель из семейства Gemma, которая была разработана для максимальной защиты конфиденциальности данных. Это модель с размером 1,1 миллиарда параметров, наиболее важной особенностью которого является использование дифференциальной конфиденциальности (по -разному частной) во время обучения. Этот метод состоит в том, чтобы сознательно добавить точно рассчитанную статистическую ажиотаж к учебным данным. В результате модель изучает общие закономерности и зависимости, но она не может запомнить или восстановить конкретную отдельную информацию, которая использовалась для обучения. Это дает математическую гарантию о том, что конфиденциальные данные не протекают через сгенерированные ответы. Новая модель является значительным шагом вперед в контексте ответственного развития ИИ. Тем не менее, VaultGemma направляет внимание на другой, одинаково важный аспект, то есть безопасность. Процесс обучения основан на алгоритме DP-SGD (дифференциально частный стохастический градиент спуск), который интегрирует защитные механизмы на каждом этапе обучения. Благодаря этому модель безопасна с нуля, и не только дополнительные фильтры, применяемые к готовому решению. Это ответ на растущую обеспокоенность по поводу потенциального использования частной информации с помощью систем искусственного интеллекта.

Google в судебных заявлениях о том, что открытый интернет умирает. И до недавнего времени они заверили, что все процветает, и все хорошо

Конечно, такая сильная защита конфиденциальности имеет свою цену. Использование дифференциальной конфиденциальности связано с некоторым компромиссом с точки зрения производительности. Тесты показывают, что Vaultgemma, хотя и компетентная, не соответствует последним моделям аналогичного размера, которые не имеют такой безопасности с точки зрения точности. Его возможности сопоставимы со стандартными моделями нескольких лет назад. Таким образом, это не инструмент, созданный для конкуренции в рейтинге производительности, а специализированное решение для конкретных приложений, где конфиденциальность данных является абсолютным приоритетом. Работа с конфиденциальными данными будет основной областью приложений VaultGemma. Эта модель может быть безопасно настроена (точная настройка) на частных наборах данных в таких секторах, как медицина, финансы или научные исследования, без риска, что конфиденциальная информация будет запоминалась, а затем случайно раскрыта. Google, предоставляя VaultGemma в качестве открытой модели, дает разработчикам и исследователям мощный инструмент для создания более безопасных приложений для ИИ. Это показывает, что высокая полезность и сильная гарантия конфиденциальности не должны быть взаимоисключающими.

Источник: Google Research