Предложен новый метод создания нейронных сетей из логических элементов.
Нейронные сети, запрограммированные непосредственно в компьютерное оборудование, смогут распознавать изображения быстрее и с гораздо меньшим энергопотреблением, чем нейронные сети, на которых работает большинство современных моделей искусственного интеллекта. Об этом рассказали на конференции в Ванкувере (Канада) специалисты из Стэнфорда. Они разработали стратегию создания быстрых и экономичных нейронных сетей из логических элементов.
Нейронные сети состоят из так называемых перцептроны – сильно упрощенные модели нейронов человеческого мозга. Когда их много, они обладают большими возможностями, но и потребляют огромное количество энергии. Более того, перцептроны — это всего лишь программная абстракция: запуск сети перцептронов на одном графическом процессоре требует перевода этой сети на аппаратный язык, что требует времени и энергии. Если сеть построена непосредственно из аппаратных компонентов, эти затраты можно сократить. Если нейронные сети можно будет встроить непосредственно в микрочипы смартфонов и других устройств, объем трафика между компьютерами и серверами значительно сократится.
Феликс Питерсен представил свою стратегию на конференции по машинному обучению NeurIPS. Он разработал нейронную сеть, состоящую из логических элементов — основных элементов вычислений. Каждый затвор, в свою очередь, состоит всего из нескольких транзисторов. Такая сеть логических элементов работает быстрее и требует в сотни и тысячи раз меньше энергии.
Конечно, такая сеть гораздо хуже справляется с задачами маркировки изображений, чем обычные нейронные сети. Однако авторы концепции считают, что такой подход откроет интересные возможности для машинного обучения, пишет Technology Review.
Не все участники конференции согласились с этим выводом. Фариназ Кушанфар из Калифорнийского университета в Сан-Диего заявила, что не уверена в способности сетей такого типа выполнять практические задачи. «Это забавная идея, но я не знаю, насколько хорошо она масштабируется.сказала она. И добавил, что такую сеть можно обучить только аппроксимацией, методом релаксации, а аппроксимации могут вводить в заблуждение.
Тем не менее, Петерсон настроен оптимистично и намерен продолжить изучение возможностей сетей, построенных из логических элементов. Он намерен создать «базовую аппаратную модель»: мощную универсальную сеть распознавания изображений, которую можно будет интегрировать в компьютерные чипы смартфонов и компьютеров.
«Это может привести к огромной энергетической выгоде», — говорит Петерсен. Если эти сети смогут эффективно восстанавливать, например, фотографии и видео из материала низкого разрешения, то между серверами и персональными устройствами потребуется отправлять гораздо меньше данных.