3D-принтер напечатал лицо, а искусственный интеллект оживил его — инженер-любитель создал говорящую голову, которая рассуждает, как Аристотель
Включите компьютер, и он спросит вас о смысле жизни: самодельный философ с Raspberry Pi.
Польский инженер и энтузиаст Никодем Бартник собрал необычного собеседника — механическую голову, говорящую, как живой древнегреческий философ. Металлическая маска с движущимися глазами и светящимся ртом скрывает искусственный мозг, работающий на собственном компьютере. Голос, мимика и интонации синхронизированы настолько точно, что разговаривать с устройством почти естественно — как разговаривать с человеком, который может вести диалог часами.
Идея пришла в голову Бартнику после того, как он вспомнил заявление Стива Джобса о том, что «ты можешь поместить Аристотеля в компьютерИнженер решил проверить, можно ли воспринять эту идею буквально: объединить голос, лицо и интеллект в работающую систему. без подключения к Интернету. Его цель — создать полностью автономное устройство, которое не зависит от облачных сервисов и может работать с локальным оборудованием.
Сделать глаза робота Чтобы казаться живым, молодой человек использовал готовую конструкцию глаза, разработанную инженером Уиллом Когли, известным своими аниматронными проектами. Шесть миниатюрных моторов обеспечивают естественные движения зрачка и легкие подергивания для создания эффекта наблюдения. Моторами управляет микрокомпьютер типа Raspberry Pi: он получает сигналы от программного обеспечения и синхронизирует движения глаз, чтобы они следовали за собеседником. На сборку и настройку этого модуля ушло чуть больше часа.
Для лица инженер распечатал готовую маску на 3D-принтере и немного доработал ее под проект. Он усовершенствовал форму глазниц, чтобы добиться желаемого выражения, и сделал корпус тоньше, чтобы электроника оставалась скрытой. За ртом инженер оставил небольшое отверстие: через него проходит мягкий свет от диодов, и при разговоре кажется, будто губы шевелятся.
Слуховая система простой, но продуманный дизайн. Подключенный к Raspberry Pi микрофон записывает голос собеседника, после чего звуковой поток преобразуется в текст и отправляется на компьютер по Wi-Fi. Там все решается с помощью набора программ с открытым исходным кодом. Текст анализируется с помощью модели Google Gemma 3, которая генерирует ответ в стиле античной философии. Полученная речь поступает в сервис ElevenLabs, где синтезируется реалистичная речь с естественной интонацией.
Изначально Бартник хотел добавить небольшой экран, показывающий форму звуковой волны во время разговора, но дисплей работал нестабильно. В конечном итоге его заменило кольцо программируемых светодиодов, управляемых микроконтроллером Raspberry Pi Pico.. Во время выступления свет мигает в ритм фраз, усиливая впечатление живого присутствия.

Все расчеты выполняются на личном оборудовании изобретателя. Такой подход позволяет не зависеть от коммерческих платформ и их ограничений и сохраняет полную свободу экспериментирования. Робот может спокойно рассуждать о логике, а через секунду рассказывать анекдоты о мировом господстве. Для управления настройками инженер создал простую веб-панель, где можно выбирать стиль общения — от размышляющего философа до нахмуренного собеседника, не трогая при этом «железо».
Несмотря на аккуратную сборку, устройство выглядит самодельным. Компоненты соединяются проводами и платами, некоторые детали крепятся с помощью LEGO, а маска крепится на деревянную основу. Но когда робот поднимает голову и произносит первую фразу, ощущение домашнего уюта пропадает: кажется, будто существо перед вами обладает собственной индивидуальностью.
Бартник опубликовал все схемы, инструкции и файлы программы на GitHub. Теперь каждый, у кого есть 3D-принтер и свободный компьютер, может построить своего философского «собеседника» и настроить его по своему вкусу.