Искусственный интеллект на оборудовании 1976 года: чат-бот, работающий на 64 КБ ОЗУ
В то время как современные языковые модели требуют гигабайт видеопамяти и мощных графических ускорителей, инновационный проект доказывает, что концепцию искусственного интеллекта можно свести к абсолютному минимуму. Разработчик, известный под псевдонимом ГарриРсозданный Z80-мкЛМ – разговорная модель, предназначенная для работы на легендарном 8-битном микропроцессоре Зилог Z80премьера которого датируется 1976 годом.
Технологическое чудо 8-битной эпохи
Проект представляет собой языковую модель на уровне символов, которую он использует. 2-битное квантование весов. Вся программа, включая логику вывода, веса и пользовательский интерфейс чата, умещается в один двоичный файл размером всего 40 КБ. Это позволяет программному обеспечению работать на системах с 64 КБ ОЗУ под операционную систему КП/Ма также популярные ретро-машины, такие как ZX Спектр.
Для достижения этого результата был использован так называемый Обучение с учетом квантования (QAT). Этот метод подготавливает модель к экстремальным ограничениям аппаратного обеспечения уже во время ее обучения в среде Python, предотвращая сбой логики при переключении на сильно ограниченную 8-битную архитектуру.
Особенности: Чат-бот и игра из 20 вопросов.
Хотя Z80-мкЛМ не пройдет тест Тьюринга, он предлагает два полнофункциональных приложения:
- Тиничат: Минималистичный чат-бот, который отвечает на приветствия и вопросы о себе. Его ответы немногословны, но носят конкретный характер. Например, на вопрос «Вы робот?» он может уверенно ответить «ДА».
- Предполагать: Цифровая версия классической игры «20 вопросов», в которой модель «придумывает» секретное слово, а пользователь должен отгадать его с помощью логических вопросов.
Философия проекта
Главный вопрос, на который HarryR пытается ответить: «Насколько маленьким может быть проект ИИ, не теряя при этом своей индивидуальности?Автор отмечает, что работа с таким программным обеспечением — это «другой режим взаимодействия». Краткость ответов заставляет пользователя извлекать смысл из контекста или задавать прямые вопросы, чтобы проверить понимание темы машиной.
Это достижение — не только любопытный эксперимент для любителей ретро, но и демонстрация того, насколько эффективными могут быть алгоритмы при применении строгих инженерных ограничений. Проект полностью доступен в GitHubгде сопровождается инструкциями по работе с реальным аппаратным оборудованием или эмуляторами.