Нейросеть за 50 центов (~36 ₽): TernML, тернарный ИИ без FPU

от автора

В прошлый раз я рассказал про GraphKAN, первую тернарную KAN с весами {-1, 0, +1}, которая выдала 96.15% на MNIST при 15 КБ. (ссылка).

С тех пор проект переродился. Рассказываю, что изменилось и почему.


GraphKAN → TernML

Название «GraphKAN» привязывало технологию к KAN (Kolmogorov-Arnold Networks). Для B2B-продаж это звучит как игрушка. Плюс пайплайн оказался шире: работает не только на KAN, но и на свёрточных сетях.

Так родился TernML (Ternary Machine Learning). Код переименован, репозитории заархивированы, всё собрано под единым брендом.

Что нового в цифрах

К прошлым результатам (MNIST 96.15%, CIFAR-10 46.31%) добавились:

  • Fashion-MNIST на CNN: 92.02%, выше исходной модели (91.57%)

  • Adult Income: 84.9%, всего на 2.8% хуже XGBoost при размере модели 0.6 КБ

  • ELM-режим: 78.66% на Fashion-MNIST без обучения (случайные веса + наименьшие квадраты)

Полные таблицы в прошлом посте.

Эффект регуляризации квантизации: не баг

Перепроверено на разных архитектурах: float → тернар стабильно повышает точность. Тернарное пространство весов работает как информационное горлышко: шум отсекается, сигнал усиливается. Это не артефакт одной архитектуры, а фундаментальное свойство.

За подробностями в первую статью.

Почему это важно сейчас

Cortex-M0+ (STM32G031) стоит ~36 ₽, в нём нет ни FPU, ни DSP. TFLite Micro на таком чипе не запускается. TernML влезает целиком в 16 КБ L1-кэша.

Российские микроконтроллеры (Микрон MIK32 Amur, НИИЭТ К1921) тоже без FPU и без своего AI-стека. TernML может закрыть эту нишу. 46% на CIFAR-10: уровень, достаточный для промышленной диагностики, вибрационного анализа, классификации звуков, и всё это на голом металле без единого DSP-слайса.


Проект зарегистрирован как самозанятый (НПД), принимаю заказы на TinyML-модели под конкретное железо.

Ссылки:

Контакты: Telegram: @fakeonomics


2026. Fakeonomics. Все права защищены.

ссылка на оригинал статьи https://habr.com/ru/articles/1049940/