Нейросетевой эквалайзер на PlutoSDR: от синтетики к железу

Зачем вообще трогать LMS

Любой реальный радиоканал «размазывает» символы во времени: соседние отсчёты накладываются друг на друга, и приёмник видит межсимвольную интерференцию (ISI). Классический способ с этим бороться — адаптивный фильтр LMS. Он прост, дёшев и хорошо работает, пока канал близок к линейному. Но это именно линейный фильтр: когда лучей несколько и у них разные фазы, одной линейной комбинацией отсчётов идеально восстановить символ уже не получается.

Отсюда идея, которую я и проверял: заменить (или дополнить) LMS компактной свёрточной сетью. Сеть смотрит не на один отсчёт, а на целое окно принятого сигнала и учится по нему обратному отображению канала — то есть восстанавливать исходную точку созвездия с учётом совместной статистики соседних символов. Сначала всё это обучается и сравнивается на синтетике, а потом проверяется на настоящем железе — модуле ADALM-PLUTO.

Как устроена модель

Эквалайзер — это одномерная свёрточная сеть (1D-CNN), в коде она называется legacy_big. На вход подаётся окно из 51 принятого отсчёта, разложенное на два канала — синфазную (I) и квадратурную (Q) составляющие, то есть тензор формы (batch, 2, 51).

Дальше идут три свёрточных блока. Первый Conv1d расширяет 2 канала до 32 с ядром 5, второй — 32 → 64 тоже с ядром 5, третий — 64 → 128 с ядром 3. То есть число каналов наращивается по схеме 2 → 32 → 64 → 128: с каждым блоком сеть выделяет всё более сложные признаки из окна сигнала. После каждой свёртки стоит BatchNorm и LeakyReLU с наклоном 0.1. BatchNorm (батч-нормализация) нужен для стабилизации обучения: он нормирует выходы свёртки внутри мини-батча и тем самым уменьшает внутренний ковариационный сдвиг (internal covariate shift) — изменение распределения активаций от слоя к слою по ходу обучения, из-за которого тренировка идёт медленнее и менее устойчиво. LeakyReLU с наклоном 0.1 берётся вместо обычного ReLU, чтобы предотвратить проблему «мёртвых нейронов»: у обычного ReLU отрицательная часть зануляется, и нейрон, попавший в эту зону, перестаёт получать градиент и обучаться, а небольшой ненулевой наклон 0.1 на отрицательной полуоси сохраняет градиент и не даёт нейронам «умирать». Затем результат разворачивается (Flatten): 128 каналов × 51 отсчёт дают 128 × 51 = 6528 признаков, которые вытягиваются в один вектор. Этот вектор проходит полносвязный слой 6528 → 256 с LeakyReLU 0.1 и Dropout 0.3. Dropout 0.3 добавлен для регуляризации: при обучении он случайно обнуляет 30 % активаций слоя, что мешает сети переобучаться и заставляет её не полагаться на отдельные нейроны. Финальный слой 256 → 2 выполняет регрессию на I и Q центрального символа окна.

На выходе — два числа: оценка I и Q центрального символа окна. По сути это регрессия: предсказать идеальную точку созвездия по зашумлённому и искажённому окружению. Сеть получается достаточно крупной — 1 707 746 обучаемых параметров.

*Рисунок 1 — Архитектура нейросетевого эквалайзера 1D-CNN*

Откуда брать данные

Обучать сеть прямо в эфире дорого и невоспроизводимо, поэтому датасет генерируется синтетически полным DSP-пайплайном. Случайные биты отображаются в символы QPSK, апсемплируются с sps = 4 и проходят формирующий RRC-фильтр с roll-off β = 0.35. Дальше сигнал сворачивается с импульсной характеристикой канала, добавляется шум под заданный SNR, на приёме делается согласованная фильтрация и даунсемплинг до одного отсчёта на символ, после чего поток нарезается скользящими окнами по 51 отсчёту.

Ключевая особенность датасета — четыре фиксированных профиля канала разной тяжести: базовый fixed_default (4 отвода), mild_isi (3 отвода, мягкая ISI), moderate_isi (4 отвода) и strong_isi (5 отводов, самые сильные отражения). Для каждого профиля генерируется по 50 000 символов в диапазоне SNR 0–30 дБ. Важная оговорка про честность эксперимента: в этом multi-profile режиме несущая частота не сдвигается (CFO = 0) и нелинейности тракта не применяются — то есть сеть учится бороться именно с многолучевостью и шумом, а не с искусственно добавленными артефактами.

Результаты на синтетике

На программном стенде я сравнивал настроенный LMS-baseline и обученную CNN на одних и тех же данных. Это контролируемая среда: обучающее и тестовое распределения совпадают, канал известен, шум — белый. В таких условиях нейросеть честно конкурирует с LMS и на части профилей ведёт себя устойчивее за счёт того, что видит окружение символа целиком, а не складывает отсчёты линейно.

Проверка на PlutoSDR

Дальше — железо. Цель этого этапа была не в том, чтобы сравнивать CNN с LMS, а в том, чтобы убедиться в работоспособности тракта — что весь приёмо-передающий путь и инференс сети действительно работают на реальном устройстве. Аппаратный этап выполнялся на модуле PlutoSDR в кабельном шлейфовом режиме TX1 → RX1: передатчик и приёмник одного и того же устройства соединены напрямую. И LMS, и CNN получают один и тот же выровненный поток.

По части производительности на PlutoSDR сеть показала себя хорошо: CNN успевает обрабатывать поток в реальном времени на видеокарте (GPU). Сравнивать CNN с LMS на Pluto не было главной целью — на этом этапе важно было проверить, что тракт работает. Главное направление — перенос модели на ПЛИС и проверка её работы уже там.

Что дальше

Короткий итог. На данном этапе подход в теории рабочий, но требует доработок и улучшений: нужно закрыть domain gap, дообучить сеть на реальных данных и довести инференс до аппаратной реализации. Как первый прототип результат очень хороший — он подтверждает, что 1D-CNN способна выполнять роль эквалайзера и работает в реальном времени, а дальнейшая доводка — вопрос инженерной работы.

ссылка на оригинал статьи https://habr.com/ru/articles/1048700/