Разбор рынка HATS: почему «бинауральные головы» стоят как подержанная машина

от автора

Если вы хоть раз гуглили бинауральную запись, то натыкались на странную вещь:
искусственная голова с микрофонами стоит — от нескольких тысяч до миллионов рублей.

И это довольно быстро вызывает диссонанс.

С одной стороны — идея выглядит почти тривиально:
два микрофона, размещённые в «ушах».

С другой — ценник, как у сложного лабораторного оборудования.

Интуитивно ожидаешь уровень «два хороших микрофона».
На практике — подержанная машина.

Рынок HATS — один из немногих в аудиоиндустрии, где цены растут быстрее, чем меняются технологии.

Отсюда возникает простой вопрос:

что это вообще за рынок и за что там платят?

Я как раз разбирался в этом, пока делал свою «Голову Бинго»,
и заодно разложил по полочкам:

— из чего складывается цена
— почему разброс такой большой
— и почему между «игрушкой» и «лабораторией» почти ничего нет

 

Что вообще такое HATS и зачем он нужен

Если коротко: HATS (HeadAndTorsoSimulator) — это попытка воспроизвести то, как человек слышит звук.

Задача — записать не просто сигнал с микрофона, а восприятие звука человеком.

И здесь начинается ключевая сложность.

Человеческий слух — это не два датчика, а система обработки. Мы определяем направление, расстояние и пространство за счёт различий между сигналами в левом и правом ухе: по задержке, уровню и спектральным искажениям.

Обычная стереозапись фиксирует звук, но не воспроизводит это восприятие. Она передаёт сигнал, но не формирует ощущение источника в пространстве.

Почему это важно:

— у нас два уха, а не один микрофон
— звук приходит к ним с разной задержкой
— форма головы, ушей и даже плеч влияет на спектр

Все эти эффекты описываются через HRTF — передаточную функцию головы.

Важно понимать: HRTF — это не одна функция, а набор характеристик, зависящих от направления звука. Меняются задержки, уровни и спектр.

Фактически это трёхмерная карта восприятия, которая определяется геометрией головы и ушей.

Поэтому «поставить два микрофона» недостаточно. Без этой геометрии результат не совпадает с тем, как человек слышит звук.

Отсюда и возникает идея HATS: физически воспроизвести форму головы и ушей и разместить микрофоны в тех же точках, где находятся слуховые каналы.

 

NeumannKU 100 — классический пример бинауральной головы из профессионального сегмента [1]

NeumannKU 100 — классический пример бинауральной головы из профессионального сегмента [1]

 

Звучит просто. Стоит почему-то нет.

Где это используется на практике  Чтобы это не выглядело нишевой экзотикой, HATS применяются в вполне прикладных задачах:

— разработка наушников и гарнитур
— тестирование систем активного шумоподавления (ANC)
— настройка автомобильной акустики
— VR и spatialaudio
— слуховые аппараты и медицинские исследования

Во всех этих случаях важно не просто «записать звук», а получить воспроизводимый результат.И здесь проходит принципиальная граница.Бинауральная запись может использоваться как формат — для эффекта присутствия.А может — как инструмент измерения.

Во втором случае требования совсем другие:

— результат должен повторяться
— условия должны быть контролируемыми
— геометрия системы — фиксированной

Именно поэтому решения из потребительского сегмента здесь не подходят.Они могут давать интересный эффект, но не дают стабильности.А без стабильности невозможно ни сравнивать результаты, ни делать инженерные выводы.

 

Рынок: от «игрушек» до лабораторного оборудования

Если посмотреть на реальные устройства, становится понятно, что под названием HATS скрываются сразу несколько разных классов решений.

Фактически это не один рынок, а три, которые сильно отличаются по задачам, требованиям и цене.

 

Потребительский уровень

Типичные представители:

— внутриушные микрофоны
— наушники с функцией записи
— компактные решения «вставил и пошёл»

Примеры: Sound Professionals, Hooke Verse, Roland CS-10EM.

 

RolandCS-10EM — типичный представитель потребительского сегмента: компактное и доступное решение без стандартизации [2]

RolandCS-10EM — типичный представитель потребительского сегмента: компактное и доступное решение без стандартизации [2]

Что у них общего:

— низкая цена (десятки–сотни долларов)
— мобильность
— отсутствие подготовки перед использованием

Ключевая особенность: такие системы используют вашу собственную голову как HATS.

Отсюда и главный недостаток — отсутствие стандартизации.

Результат зависит от:

— формы уха
— положения микрофонов
— того, как именно они установлены

Сегодня запись может звучать отлично, завтра — заметно иначе.

И дело не в электронике.

Даже при одинаковых микрофонах результат меняется, потому что меняется сама акустическая картина: смещение на миллиметры уже даёт другую HRTF.

Для повседневных задач это допустимо.
Для измерений — нет.

 

Полупрофессиональный сегмент

Это компромисс между удобством и попыткой приблизиться к реальной бинауральной записи.

Типичный представитель — 3Dio. 

3Dio — популярное полупрофессиональное решение: силиконовые уши есть, полноценной головы — нет [3]

3Dio — популярное полупрофессиональное решение: силиконовые уши есть, полноценной головы — нет [3]

Что здесь делают:

— используют силиконовые ушные раковины
— фиксируют расстояние между ними
— упрощают остальную геометрию

Идея — сохранить ключевой эффект уха, убрав сложность полной модели головы.

Что получается на практике:

— лучше, чем внутриушные микрофоны
— но всё ещё не полноценный HATS

Причина в том, что часть акустики теряется.

В формировании HRTF участвует не только ухо, но и вся голова и верхняя часть тела: отражения, дифракция, переотражения.

Убирая их, мы получаем упрощённую модель восприятия.

Она работает, но не совпадает с реальным слухом.

Зато такие системы:

— компактнее
— дешевле
— удобнее в использовании

Поэтому они популярны у контент-мейкеров и в прикладных задачах, где абсолютная точность не критична.

 

Профессиональный сегмент

Здесь начинаются полноценные измерительные системы.

Типичные представители:

— NeumannKU 100
— Brüel&KjærHATS
— KEMAR

Brüel&KjærHATS — измерительная система с полной имитацией головы и торса, используемая в лабораториях и R&D [4]

Brüel&KjærHATS — измерительная система с полной имитацией головы и торса, используемая в лабораториях и R&D [4]

Это уже другой класс задач:

— лабораторные измерения
— разработка аудиотехники
— научные исследования

Что здесь принципиально важно:

— точная геометрия головы и тела
— откалиброванные микрофоны
— стандартизированные параметры

Ключевое отличие — воспроизводимость.

Две одинаковые системы должны давать сопоставимые результаты.Это позволяет сравнивать измерения и делать инженерные выводы.

Цена — соответствующая:

от ~500 тыс ₽ до нескольких миллионов рублей.

KEMAR — один из индустриальных стандартов HATS: высокая воспроизводимость измерений, но минимальная гибкость [5]

KEMAR — один из индустриальных стандартов HATS: высокая воспроизводимость измерений, но минимальная гибкость [5]

И именно здесь становится видно, откуда берётся разрыв.

Снизу — удобство и доступность.
Сверху — точность и стандарты.

Плавного перехода между ними почти нет. Либо «игрушка», либо «лаборатория».

  

Сколько это стоит на самом деле

Чтобы не оставалось ощущения «ну дорого и дорого», лучше сразу посмотреть на конкретные цифры.

Типичные цены на рынке:

— NeumannKU 100 — примерно 1–1.5 млн ₽
— Brüel&KjærHATS — легко уходит за 2 млн ₽
— KEMAR — в том же диапазоне, в зависимости от конфигурации

И это не какие-то редкие или кастомные решения.
Это базовый вход в профессиональный сегмент.

Теперь для контраста:

— внутриушные микрофоны — от 5 до 20 тыс ₽
— решения уровня 3Dio — примерно 50–200 тыс ₽

Разница — не в 2–3 раза, а на порядок.

Но здесь важно понимать: это не постепенный рост цены за «чуть лучше звук».

Переход резкий.

Меняется не столько качество записи, сколько класс задачи.

В нижнем сегменте вы платите за удобство и эффект присутствия.
В верхнем — за возможность использовать результат как измерение.

И это принципиально разные вещи.

Именно поэтому между «поиграться» и «работать по-взрослому» образуется ценовая пропасть.

И здесь возникает главный вопрос:за что именно платят в профессиональных системах?

Почему разница не в два раза, а в десятки?

Разберёмся, из чего складывается эта стоимость.

 

За что платим?

Чтобы понять разницу в цене, важно не смотреть на HATS как на «железку с микрофонами».В профессиональном сегменте это не просто устройство — это инструмент измерения.И стоимость здесь складывается из нескольких факторов.

 

Маленький рынок

HATS — это не массовый продукт.

Его покупают:

— университеты
— R&D-отделы
— крупные производители аудиотехники

Объёмы производства небольшие, серийность низкая.Отсюда — высокая цена.

Это честно. Тут без заговора.

Причём это замкнутый круг:рынок маленький → устройства дорогие → массового спроса нет → рынок остаётся маленьким.

 

Историческая инерция

Первые нормальные головы появились ещё в прошлом веке.Например, NeumannKU 80 — 1970-е. И с тех пор концепцияпочти не изменилась.

То есть:

— рынок давно сформирован
— основные игроки те же
— подходы устоялись

А цены — как будто каждую голову вручную собирает команда нейрохирургов.

И это редкий случай, когда технология почти не меняется десятилетиями,но это не вызывает давления на снижение цены.Потому что альтернативы долгое время просто не существовало.

 

Стандарты и сертификация

Отдельная часть стоимости — это стандарты.

Такие системы, как KEMAR, используются как индустриальные эталоны.

Это даёт:

— сопоставимость измерений
— единый «язык» между компаниями
— возможность повторять эксперименты

Но у этого есть цена:

— практически отсутствует гибкость
— кастомизация сильно ограничена

Фактически вы платите не только за устройство,но и за возможность работать внутри индустриального стандарта.В инженерной практике это критично: несопоставимые измерения часто бесполезны.

 

Переусложнение

Многие профессиональные системы — это уже не просто HATS в классическом виде.

Это полноценные измерительные комплексы:

— дополнительные датчики
— механические системы
— специализированная электроника

Иногда это действительно необходимо, но платят за это всегда.

 

Закрытость рынка

Часть решений вообще не представлена в открытой продаже.

Они:

— разрабатываются под конкретные компании
— адаптируются под внутренние задачи
— не выходят на массовый рынок

В результате рынок остаётся не только дорогим, но и частично закрытым.

 

Именно сочетание этих факторов даёт текущую картину.Цена — это не только инженерия.

Это ещё:

— стандарты
— инерция
— структура рынка

 

Почему разброс цен такой дикий

Если собрать всё вместе, становится видно, что под названием HATS скрываются разные по своей сути решения. И разброс цен — это не случайность. Это результат того, что на самом деле существует три разных подхода, которые решают разные задачи.

Можно упростить картину до трёх уровней:

Дёшево
Вы платите за удобство. Получаете мобильность и простоту, но результат нестабилен.

Средний сегмент
Вы платите за компромисс. Получаете часть эффектов HRTF, но без полной точности.

Дорого
Вы платите за точность. Получаете стандартизированную систему и воспроизводимые измерения.

Это не «лестница качества», где каждое следующее решение просто лучше предыдущего. Это три разных класса задач. И между ними почти нет плавного перехода.

Отсюда и возникает ощущение разрыва:

снизу — удобные и доступные решения,
сверху — точные, но дорогие измерительные системы.

А между ними — почти пусто.

Либо «игрушка», либо «лаборатория».

Почему это не решается «просто сделать дешевле» 

На первый взгляд задача кажется тривиальной: геометрия известна, микрофоны доступны, вычисления — не проблема.

На первый взгляд кажется, что можно взять 3D-принтер, собрать корпус, поставить микрофоны — и получить аналог HATS.

На практике это не работает.

Проблема в том, что такие системы очень чувствительны к деталям.

— геометрия влияет на результат сильнее, чем кажется
— уши — это не декоративный элемент, а сложный акустический фильтр
— позиционирование микрофонов требует точности на уровне миллиметров
— даже материал корпуса влияет на отражения и резонансы

В результате «похоже на голову» не означает «работает как HATS».

Можно относительно легко собрать устройство, которое даёт бинауральный эффект.

Но получить систему, которая ведёт себя предсказуемо и даёт сопоставимые результаты, — уже инженерная задача.

Именно поэтому разрыв между «сделать что-то похожее» и «сделать инструмент измерения» оказывается гораздо больше, чем кажется.

 

Где здесь проблема

Проблема не в том, что профессиональные системы дорогие.Они решают свои задачи и делают это корректно.Проблема в другом: между DIY-решениями и индустриальными системами почти пусто.

Нет сегмента, который был бы одновременно:

— доступным
— достаточно точным
— удобным в использовании

И это выглядит странно.

Особенно если учитывать, что сегодня:

— 3D-печать стала доступной
— микрофоны — не дефицит
— DSP давно перестал быть экзотикой

Технологического барьера больше нет.Но рынок ведёт себя так, как будто он всё ещё существует.Это уже не инженерное ограничение, а рыночный пробел.

 

Тут возникает вопрос:

Если технология понятна,а инструменты доступны,

почему между «дёшево и просто» и «дорого и лабораторно» до сих пор почти ничего нет?

Возможных объяснений два:

Либо эту задачу никто системно не решал,
либо на неё долгое время просто не было запроса.

С учётом роста VR, spatialaudio и контента второй вариант выглядит всё менее убедительно.

 

Попытка закрыть этот разрыв

И вот здесь появляется естественный вывод:если готовых решений в этом сегменте нет,их придётся делать самостоятельно.С этого момента «интерес к теме» превращается в инженернуюзадачу.

Один из таких подходов — собрать HATS с нуля, опираясь на доступные технологии. 

Один из вариантов кастомного HATS-подхода: 3D-печатная бинауральная голова с модульными ушными раковинами

Один из вариантов кастомного HATS-подхода: 3D-печатная бинауральная голова с модульными ушными раковинами

Задача была максимально приземлённой:

— убрать лишнюю сложность
— сохранить ключевые акустические эффекты
— сделать систему, которую можно использовать вне лаборатории

Важно: это не попытка заменить профессиональные системы.

Такие решения уступают в:

— точности
— воспроизводимости
— стандартизации

Но дают преимущества в другом:

— значительно ниже стоимость
— гибкость конструкции
— возможность быстро экспериментировать

В результате получается промежуточный вариант:не «игрушка», но и не лабораторный эталон.Система, которую можно использовать в реальных задачах,если требования к точности разумны.

Про саму реализацию головы и программной части я писал отдельно — чтобы не перегружать этот разбор, оставлю ссылки в конце.

 

Вывод

Рынок HATS сейчас выглядит немного перекошенным:

— технология известна давно
— спрос растёт
— а доступных и гибких решений почти нет

Значительная часть стоимости — это не только инженерия, но и:

— стандарты
— историческая инерция
— узкий рынок

Такие ситуации обычно долго не держатся.

И именно поэтому начинают появляться альтернативные подходы.Не потому что существующие решения плохие,а потому что стало возможно делать проще, дешевле и гибче.И, судя по всему, сегмент между DIY и лабораторией только начинает формироваться.

Как только технология становится доступной, появляется не только вопрос «почему это такдорого», а люди, которые начинают делать дешевле.

 

 

Связанные материалы

1. NeumannKU 100

https://www.neumann.com/en-us/products/microphones/ku-100

2. Roland

https://www.roland.com/ru/products/cs-10em/

3. 3Dio

https://3diosound.com/collections/microphones/products/free-space-binaural-microphone

4. Brüel&KjærHATS

https://media.hbkworld.com/transform/717dcdaf-9a73-442c-8774-28184160caa4/HATS-Type4128-C

5. KEMAR (HATS)

https://www.grasacoustics.com/products/head-torso-simulators-kemar/product/45bd-autokemar

6. Как я напечатал бинауральную голову на 3D-принтере и попытался конкурировать с Neumann

https://habr.com/ru/articles/1007864/

7. Как я написал Qt-приложение, почти не написав код

https://habr.com/ru/articles/1011420/

 

ссылка на оригинал статьи https://habr.com/ru/articles/1025664/