
DeepSeek планирует как минимум удвоить численность всех своих подразделений — об этом компания сообщила 25 июня. Но самое интересное здесь не цифры найма, а одна из открытых вакансий: в описании позиции Frontier-исследователя DeepSeek прямым текстом допускает, что для создания AGI одного масштабирования может не хватить.
Вакансия называется Frontier (Continuous Learning / Self-Evolution / New Paradigm) Researcher и открыта в рамках того же обращения, которое компания опубликовала в WeChat. В описании сказано: путь к AGI может быть связан не только с непрерывным наращиванием масштаба — команда «старательно ищет недостающий финальный кусок пазла». Среди направлений «следующей парадигмы» перечислены непрерывное обучение, самоэволюция модели, архитектуры нового поколения и новые алгоритмы обучения. Для лаборатории, чья репутация построена на тезисе «нужен не больший бюджет, а более эффективный масштаб», это заметный разворот: масштаб впервые описывается не как финишная прямая, а как, возможно, недостаточное условие.
Вторую профильную вакансию — Multimodal understanding researcher — DeepSeek открывает с фразы «AGI никогда не остановится на тексте». Ставка здесь на понимание физического мира: компания хочет модели, которые «видят и понимают мир», умеют работать с зашумленными мультимодальными данными и строятся на нативных, а не пристроенных сбоку мультимодальных архитектурах. По сути это та же мысль с другого края — что для следующего шага мало одного текста и одного масштаба.
Сам набор тоже показателен. DeepSeek открыла 33 позиции в семи категориях — от full-stack-разработки и алгоритмов до R&D ядра ИИ и исследований в области deep learning, преимущественно в Пекине и Ханчжоу. Риторика подчеркнуто пафосная: компания пишет, что «никогда не искала гениев», зовет новичков сразу на самые сложные задачи и обещает место «в первом ряду» на рождение новой эпохи, ведь «человечество находится накануне AGI».
Экспансия идет на фоне денег. DeepSeek близка к закрытию первого в своей истории внешнего раунда примерно на 50 млрд юаней (около $7,4 млрд) — одного из крупнейших среди китайских стартапов; оценку называют в районе $50 млрд, а среди инвесторов — Tencent и CATL. При этом по разным оценкам в компании до сих пор работает всего 150–200 человек, против тысяч у OpenAI. Значительная часть привлеченных средств, судя по сообщениям, пойдет не на железо, а на удержание: инженеров DeepSeek активно переманивают Alibaba и другие китайские гиганты.
Любопытнее всего, что непрерывное обучение многие исследователи считают одним из реальных бутылочных горлышек на пути к AGI: сегодняшние языковые модели обучаются один раз, а дальше не дообучаются на лету — их знания фактически заморожены на момент окончания тренировки. DeepSeek выносит эту задачу не в маркетинговый слайд, а в текст вакансии, под которую реально нанимает людей. Оговорка важна: пока это заявка о намерениях, а не результат — обещание «следующей парадигмы» в описании должности и работающая архитектура непрерывного обучения это очень разные вещи. Но то, что один из самых эффективных «скейлеров» индустрии открыто допускает предел масштабирования, само по себе сигнал.
P.S. Поддержать меня можно подпиской на канал «сбежавшая нейросеть», где я рассказываю про ИИ с творческой стороны.
ссылка на оригинал статьи https://habr.com/ru/articles/1052242/