Милла Йовович — скамер??

от автора

Если вы вдруг пропустили новость, напомню, что неделю назад Милла Йовович и крипто-предприниматель Бен Сигман выпустили open-source библиотеку MemPalace — менеджер памяти для AI-агентов, где Милла выступила как целый системный архитектор — вот умничка.

Проект моментально стал вирусным, побил все бенчмарки, набрал 40 000 звезд на Github, собрал восторженные отзывы — в общем, сделали по красоте, если б не одно но: на поверку оказалось, что вся архитектура… банальный плагиат.

Восстановим хронологию

5 апреля — создание репо на аккаунте Йовович
7 апреля — анонс на Hacker News и разгон хайпа
7 апреля же в issue на github приходит пользователь LunarFawn с деликатным вопросом — «А как так получилось, что архитектура mempalace прям в точности, прям под копирку повторяет архитектуру SaraBrain?»

Кто такая Sara Brain?

Не кто, а что. Это проект за авторством Дженнифер Перл aka LunarFawn, упомянутой выше. Причем опубликован он был еще в марте, за месяц до mempalace. SaraBrain реализует архитектуру Path-of-thought, работу над которой Дженнифер начала еще в 90-х, без малого тридцать лет назад.
Дженнифер перечислила следующие архитектурные совпадения, которые она считает ядром SaraBrain:

  • локальное хранение, без cloud-зависимостей

  • LLM как сенсорный интерфейс, а не мозг

  • граф знаний в sqlite-сторадже

  • отсутствие обобщений и «забывания» фактов

  • обход графа на стадии извлечения данных

  • минимум внешних зависимостей

Все эти принципы декларируют оба проекта. Особенно интересно получается, если поставить проекты нос-к-носу и сравнить.

SaraBrain

MemPalace

Нейроны 4 типов

4-слойный стек памяти

Сегменты (ребра между нейронами)

«Крыло» (дворца) и «комнаты»

Пути (цепочки сегментов)

Коридоры между комнатами

На что товарищ наш Сигман отшучивается и парирует — не знаем мы никакую Сару Брейн и над проектом работаем аж полгода с ноября, только он в приватном репо на деревне у бабушки. Но публиковать его нельзя — там в исходных коммитах много-много персональных данных.

Скрытый текст

Вот интересно, а зачем библиотеке для ai-агентов перс.данные в исходниках? Может банально чужие копирайты?

Дженнифер справедливо замечает, что код вы не руками писали, а сгенерировали Claude Opus, а у него есть доступ к публичным репозиториям и веб-ресурсам. Кто-то в комментах даже пошутил: представьте код сгенерирован промтом «возьми все идеи из этого paper, переименуй термины и commit-push».

Накрутка

Однако, стоило реальным пользователям попробовать на зубок этот ваш дворец, как сразу всё стало ясно: и звёзды на github накручены и заявленные фичи не реализованы, а результаты бенчмарков подтасованы.

https://x.com/merr1k/status/2041457312796233964

https://x.com/DiarioBitcoin/status/2042393682804908401

Например, заявленная фича «Обнаружение противоречий в фактах» просто отсутствует в коде — нашли одно-единственное место, где происходит всего лишь дедупликация через проверку на точное совпадение в триплетах (субъект, предикат, объект).

AAAK — это не lossless компрессия. Они обрезают строки до 55 символов, сортируют по частоте ключевых слов, а функция decode формирует мапу из тегов, а не деконструирует исходную строку.

LoCoMo — бенчмарк, который ничего не проверяет. Смотрите сами в их BENCHMARKS.md:

The Sonnet rerank is essentially doing reading comprehension over all sessions — the embedding retrieval step is bypassed entirely.

То есть то, ради чего создавался бенч (стадия retrieval) они полностью скипнули.

В бенчмарке LongMemEval тоже присутствуют фундаментальные ошибки верификации результатов: во-первых, все ответы давно утекли в паблик и попали в обучающие выборки llm, во-вторых проверяют только поиск, но не генерацию ответов. В-третьих, для каждой сессии вопросов создается один документ, в который попадают только ответы пользователей (ответы агентов вообще не индексируются), а бенч проверяет, что хотя бы одна из найденных сессий попадает в top5. Причем есть проверка на полное совпадение top5, но она отключена.

Крипто-скам

Как только стало ясно, что темка стрельнула, Бен как настоящий криптан недолго думая релизнул мемкоин MEMPALACE, который уже через сутки обвалился в ноль.

https://x.com/CardilloSamuel/status/2043070880486449413

Забавно видеть как честнейший человек Сигман банит направо и налево за раскрытие планов по монетизации mempalace. Тоже мне секрет полишинеля.

Перелицензирование

Сама Дженнифер Перл даже не обвиняет в воровстве идеи и признаёт, что совпадения бывают, однако остается вопрос перелицензирования — исходный код проекта SaraBrain выкладывался под лицензией CC BY-NC-ND 4.0 которая осложняет коммерческое использование, а mempalace выпустили под лицензией MIT и это позволяет корпорациям творить что угодно. И теперь человек, который потратил 30 лет на исследования не будет даже упомянут как автор оригинальной идеи. И что с этим делать в эпоху ИИ пока не понятно.

Заключение

Разумеется, вы всё наговариваете и просто завидуете.
Разумеется, вышедшая в тираж актриса в паре с крипто-скамером целых полгода проводили научные изыскания и сотни экспериментов.
И конечно же они не вбивали пару промптов в ClaudeCode (один — «сделай мне AI-библиотеку», второй — «удали все копирайты»).
Нет-нет-нет.
Верим?

ссылка на оригинал статьи https://habr.com/ru/articles/1023022/