Почему LLM Wiki Карпатого не стоит внедрять для личной базы знаний

от автора

Андрей Карпатый недавно написал про замену RAG — LLM Wiki. Если вкратце, Карпатый предлагает модель, в которой LLM читает сырые источники, пишет страницы wiki в базе знаний, поддерживает перелинковку между заметками, а человек — читает, задаёт вопросы, делает ревью. И вся эта система живёт практически автономно — человек крайне редко трогает файлы заметок.

Мне кажется, важно сделать важный комментарий — его модель хорошо работает для логики решения корпоративных задач (где знания = справочник), но думать про подобное внедрение LLM в личные заметки — скорее вредно. Я верю, что для Андрея это работает: у него много интеллектуально сложных технических задач, потребность в реальных изобретениях. У большинства людей, к счастью, ситуация не требует такой глубокой оптимизации и автоматизации.

Нам нужна база знаний чтобы что-то не забыть, не потерять и подумать о своих личных исследованиях.

Подход Карпатого прямо противоречит тезису «письмо = мышление», на основе которого строится глубокая рефлексия. Когнитивный акт происходит в письме, не до него и, тем более, не после.

У базы знаний, безусловно, может быть две функции — инструментальная (запоминать) и рефлексивная (понимать). Нужно всегда держать в голове, что у Карпатого отягощающий бэкграунд в IT, и это желание постоянно всё оптимизировать и автоматизировать накладывает свои особенности — я часто замечаю, как в IT-сообществе база знаний становится во многом инструментом повышения личной и рабочей эффективности, чем практикой рефлексии (а изначальный запрос — как раз на рефлексию).

Мишель Фуко в конце своей жизни подробно рассматривает одну из важнейших «практик заботы о себе» — hypomnemata. Это записные книжки (по типу писем стоиков, эпикурейцев), функция которых — не архивная, а присваивающая. Писать, чтобы «строить себя», описывая прочитанное, услышанное, подуманное. Перечитывание заметок в таком случае также играет роль только перепроживания мысли, а не восстановления контекста для выполнения задачи. 

Карпатый, на мой взгляд, своим постом выкручивает на минимум часть письма как практики заботы о себе, и максимизирует мнемоническую функцию, где заметка выполняет только инструментальную роль. И, если Карпатый подробно описал как сделать «инструментальную базу знаний», то мне хочется дополнить противоположными советами про личную базу:

  • Переписывание прочитанного в свои слова и мысли — не делегировать в LLM.

  • Связи между заметками искать самому. Автогенерация бэклинков даёт граф, но не даёт узнавания: «о, это же про то, о чём я думал в октябре». Узнавание и есть мышление.

  • Перечитывать старые заметки можно без определённой задачи. Не чтобы найти что-то для работы, а чтобы встретиться со своим голосом двухгодичной давности.

  • Автоматизировать можно то, что идёт до письма (транскрибация, сбор источников) и то, что после (поиск по базе знаний). Сам момент письма оставляем — это граница, которую Карпатый стирает.

  • Разделять контуры базы знаний на рефлексивную и справочную.

Фактически, это может влиять только на структуру базы знаний: в рефлексивных заметках она более свободная, удобная для чтения, а в инструментальных — жесткая, выступающая скорее контекстом для языковой модели, которая будет считывать эти заметки.

В телеграм-канале пишу про внедрение AI на стыке философии, критической теории и технологий — буду рад подписке.

ссылка на оригинал статьи https://habr.com/ru/articles/1025220/