BI-движок на остатках Cursor токенов за месяц

от автора

Привет, Хабр! Несмотря на то, что Cursor в начале «ИИ революции» условно был впереди, сейчас общепринятым ИИ инструментом во многом можно считать Claude, я также пользуюсь Claude как основным инструментом. Но годовая личная подписка Cursor осталась, и токены каждый месяц обновляются, нужно их потратить 🙂 На остатки токенов за выходные решил заняться вайб-кодингом движка DAX на C# — простейший аналог VertiPaq, причем в режиме Auto в Cursor. В результате получился работоспособный движок DAX, естественно, поддерживающий только подмножество языка, а не весь DAX, но зато не привязанный к Windows — не требуется ни Tabular Server, ни Power BI Desktop, ни облачные сервисы, ни виртуальные машины с Windows — DAX движок работает на всех ОС. Интересующимся экспериментами с ИИ генерацией BI движков — добро пожаловать под кат 🙂

Кроме описанной цели снизить зависимость от Windows для DAX были и другие побочные цели — сделать хотя бы в рамках прототипа/эмулятора в чем-то новый продукт по сравнению с Power BI Desktop — изменить подход к генерации дашбордов с учетом развития языков разметки, в частности Markdown. Дашборды сами по себе наглядны, но на основе одного скриншота с графиком наверно решения не совсем удобно принимать, предполагаю, что чаще решения принимаются на основе отчета, текстового описания с графиками и т.д.. И лично мне не хватает текстового описания к каждому дашборду, для меня это более формально и информативно. Вспоминается, например, MathCad, в котором расчеты и визуальное оформление, текстовое описание, графики шли в одном документе. Учитывая, что сейчас распространен язык разметки Markdown, пришла идея в рамках прототипа/эмулятора DAX ещё и встроить выполнение DAX в Markdown документы — забегая вперед можно сказать, что получилось. В итоге для нового DAX движка даже получилось сгенерировать self-describing Markdown документацию-примеры. Конечно, интерфейс неидеальный, это больше прототип.

В итоге для создания дашбордов в виде отчета в Markdown (если нет неприязни к этому формату) можно пользоваться даже простым текстовым редактором, это позволяет сосредоточиться собственно на задаче, на DAX, на аналитике, на текстовом описании задачи и решении, в том числе на решении по шагам, активно привлекать ИИ, а не кликать мышкой по дашбордам. Конечно, использование Markdown отчета — это не основной BI кейс, а больше кейс «глубокой аналитики», но предполагается, что он может быть полезен и удобен.

Для кроссплатформенности была взята Avalonia, реализация была через TDD со сравнением с Power BI, вначале реализовывались базовые вещи вроде SUMMARIZECOLUMNS, CALCULATE, FILTER, итераторов, далее через диалоги с ИИ в Cursor на Auto режиме добавлялись тесты и расширялся функционал.

С биллингом Cursor как-то сложно разобраться, но хорошо, что лимиты сбрасываются ежемесячно 🙂

Даже в Auto режиме Cursor сам предлагал тесты, сам исправлял ошибки — конечно, ИИ сильны в этом. Примечательно, что Cursor генерировал достаточно безумные DAX с более чем 10 уровнями вложенности CALCULATE, но при наличии расхождений сам успешно доводил до совпадения с Power BI для всех кейсов.

Так итеративно за пару дней получилась основа DAX движка. Дальше перешёл к разработке кроссплатформенного desktop приложения, также с помощью Cursor, в режиме Auto и также на остатках токенов. По поводу desktop приложения — на текущий момент оно организовано просто: выбирается рабочая папка, импорт только из CSV файлов, TOM модель со связями хранится в отдельном JSON файле в рабочей папке, поддерживаются только Single связи, файл TOM модели строится автоматически на основе CSV файлов в рабочей папке, также в UI есть редакторы типов колонок и связей в TOM модели.

ER диаграмма для удобства выводится в schema.md в Mermaid формате в рабочей папке, а также отображается в UI.

Также был добавлен простейший ИИ ассистент (куда же без ИИ ассистента), хотя для редактирования md файлов отчетов можно использовать любой удобный ИИ. Простые DAX задачки щелкаются как орешки.

ИИ ассистент из desktop приложения (или любой другой ИИ) генерирует и описание, и DAX для расчетов — соответственно, desktop приложение подставляет вместо «`dax table результаты запроса DAX.

Видно, что текущая задача решена верно и совпадает с Power BI.

В итоге была сгенерирована self-describing документация-примеры в виде md отчета с помощью самого ИИ ассистента из desktop приложения, сгенерированного ИИ, причем видно, что движок не оптимизирован, задумывается (пока провелялось на небольших объемах данных — меньше 10 тысяч строк в таблицах), но бодро считает, не падает и сходится с Power BI, причем не только для простейших кейсов, но и для достаточно сложных.

Надеюсь, такое описание эксперимента могло быть интересным, успешных дашбордов 🙂

ссылка на оригинал статьи https://habr.com/ru/articles/1030948/