Manticore Search 13.11.0: Автоэмбеддинги и усовершенствованный AI-поиск

от автора

Мы рады представить релиз Manticore Search 13.11.0 (август 2025). Это большое обновление, в котором добавлена функция «Автоэмбеддинги» — новый простой и эффективный способ делать семантический поиск на базе ИИ. Также в версии исправлены баги и добавлено несколько улучшений.


🚀 Aвтоэмбеддинги: AI-поиск стал простым

Главная новинка в Manticore Search 13.11.0 — Aвтоэмбеддинги. Это функция, которая делает семантический поиск таким же простым, как SQL. Не нужно внешних сервисов или сложных конвейеров: просто вставляешь текст, и можно искать естественным языком.

Что дают автоэмбеддинги

  • Автоматическая генерация эмбеддингов из вашего текста

  • Запросы на естественном языке, которые понимают смысл, а не просто ключевые слова

  • Поддержка нескольких моделей (OpenAI, Hugging Face, Voyage, Jina)

  • Работает через SQL и JSON API

Простой пример

-- Создаём таблицу с автоэмбеддингамиCREATE TABLE products (    title TEXT,    description TEXT,    vector FLOAT_VECTOR KNN_TYPE='hnsw' HNSW_SIMILARITY='l2'        MODEL_NAME='sentence-transformers/all-MiniLM-L6-v2'        FROM='title,description');-- Вставляем данные (эмбеддинги генерируются автоматически)INSERT INTO products(id, title, description) VALUES  (1, 'wireless headphones', 'Bluetooth headphones with noise cancellation'),  (2, 'hiking backpack', 'Lightweight backpack for outdoor adventures');-- Поиск естественным языкомSELECT id, titleFROM products WHERE knn(vector, 3, 'portable audio device for music');

В результате:

+------+---------------------+| id   | title               |+------+---------------------+|    1 | wireless headphones |...+------+---------------------+

Здесь семантический поиск правильно сопоставил “wireless headphones” c фразой “portable audio device for music”, несмотря на полное несовпадение ключевых слов.

Узнать больше

Полное и подробное руководство ждет вас в нашей специальной статье: : «Auto Embeddings: простой AI-поиск».


Другие улучшения

Конфигурация

  • Поддержка Boolean Simplify: Добавлена опция boolean_simplify для ускоренной обработки запросов.

  • Оптимизация системы: Конфигурация Sysctl теперь автоматически увеличивает vm.max_map_count для работы с большими наборами данных.

  • Управление пакетами: RPM-пакеты больше не захватывают каталог /run для улучшения совместимости.


Исправления багов

  • Исправлена работа опции scroll с большими 64-битными ID.

  • Исправлены сбои при использовании KNN с деревьями фильтров.

  • Исправлено поведение эндпоинта /sql (удалена неподдерживаемая команда SHOW VERSION).

  • Исправлена обработка duplicate ID в колоночном режиме.

  • Исправлены сбои при выполнении запросов с несколькими фасетами.

  • Исправлены коммиты операций delete/update в транзакциях.

  • Исправлены сбои при соединении (join) по строковым атрибутам, если они не в режиме columnar


Система и интеграции

  • Обновлён скрипт установки для Windows.

  • Исправлено определение локального часового пояса на Linux.

  • Улучшена совместимость JDBC+MySQL драйвера с опцией transaction_read_only.

  • Улучшено сообщение об ошибках в различных компонентах.

  • Улучшено взаимодействие между master- и agent-нодами для работы с эмбеддингами.


Совместимость

Версия 13.11.0 полностью обратно совместима:

  • Нет ломающих изменений для стандартных сценариев использования

  • Лёгкий переход с любой предыдущей версии 13.x

  • Автоэмбеддинги работают вместе с текущими функциями поиска

  • API расширены, но не заменены

Цель — чтобы всё работало с вашими существующими данными и запросами без проблем.


Обновление

Чтобы обновиться, следуйте руководству по установке.

🚀Если хотите попробовать автоэмбеддинги — начните с документации.

Если потребуется помощь или есть вопросы:

Полный список изменений доступен в Changelog.

ссылка на оригинал статьи https://habr.com/ru/articles/947028/