LLM-обзор 2024-2025 — живой путеводитель для тех, кто не хочет читать сухие отчёты
—
от автора
—
от автора
Когда в начале 2020-х мы привычно называли любую большую нейросеть «LLM», это звучало почти романтично. Сегодня, летом 2025-го, термин задышал новой плотью: модели выросли из «крупных языковых» в универсальные reasoning-машины, умеющие одновременно читать PDF-ы, смотреть на рентген и считать в…
—
от автора
Начинающие UI/UX-дизайнеры часто задаются вопросом: реально ли научиться дизайну бесплатно и качественно? Курсы стоят дорого, информации в интернете море – как понять, что действительно поможет в профессии? В этой статье мы разберём, где найти бесплатные и структурированные ресурсы для обучения…
—
от автора
Коллектив специалистов ведущих ИИ-компаний (более 50 участников, работают в OpenAI, Google DeepMind, Anthropic, Apollo Research и т.д.) опубликовал исследование, предупреждающее о том, что цепочки рассуждений сложных языковых моделей скоро могут стать непонятными для экспертов по безопасности. «Рассуждающие» модели вроде ChatGPT…
—
от автора
Группа «Т-Технологии» представила свою первую большую языковую модель с гибридным режимом рассуждений — T-Pro 2.0, входящую в семейство моделей Gen-T. Сообщается, что новая модель обеспечивает более высокое качество ответов на сложные запросы при двукратной экономии вычислительных ресурсов для русскоязычных задач…
—
от автора
Группа исследователей из Онкологического центра и Исследовательского института им. Хелен Ф. Грэм при клинике ChristianaCare и Университета Делавэра считает, что нашла ответ на важный вопрос биологии: как тело обновляет клетки органов, оставляя их структуру неизменной. В новом исследовании, опубликованном в…
—
от автора
В начале лета меня пригласили на Data Fest 2025 в секцию по менеджменту и научным инициативам в open source. Делюсь расшифровкой доклада, но не своего, а одного из коллег по секции. Это — Александр Нозик, директор Центра научного программирования.Научный центр…
—
от автора
OpenAI незаметно запустила тестирование новой модели под кодовым названием «o3-alpha-responses-2025-07-17» на платформе WebArena — открытой арене для сравнения ИИ-моделей через предпочтения пользователей.По данным издания BleepingComputer, которое провело собственное тестирование, o3-alpha демонстрирует значительно лучшие результаты в задачах, связанных с программированием, особенно…
—
от автора
FlexOlmo, разработанный в Институте искусственного интеллекта Аллена, демонстрирует возможность совместной работы организаций над языковыми моделями на основе локальных наборов данных без передачи конфиденциальных данных.FlexOlmo основан на архитектуре Mixture-of-Experts (MoE), где каждый эксперт соответствует модулю прямой передачи (FFN), обученному независимо. Фиксированная общедоступная…
—
от автора
В предыдущих статьях я приводила примеры применения техники тест-дизайна “таблица решений” для тестирования форм и алгоритмов. В этой статье я хочу привести пример, как применять таблицу решений для тестирования скриптов.За время работы на текущем проекте мне много раз приходилось тестировать…
—
от автора
Федеральный суд Калифорнии принял на рассмотрение коллективный иск на миллиард долларов против Anthropic, компании, создавшей языковую модель Claude, по обвинению в крупномасштабном нарушении авторских прав.В иске утверждается, что в период с 2021 по 2022 год Anthropic загрузила с пиратских сайтов,…