Автор: admin

  • DeepSeek выпустил V4 — открытую модель с контекстом в миллион токенов

    от автора

    Сегодня DeepSeek опубликовали две новые модели: V4-Pro и V4-Flash. Обе работают по архитектуре Mixture-of-Experts, веса доступны на Hugging Face под MIT-лицензией.V4-Pro содержит 1,6 триллиона параметров. Контекстное окно — один миллион токенов. При этом модель потребляет около 27% вычислений от того, что требовалось предшественнику DeepSeek-V3 при аналогичном контексте.V4-Flash меньше — 284 миллиарда параметров с 13 активными…

  • Реактивные серверы, или как перестать писать JavaScript и начать жить

    от автора

    Обзор Phoenix LiveView и его друзей из других стеков: Rails Hotwire, Laravel Livewire и Go Live/HLiveПреамбула: краткая история нежеланияВ начале двухтысячных, когда jQuery еще казался вершиной инженерной мысли, а слово «фреймворк» произносилось с придыханием и легким немецким акцентом, веб-разработчик был существом предсказуемым. Он писал HTML, немного CSS, чуть-чуть серверного кода — и уходил домой к шести.…

  • Ремонт техники без иллюзий: сложные ремонты, свой сервис и техноблог — интервью с Сергеем Павленко

    от автора

    Ремонт техники со стороны часто выглядит как ремесло про отвёртки, паяльник и «быстрые деньги». На практике это работа на стыке микроэлектроники, диагностики, клиентского сервиса и постоянного обучения. Один удачный ремонт может сэкономить клиенту десятки тысяч рублей, а одна ошибка — стоить инженеру нового устройства.Я, Александр, автор телеграм-канала «Shulepov Code», поговорил с Сергеем Павленко — инженером,…

  • GitHub Copilot приостановил платные подписки из-за дорогих ИИ-агентов

    от автора

    GitHub приостановил новые регистрации на индивидуальные платные планы Copilot Student, Copilot Pro и Copilot Pro+. Новым пользователям пока остается только Copilot Free, а уже существующие платные подписчики сохраняют доступ и могут переходить между тарифами. Компания объясняет решение ростом агентных сценариев: длинные параллельные сессии, агенты и субагенты стали потреблять намного больше вычислительных ресурсов, чем предполагала прежняя…

  • Моделирование резьбы для 3D печати

    от автора

    Не смотря на то, что в статье используется программа Компас 3D, методика (алгоритм) всё равно одинаковая, подойдёт и для реализации в других программах.Содержание статьи:Введение (о чём статья).Виды резьбовых соединений.Что необходимо учитывать при моделировании для дальнейшей печати.Подготовка среды для моделирования (подключение модуля для Компаса 3D).Конкретный алгоритм действий для PLA и PETG.Если неинтересны подробности, то рекомендую сразу…

  • OpenAI Privacy Filter: красивая архитектура в суровых условиях русского бенчмарка

    от автора

    22 апреля 2026 года OpenAI выпустила OpenAI Privacy Filter — открытую модель для поиска и маскирования PII в тексте. На бумаге это выглядит замечательно: небольшая специализированная модель, которую можно запускать локально и без отправки персухи на внешний сервер, длинный контекст и внятная таксономия чувствительных сущностей.Джонов из Айовы или Вошингтон Ди Си она находит замечательно, а…

  • DeepSeek представляет флагманскую модель искусственного интеллекта

    от автора

    DeepSeek представила предварительные версии новой флагманской модели искусственного интеллекта версии V4 Flash и V4 Pro, которые демонстрируют высочайшую производительность в тестах на кодирование и значительный прогресс в решении логических и агентных задач. Они оснащены несколькими обновленными архитектурами и оптимизированными функциями и могут работать с контекстом длиной в миллион токенов. DeepSeek отдельно выделил технологию, которую назвал гибридной…

  • Зарубежный трафик в российских сетях за 2025 год увеличился на 15-20%

    от автора

    Участники IT-отрасли и точки обмена трафиком сообщили СМИ, что фиксируют продолжение роста объёма зарубежного трафика в российских сетях связи. За 2025 год этот параметр увеличился на 15-20%. Сейчас доля иностранного трафика в Рунете, согласно экспертным оценкам, составляет около 30%. Профильные эксперты пояснили, что зарубежный трафик растёт в силу того, что российские пользователи активно работают с…

  • Как мы заставили vLLM «лениться» под нагрузкой и спасли Time-to-First-Token

    от автора

    Введение: Почему обычный Rate Limiting не работает для LLM?Деплой больших языковых моделей (LLM) — это всегда боль, когда дело доходит до пиковых нагрузок. В классических web-сервисах при высоких RPS мы просто включаем балансировщик, а если всё горит — жестко режем запросы HTTP 429 Too Many Requests.Но в мире генеративного AI отбрасывать запросы клиентов очень дорого:…

  • «Трубы» зовут — вспоминаем историю скринсейверов

    от автора

    Когда ЭЛТ-монитор долго показывает одну и ту же картинку, на экране навечно остается ее след — из-за выгорания люминофора. Многие из вас и так это знают, а кто-то даже видел такое своими глазами. Именно для решения этой проблемы и были придуманы скринсейверы — движущаяся картинка вместо статичной не позволяла экрану «застаиваться».Но в сегодняшней статье мы…