KV-кэш, экспертное сообщество и критическое мышление
—
от автора
—
от автора
Меня давно волновала одна деталь в устройстве современных трансформеров (тех самых, которые GPT, Sonnet и прочие).Механизм внимания всегда работает только назад. От многих экспертов (включая курс Эндрю Ына на Курсере) я слышал такое объяснение: Слово не может ссылаться на слова,…
—
от автора
Бывший инженер Microsoft Дэйв Пламмер, работавший над добавлением поддержки ZIP-файлов в Windows и меню «Пуск» Windows NT, рассказал, как диспетчер задач на самом деле считывает загрузку ЦП. Пламмер создал оригинальный диспетчер задач и сделал этот инструмент простым с точки зрения программирования…
—
от автора
Я давно слежу за развитием локальных LLM, но всегда упирался в одно и то же — либо модель маленькая и качество не устраивает, либо большая и не влезает в видеопамять. Всё изменилось когда я наткнулся на статью про MoE-модели и…
—
от автора
Китайская глубоководная экспедиция успешно испытала передовое устройство, способное перерезать подводные кабели на глубине 3500 м. Министерство земельных и природных ресурсов КНР сообщило, что в первой половине апреля судно «Хайян Дичжи 2» завершило свою первую глубоководную научную миссию в 2026 году,…
—
от автора
Согласно анализу Futuresource CE, отслеживающему тенденции развития периферийных вычислительных систем для ИИ до 2030 года, персональная электроника приближается к тому моменту, когда совокупные вычислительные мощности ИИ в повседневных устройствах будут конкурировать с системами, которые когда-то занимали специализированные центры.В отчёте рассматривается…
—
от автора
Вот уже почти полгода, после ухода со службы в ФНС, я помогаю разбираться в реальных механизмах налогового контроля. Для связи с читателями я сделал телеграм канал «Налоговый Инсайдер», в котором отвечаю на вопросы и развенчиваю мифы, которые любят тиражировать различные…
—
от автора
У каждого специалиста в своей области есть профильное ПО. Даже для разработки ПО есть соответствующее ПО. И зачастую большинство специалистов не заботит «открытость» такого ПО. Более того, среди специалистов по разработке/моделированию спутников в России немало встречается авторских решений или решений,…
—
от автора
«Яндекс» совместно с пятью национальными исследовательскими университетами — Высшей школой экономики, Московским авиационным институтом, Национальным исследовательским ядерным университетом МИФИ, Московским физико‑техническим институтом и Университетом ИТМО — представили первую в России комплексную модель компетенций в сфере физического искусственного интеллекта. Об этом Хабру рассказали в пресс‑службе компании.Документ описывает ключевые…
—
от автора
Решили купить 3D-принтер. Зашли на форумы и сразу спор.Одни кричат: покупать готовый принтер. Только собрав аппарат из профиля и винтиков, поймёшь суть. Другие смеются и указывают на «закрытые коробки»: печатают прямо из упаковки, пока владелец самоделки собирает экструдер. Блогеры показывают…
—
от автора
Небольшая группа пользователей получила несанкционированный доступ к закрытой модели Claude Mythos Preview в день ее анонса — об этом пишет Bloomberg со ссылкой на собственный источник и увиденные документы. Источник подтвердил историю скриншотами и живой демонстрацией модели; сама Anthropic подтвердила,…