От каши к структуре: гибридная AI-система для обработки свободного текста
—
от автора
—
от автора
Я занимаюсь проектом, где нужно из свободных текстов на естественном языке вытаскивать структурированные данные. Не разово — постоянно, по мере поступления. За несколько месяцев я перепробовал регулярки, чистый LLM и в итоге пришёл к гибриду. Ниже расскажу, что из этого…
—
от автора
Число коллекционеров Steam с билиотекой в более 40 тыс. игр пополнилось: к Sonix присоединились игроки Ian Brandon Anderson (41 090) и Axtor (40 553).По последним данным SteamDB, как минимум 120 пользователей Steam владеют библиотекой из 20+ тыс. игр, а у…
—
от автора
Привет, Хабр. Меня зовут Серафим Недошивин, я 18-летний разработчик на Go, PHP и TS. Эта статья не посвящена тонкостям устройства gc нашего любимого языка программирования Go и уж тем более не является строго технической. Более того, эта статья является своего…
—
от автора
Российский геймер Александр Трисвяцкий зарегистрировал сайт из недавнего приключенческого экшена Pragmata и наполнил ресурс мемами по серии хорроров Resident Evil. За созданием Pragmata и Resident Evil стоит японская корпорация Capcom.Ранее в этом году в сети обнаружили доменное имя, упомянутое в…
—
от автора
OpenAI выпустила GPT-5.5 с кодовым именем «Spud» — первую с нуля переобученную базовую модель со времён GPT-4.5. Разбираем факты.Память выросла в 8 разGPT-5.4 начинал путаться в фактах после 128 тысяч токенов. Новая версия держит контекст до 1 миллиона — это…
—
от автора
Samsung Electronics и Kingston планируют повысить цену на свои SSD. Изменения должны вступить в силу до конца недели, сообщает китайский ресурс ITHome.Согласно источникам в отрасли, Samsung уже предупредила дистрибьюторов о предстоящем пересмотре цен. Ожидается, что рост составит не менее 10%…
—
от автора
Российские регистраторы доменных имен обратились в Минцифры с просьбой отсрочить обязательное внедрение ЕСИА, запланированное на сентябрь 2026 года. Письма были отправлены в конце февраля, в числе адресантов — «Домены.ру», «СэйлНэймс» и «Перспектива», сообщает со ссылкой на копии документов ресурс Runet.С…
—
от автора
Вышла версия Cursor 3.2 – в ней разработчики интегрировали три крупных нововведения: команду /multitask для параллельных запросов через асинхронных саб-агентов, улучшенные worktrees в окне агентов, а также поддержку multi-root workspaces для кросс-репозиторных изменений.Главная фича – /multitask. Теперь вместо того, чтобы…
—
от автора
На этой художественной иллюстрации показано, как мог бы выглядеть Марс в случае терраформирования. Новое исследование демонстрирует, как последствия терраформирования — намеренного или случайного — могут помочь выявить скопления планет, пригодных для жизни и заселённых еюДва фактора играют доминирующую роль в…
—
от автора
Рассуждающие модели ИИ отвечают одинаково уверенно и тогда, когда действительно знают ответ, и тогда, когда просто угадывают. Исследователи из MIT CSAIL утверждают, что нашли корень проблемы и предложили способ ее исправить без потери точности. В конце апреля работу Beyond Binary…