На чём учатся современные модели машинного перевода: опыт команды Яндекс Переводчика
—
от автора
—
от автора
В сервисе Яндекс Переводчик мы поддерживаем перевод между 102 языками. Наша цель — обеспечивать качественный перевод для самых разных типов данных: текстов, документов, HTML, изображений и видео. Сегодня обсудим ключевой компонент для обучения моделей машинного перевода — данные для обучения.Современные нейросетевые подходы очень требовательны как к объёму данных в обучении,…
—
от автора
Новые критерии для включения в Реестр отечественного ПО, инновации в области безопасной работы с данными и IBM урегулировал патентный спор. Рассказываем в нашем дайджесте про эти и другие новости в сфере интеллектуальной собственности. Прорыв в области безопасной работы с даннымиБлокчейн-платформа…
—
от автора
Привет! Я Тимур Низамутдинов, DevOps-инженер компании «Флант». Недавно мне потребовалось обновить кластер PostgreSQL, который обрабатывает более 20 000 транзакций в секунду и состоит из мастера и реплики, с версии 13 до 16 с минимальным простоем. Помимо перехода на более актуальную…
—
от автора
Исследователи продемонстрировали новую технику самосборки электронных устройств. В этом проекте, доказательстве работоспособности концепции, были созданы диоды и транзисторы, что открывает путь к самостоятельной сборке более сложных электронных устройств без использования существующих технологий производства компьютерных чипов.«Существующие технологии производства микросхем включают в…
—
от автора
Привет, Хабр! Сегодня я совершенствую дешёвую электрогитару TERRIS TTL-039 YW. Чтобы она не фонила, потребовалось экранирование графитовым лаком, а для комфортной игры пришлось исправить угол установки грифа относительно корпуса. И конечно же, я продемонстрирую ещё один вариант схемы темброблока, позволяющий…
—
от автора
На каждой технической конференции в последнее время обязательно звучит слово «агенты». Они преподносятся по разному: и как следующая ступенька после RAG, и как серебряная пуля для всех проблем, и как абсолютная замена всех классических пайплайнов. А кто еще не использует…
—
от автора
Привет! Меня зовут Даша, я фронтенд-разработчик отдела спецпроектов в KTS.В нашем отделе мы часто занимаемся разработкой ярких и креативных проектов, которые содержат в себе анимации. Сегодня хочу поделиться нашим опытом, рассказать про несколько способов создания анимаций и показать, в каких случаях…
—
от автора
Задача разработки перед выполнением проходит пять стадий принятия: отрицание, гнев, поиск в интернете, депрессия и чтение документации. Некоторым темы, затронутые в публикации будут знакомы, некоторым покажутся банальными, но, надеюсь некоторым они сэкономят немного времени и нервов. По сути это шпаргалка…
—
от автора
Хабр, привет! Это Леша Жиряков, техлид backend-команды витрины онлайн-кинотеатра KION. В мире дата-аналитики Pandas остается одной из самых популярных библиотек. Но это вовсе не значит, что нет других быстрых, удобных и производительных инструментов. Мой пост покажет альтернативы: от колоночной DuckDB…
—
от автора
Всем привет! Классический подход к авторизации — когда её контроль помещают внутрь конкретного сервиса в виде статических правил. То есть зашивают в код проверку ролей и прав из JWT‑токена. В первых версиях наших сервисов так и было сделано. Позднее родилась идея снять с них эту нагрузку и передать…