DataScience Digest — 15.07.21

от автора

Встречайте свежий выпуск дайджеста полезных материалов из мира Data Science & Machine Learning и не забывайте подписываться на наш Telegram-канал.


Статьи

Catalyst.Neuro: A 3D Brain Segmentation Pipeline for MRI — обзорная статья о Catalyst.Neuro, новом пайплайне для обработки МРТ снимков мозга.

Effortless Distributed Training of Ultra-Wide GCNs статья о новом подтипе графических сверточных нейронных сетей.

Reverse Engineering Generative Models from a Single Deepfake Image — новый метод обнаружения глубоких фейков от Facebook AI и Мичиганского Университета.

Overview of Deep Learning Architectures Computers Use to Detect Objects — обзор архитектур нейронных сетей, используемых для обнаружения объектов.

How to Build E(n) Equivariant Normalizing Flows, for Points with Features? — методы и способы создания эквивариантных нормализующих потоков.

Do You Read Excel Files with Python? There is a 1000x Faster Way — методы ускорения работы с Excel файлами в Python

The Importance of Layered Thinking in Data Engineering -правильное мышление при разработке ML пайплайнов.

Elastic Distributed Training with XGBoost on Ray — эластичное распределенное обучение XGBoost на Ray в Uber.

Tuning Model Performance — статья о том, как Uber создает и поддерживает высокопроизводительные модели используя Michelangelo.

Научные статьи

ClawCraneNet: Leveraging Object-level Relation for Text-based Video Segmentation — новый метод обнаружения взаимосвязей между предметами для сегментации текстов в видео потоках.

Darker than Black-Box: Face Reconstruction from Similarity Queries — научная работа о реконструкции изображений лица с использованием запросов на сходство.

Probabilistic Graph Reasoning for Natural Proof Generation — работа о новом методе генерации естественных доказательств (PRobr).

Automated Graph Learning via Population Based Self-Tuning GCN — новый метод автоматического обучения графов с помощью самонастраивающейся GCN.

Automated Evolutionary Approach for the Design of Composite Machine Learning Pipelines — новый подход к дизайну композитных МЛ-пайплайно.

Книги

Data Science at the Command Line, 2e — сайт, на котором выкладывается части материалов из второго издания книги Data Science at the Command Line.

Курсы

Machine Learning Course from University of Oxford — сборник материалов курса по МЛ от Оксфордского Университета

Датасеты

Introducing the Habitat-Matterport 3D Research Data Set for Training Embodied AI — новый большой датасет с 3D изображениями жилых помещений


Спасибо, что дочитали этот выпуск. Надеюсь, каждый нашел для себя что-то полезное. Буду благодарен за любые предложения для следующего дайджеста.

Присоединяйтесь к Telegram-каналу дайджеста и его страницам в соцсетях: TwitterFacebook, а также подписывайтесь на нашу еженедельную рассылку.

← Предыдущий выпуск.

ссылка на оригинал статьи https://habr.com/ru/post/567832/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *