Обзор UDTF в PySpark
—
от автора
—
от автора
Привет, Хабр! Сегодня разберём фичу из PySpark — UDTF. Если раньше мы писали UDF и UDAF, то UDTF — это про функцию, которая запускается в секции FROM запроса и возвращает как бы несколько строк для каждой входной записи. Звучит круто.UDTFs…
—
от автора
Всё больше товаров и услуг в нашей жизни доступны только через смартфон. Доходит до абсурда, когда без специального приложения нельзя зарегистрироваться в важных сервисах, завести банковский счёт, взять самокат или вызвать такси, заказать еду, запарковаться, подписать документ или снять квартиру.…
—
от автора
Существует 2 крайности расчёта рекламного бюджета:«Давайте ещё зальём денег и посмотрим, что будет»«Денег нет — экономим. Бюджет на рекламу сокращаем в 2 раза. Когда будут продажи — увеличим»Последствия игры «Давайте ещё зальём бюджет и посмотрим, что будет»Абсурдность каждой крайности в…
—
от автора
В предыдущих статьях мы описали начало нашего пути тестирования AI моделей на предмет определения лучших и описали основные метрики, с помощью которых можно проводить такой анализ.В этом тексте приведен список найденных метрик для более детального и глубокого рассмотрения качества работы…
—
от автора
Каждый день мимо двери моего подъезда проходят десятки людей. Иногда это знакомые соседи, но чаще — курьеры или случайные гости.Домофонная камера всё записывает, но вручную пересматривать часы видео бессмысленно. Мне стало интересно: можно ли разово прогнать архив записей через алгоритмы компьютерного зрения и…
—
от автора
Нескончаемые гостевые книги, яркие анимированные баннеры и счётчики визитов… В нулевых каждый компьютерный энтузиаст мечтал о «своём месте» в интернете — даже если это был крохотный персональный сайт. Для этого существовали бесплатные хостинги: GeoCities, Tripod, FortuneCity, «Народ.ру», uCoz и им…
—
от автора
Состоялся релиз открытого проекта для Windows под названием Minimal PDF Compress 1.7. Это GUI (графический пользовательский интерфейс) для Ghostscript под Windows. Исходный код решения написан на Python и опубликован на GitHub под лицензией GNU Affero General Public License. В этой версии в решении появился новый инструмент «Восстановление PDF» и…
—
от автора
Привет, Хабр! Меня зовут Эля, я исследователь в ecom.tech. В этой статье расскажу, как мы измеряли юзабилити приложения для курьеров-партнёров, зачем мы это делали – и что из этого получилось. Все давно привыкли к мысли, что приложения должны быть удобными…
—
от автора
Занимаюсь разработкой под iOS с 2012 года. С SIP ранее не работал, и его интеграция оказалась куда сложнее, чем ожидалось. Ниже делюсь основными трудностями и решениями.Надеюсь получить конструктивную критику, а также советы по альтернативным подходам к решению описанных проблем.Итак, задача:…
—
от автора
В организациях зачастую можно наблюдать картину, когда разные отделы используют разные системы создания и ведения документации. Это ведет к нескольким проблемам: Отсутствие контроля структуры и содержания документа.Проблема совместимости файлов и форматов.Отсутствие единого хранилища и версионированию.Замедление согласования из-за отсутствия интеграции с системами…