Месяц: Август 2019

  • Напиши свою песню за 10 минут (модуль textgenrnn Python3)

    от автора

    Сегодня попробуем обучить свою собственную нейронную сеть, чтобы писала текст для песен. Обучающей выборкой будут тексты группы «Руки Вверх». Ничто не мешает чтобы поменять данные на тексты своих любимых групп. Для извлечения данных с веб-сайтов используем Python3 (модуль BeautifulSoup). Задача будет состоять в том, чтобы выгрузить данные(тексты) c веб-сайтов а потом на их основе обучить…

  • Ускоряем распределенную обработку больших графов с помощью вероятностных структур данных и не только

    от автора

    Одним из самых ценных ресурсов любой социальной сети является «граф дружб» — именно по связям в этом графе распространяется информация, к пользователям поступает интересный контент, а к авторам контента конструктивный фидбэк. При этом граф является еще и важным источником информации, позволяющим лучше понять пользователя и непрерывно совершенствовать сервис. Однако в тех случаях когда граф разрастается,…

  • Ищем баги в PHP коде без статических анализаторов

    от автора

    Моя самая любимая часть в статическом анализе кода — это выдвижение гипотез о потенциальных ошибках в коде с последующей их проверкой. Пример гипотезы: Функции strpos легко передать аргументы в неправильном порядке. Но есть вероятность, что даже на нескольких миллионах строк кода подобная диагностика не «выстрелит», поэтому на неудачные гипотезы тратить много времени не хочется. Сегодня…

  • Шесть навыков, которые выведут вашу карьеру в Data Science на новый уровень

    от автора

    Перед вами перевод статьи Genevieve Hayes, Data Scientist с 15-летним опытом работы. Автор рассказывает о том, какие навыки стоит развивать, чтобы значительно увеличить шансы найти работу в Data Science. Чтобы определить эти навыки, она проанализировала 100 вакансий, размещенных работодателями из Австралии, Канады, Великобритании и США.

  • Как и зачем мы мигрировали Preply в Kubernetes

    от автора

    В этой статье я опишу наш опыт миграции Preply в Kubernetes, как и почему мы это сделали, с какими трудностями столкнулись и какие преимущества приобрели.

  • Психоанализ эффекта недооцененного специалиста. Часть 2. Как и зачем противостоять

    от автора

    Начло статьи с описанием возможных причин недооценности специалистов, можно прочитать, перейдя по «ссылке». III Противостояние причинам, вызывающим недооцененность. Вирус прошлого не поддается лечению – пока свое не возьмет, он не уйдет. Но ему можно и нужно противостоять – предупредить осложнения. Эльчин Сафарли. (Рецепты счастья) Выявив признаки и природу проблем, приводящих к недооцененности специалиста в местах…

  • Apple Music для разработчика

    от автора

    Вводные слова Как бы ни ругали Apple за закрытость платформы и самой экосистемы, некоторые их решения являются исключением. На рынке много стриминговых сервисов, но предоставляющих полноценный SDK для стриминга в сторонних продуктах крайне мало, для российского рынка список официально доступных SDK ограничивается Deezer и Apple Music. Конечно, когда на наш рынок придёт Spotify, на один…

  • Тестирование доступности сетей NB-IoT в СПб (август 2019)

    от автора

    Некоторое время назад операторы сотовой связи начали экспериментировать с новой технологией радиодоступа – NB-IoT. Напомню на всякий случай, что эта технология предназначена для низкопотребляющих устройств, которым нужно время от времени передавать небольшое количество данных на удаленный сервер. Я решил проверить, как обстоят дела с NB-IoT в г. С-Петербурге на август 2019 г.

  • Web scraping на R, часть 2. Ускорение процесса с помощью параллельных вычислений и использование пакета Rcrawler

    от автора

    В прошлой статье я с помощью скрэпинга-парсинга собрал с сайтов IMDB и Кинопоиск оценки фильмов и сравнил их. Репозиторий на Github. Код неплохо справился со своей задачей, однако скрэпинг часто используют для «соскабливания» не пары-тройки страниц, а пары-тройки тысяч и для такого «большого» скрэпинга код из прошлой статьи не подходит. Точнее будет сказать не оптимален.…

  • Нейросети и глубокое обучение: онлайн-учебник, послесловие: существует ли простой алгоритм для создания интеллекта?

    от автора

    Содержание Глава 1: использование нейросетей для распознавания рукописных цифр Глава 2: как работает алгоритм обратного распространения Глава 3: ч.1: улучшение способа обучения нейросетей ч.2: почему регуляризация помогает уменьшать переобучение? ч.3: как выбрать гиперпараметры нейросети? Глава 4: визуальное доказательство того, что нейросети способны вычислить любую функцию Глава 5: почему глубокие нейросети так сложно обучать? Глава 6:…