Онлайн-конференция на Ярмарке вакансий для ИТшников

Сегодня, 25-го февраля, HeadHunter устраивает «Ярмарку вакансий онлайн» специально для IT-специалистов. Программа получилась обширная: кроме вакансий с онлайн-собеседованиями, мы подготовили для вебинары, которые покрывают разные сферы из ИТшной и софтверной области. Сегодня нон-стоп один за другим пройдут 9 вебинаров. Специально для “Хабра” я попросил авторов вебинаров рассказать о своих темах, подробности под катом.

Полное расписание вебинаров вы можете увидеть в конце статьи. От себя замечу, что программа у нас получилась насыщенная и рассчитанная на разных специалистов: от тимлидов и руководителей проектов до аналитиков и (будущих) дата сайентистов.

Data Science: с чего начать опытному программисту (15:00 — 15:45)
Петр Ермаков (@couatl), Data Scientist в HeadHunter

Десять лет, когда я только начинал программировать, анализ данных казался мне чем-то очень далеким и сложным. Написанный алгоритм Random forest, занимал несколько тысяч строчек кода на C++, а найти хорошую реализацию его в интернете было нетривиальной задачей. Мощность моего стационарного компьютера позволяла решить простую задачу всего за ночь. Если подытожить, то анализ данных — это долго, трудно и очень неудобно. Было. Сейчас же все популярные алгоритмы машинного обучения уже реализованы в библиотеках, которые есть для большинства популярных сейчас языков программирования. Так к примеру выглядит запуск того же Random forest в языке Python:

import pandas as pd from sklearn.ensemble import RandomForestClassifier train = pd.read_csv(’train.csv') test = pd.read_csv(’test.csv’) rf = RandomForestClassifier() predict = rf.fit(train.drop(’target', 1), train.target).predict(test) 

6 строк кода и предсказание на основе алгоритма Random forest уже готово. Если присмотреться, то анализ данных заключен всего лишь в единственной последней строке.
Кто-то скажет, что если мериться строчками, то код на C++ можно вообще одну строчку написать. Но это не будет так элегантно 🙂 Хотя он будет прав, что мера строчками кода не всегда объективна.
Кто-то скажет, что это не анализ данных: тут нет кросс-валидации, потому возможно переобучение; тут нет работы с данными, потому мы не используем информацию из данных на 100%. Это правда, но это вы узнаете из вебинара, а приведенный код является всего лишь примером.
Конечно же после 50 минутной лекции вы не станете экспертом в области анализа данных и не пойдете занимать первые места Kaggle. Это и не цель (зачем мне конкуренты? :))
Целью является довести до вас, что начать анализировать данные достаточно просто и начать это можно уже сегодня.

Как принимать инженерные решения в условиях неопределенности? (12:00 — 12:45)
Сергей Баранов, Agile архитектура / Agile Coaching, ScrumTrek
Ежедневно мы, как разработчики, архитекторы, сисадмины, владельнцы продуктов, сталкиваемся с проблемой выбора, проблемой принятия инженерных решений. Бравые мастера дебагера и компилятора — непосредственно; заказчик — порой даже и не догадываясь об этом. Не последнюю роль в наших решениях играют особенности психики и поведения человека. Программисты рвутся удовлетворить свои инженерные амбиции, админы с опаской смотрят на все новое и неизвестное (разумеется, не всегда :)), опыт прошлых лет неминуемо несет нас в статичный мир привычек и обманчивого чувства определенности. Но мир не таков. И каждое решение, будь то количество классов в пакете, скорость алгоритма сортировки, выбор фреймворка или процент покрытия кода тестами, мы должны принимать осознанно и обоснованно. О том, чем руководствоваться, когда вокруг так много неизвестного и как не пойти на обманчиво-манящую поводу привычки и ложной уверенности, этот вебинар.

Задачи, которые ставит перед аналитикой ecommerce и ритейл (14:00 — 14:45)
Антон Лукьянов / Руководитель группы интернет-аналитики в «Эльдорадо»
Все согласны, что результат очень важен — оценка в университете, победа на конкурсе, премия за успешно завершенный проект. На пути к достижению результата перед Вами встает много выборов, а значит, необходимость принять решение. Для того чтобы принять взвешенное решение, Вам нужна информация и инструменты ее интерпретации. Сбор информации и производство вывода из нее – то чем занимается современная аналитика.

Если Вы задумались о смене профессии, или только что получили диплом и выбираете направление старта карьеры, если Вы хотите получать результаты и помогать бизнесу их достигать, если Вы хотите сделать осознанный выбор профессии и получить результат — успешно пройти собеседование на позицию аналитика, то Вам нужна информация.

На вебинаре мы пройдем путь, с которым сталкивается аналитик в своей работе:

  • Что решаем? Классические задачи, с которыми сталкивается аналитика. Предсказание, оценка, оптимизация.
  • Откуда данные? Аналитическое хранилище данных. Особенности инфраструктуры, необходимой в аналитике розничного бизнеса.
  • Как решаем? Инструменты аналитика. Скриптовые языки, как основной инструмент работы. Плюсы и минусы Enterprise решений. Open source решения.
  • Аналитика для бизнеса или бизнес для аналитики? О важности коммуникации между подразделениями.


В конце вебинара будет чеклист основных навыков для успешной работы в аналитике и ресурсы для дальнейшего развития.

Основы Agile для разработчиков (18:00 — 19:00).
Борис Вольфсон, директор по развитию HeadHunter
Некоторое время назад, я сформулировал для себя то, как я понимаю Agile: «Agile – подходы к созданию продуктов, путем непрерывной быстрой поставки ценного рабочего функционала самоорганизованной командой профессионалов в сотрудничестве с заказчиком». В рамках данного вебинара мы посмотрим, как появилась гибкая модель разработки в противовес водопадной.

Посмотрим ценности Agile, на которых строятся гибкие практики и методологии:

  1. Люди и взаимодействие важнее процессов и инструментов
  2. Работающий продукт важнее исчерпывающей документации
  3. Сотрудничество с заказчиком важнее согласования условий контракта
  4. Готовность к изменениям важнее следования первоначальному плану

Подробно будет рассказано про Scrum (роли, процессы и артефакты) и полезные практики, которые обычно применяются совместно с этим фреймворком:

Полное расписание вебинаров

Время указано московское. Вебинар можно сразу поставить в календарь, чтобы не пропустить. Все вебинары бесплатные

10:00 — 10:45 – Обзор рынка труда для IT-специалистов
11:00 — 11:45 – Деньги в IT: госкомпании, стартапы, аутсорс, продукт и т.д. Где программисту жить хорошо?
12:00 — 12:45 – Роль ИТ-специалиста в компании, использующей enterprise-решения
13:00 — 13:45 – Как принимать инженерные решения в условиях неопределенности?
14:00 — 14:45 – Задачи, которые ставит перед аналитикой ecommerce и ретейл
15:00 — 15:45 – Data Science: с чего начать опытному программисту
16:00 — 16:45 – Лаборатория Касперского: Не только антивирусы
17:00 — 17:45 – Работа в компании или магистратура: раскрываем плюсы и минусы для разработчика
18:00 — 18:45 – Основы Agile для разработчиков

Про “Ярмарку вакансий онлайн”

“Ярмарка вакансий онлайн”- это мероприятие, и логика поиска работы здесь отличается от работных сайтов. Для того, чтобы работодатель увидел вас, необходимо откликнуться на вакансию, отправив резюме или задать вопрос на виртуальном стенде. Без этих действий ваши данные будут недоступны работодателю. Вакансии на «Ярмарке…» разместят: «Лаборатория Касперского», DzenLab, «СКБ Контур», Головная компания «Магнит», Veeam Software, MERA, TNS, РТ Лабс, ПАО «МегаФон», «АБИ Продакт», USETECH и другие.

Предложения по развитию проекта можно озвучивать в комментариях или присылать нам на почту: expo@hh.ru, будем рады!

ссылка на оригинал статьи https://habrahabr.ru/post/277851/

Винил: новое – это хорошо забытое старое

Еще несколько лет назад идея покупать (и уж тем более выпускать) пластинки на виниле казалась безнадежно устаревшей.

Тем не менее, сейчас винил – популярный носитель, наличие которого в тематических магазинах (например, у нас в Аудиомании) воспринимается чем-то само собой разумеющимся – на виниле выходят альбомы исполнителей самых разных жанров: от переиздания Creedence Clearwater Revival до Тейлор Свифт.

Как обстоят дела в индустрии в целом

Действительно, сейчас индустрия винила переживает то, что критики называют «вторым рождением»: на смену кассетам и CD-дискам снова приходят пластинки. Некоторые обозреватели считают, что активное возрождение старого формата началось в 2007 году, когда был учрежден так называемый День музыкального магазина (третья суббота апреля, в 2016 году праздник придется на 16 апреля).

В этот день по всему миру в магазинах, продающих «грампластинки», поступают в продажу новые альбомы (в этот день происходит порядка 400-500 релизов). Для поддержания интереса аудитории ежегодно назначается посол праздника из числа популярных музыкантов («послами» были, например, Игги Поп и Джек Уайт, чей альбом Lazaretto стал одной из самых продаваемых виниловых пластинок начиная с 1991 года).

Статистика подтверждает, что шумиха вокруг винила возникла неспроста: Согласно отчету Nielsen, в период с января по март 2015 года продажи винила были на 53% выше, чем в аналогичный период 2014 года (а за весь 2014 год объем продаж в США составил 9,2 млн пластинок – при том, что в 2007 году в Штатах был продан лишь миллион записей на виниле).

Справедливости ради стоит отметить, что объемы продаж винила по сравнению с другими носителями остаются незначительными. Но в целом с 2009 года объем продаж пластинок вырос на 260% – серьезный показатель, учитывая, что винил еще в конце девяностых казался вчерашним днем.

Отмечают возросший спрос на винил и российские продавцы пластинок, в том числе и Аудиомания:

Мы начали продавать виниловые пластинки и не прогадали, сейчас их оборот миллионный – не по числу проданных копий, а по выручке. Спрос растет постоянно, не успеваем закупать пластинки

– Тимофей Шиколенков, директор по маркетингу и развитию бизнеса в Аудиомании

Кто производит винил

Марк Фaйдерб, менеджер Universal Music, назвал день музыкального магазина «лучшим, что когда-либо происходило» с независимыми музыкальными магазинами. Однако, выигрывают от этого праздника не только магазины, но и инди-лейблы, выпускающие многие из релизов, которые приходятся на этот день, а также фабрики по производству самих пластинок.

Создание небольших компаний по производству винила в тех же США сейчас – достаточно неплохой бизнес: спрос на винил намного превышает предложение. Лейблы и исполнители, желающие выпустить свою пластинку на виниле, вынуждены вставать в очередь на производство – компании-производители порой изготавливают партии пластинок с задержкой на 2-3 месяца, некоторые при этом жертвуют качеством продукции – и все равно не укладываются в сроки.

Казалось бы, при таком стабильном росте интереса со стороны общественности, ниша производителей винила должны была заполниться довольно быстро – однако этому мешает несколько факторов.

Первый из них – то, что в 90-е годы индустрия винила практически «встала», в связи с чем заводы, выпускающие станки для производства виниловых пластинок и металлических матриц (негативов, с которых «штампуются» пластинки) массово закрывались. Из-за этого конкуренции на рынке производителей прессов практически нет, и новые станки стоят баснословных денег: в Штатах новые прессы выпускает в последнее время только компания Record Products of America.

Два ручных пресса от этого производителя обойдутся в $130 000 – чтобы покрыть такие расходы, небольшим заводам по производству пластинок пришлось бы увеличивать цену на свой товар минимум в четыре раза.

В этой связи компании, изготавливающие виниловые пластинки как в США, так и в Европе (всего в мире работают порядка 40 таких производств), вынуждены запускать старые станки 70-х или даже 60-х годов, находившиеся долгое время в консервации. Исключение составляет, разве что, United Record Pressing в Нэшвилле, США – эта относительно крупная компания может позволить себе приобрести новые прессы, но даже им приходится идти на разные уловки, чтобы завладеть станками для выпуска мастер-дисков – последние из них компания, по словам руководства, приобретала у Церкви Сайентологии (последователи Рона Хаббарда некоторое время записывали его выступления на винил).

Цена на новые станки оказывается «неподъемным» входным барьером, мешающим всем желающим заняться выпуском пластинок, количество бывших в употреблении и готовых к работе прессов тоже невелико – все это не позволяет индустрии по производству винила набирать обороты так быстро, как хотелось бы лейблам.

Другая проблема – отсутствие квалифицированных кадров на производстве. «Сейчас трудно найти квалифицированного прессовщика. Это своего рода ремесло, – говорит Марк Рейни, владелец завода Cascade Record Pressing в США. – Спрос на прессовщиков должен подтолкнуть больше молодых людей обучаться этой профессии, потому что опытные прессовщики уже выходят на пенсию».

Тем не менее, производство винила постепенно оживает. Даже используя старые станки, независимые производители винила выпускают порядка тридцати-сорока тысяч пластинок в месяц. Для более крупных заводов эта цифра вдвое больше – американский производитель Gotta Groove Records штампует по 80 тысяч пластинок в месяц. А виниловые гиганты вроде чешского GZ Media в месяц выпускают до полутора миллионов пластинок, при этом не используя все имеющиеся в распоряжении завода прессы – и, судя по всему, не собираются останавливаться на достигнутом.

На чем сейчас проигрывают винил

Стоит отметить, что новая волна интереса к винилу «взбодрила» и производителей проигрывателей пластинок. Тимофей Шиколенков в одном из выпусков подкаста «Звук» активно обсуждал тему мифов о виниле, и в том числе коснулся темы проигрывателей:

Стоит понять, что те проигрыватели, которые стоят у бабушек и дедушек, отслужили свое. Технологии ушли далеко вперед, а те проигрыватели были даже не бытовые – они в основном были предназначены для того, чтобы хорошо воспроизводить сказки. Это не то, что сейчас идет мейнстримом – винил выпускают для тех, кто очень любит музыку.

«Очень любить музыку» на проигрывателе «Электроника 3.2.3» не получится, поскольку качество воспроизведения будет соответствующим. Это низший уровень бытового проигрывателя, он годится для музея. То же самое можно сказать про [старую] пластинку.

– Тимофей Шиколенков

И если производители пластинок выпускают винил преимущественно на старом оборудовании, то на заводах по изготовлению проигрывателей все устроено по последнему слову техники. Например, на заводе Clearaudio, который специализируется на проигрывателях винила, станки, управлять которыми нужно вручную, используются только для изготовления прототипов и обучения новичков (в производстве заняты современные станки с ЧПУ).

Между прочим, в самом офисе Clearaudio хранится огромная семейная (сама компания тоже выросла из семейного бизнеса) фонотека виниловых записей классической музыки:

Фотоэкскурсия по офису и заводу Clearaudio есть здесь: 1, 2

Винил как высокое искусство…

Так почему же винил резко стал таким популярным? Скорее всего, причин тому несколько. Во-первых, возросшая популярность винила связана с представлениями о нем, как об «элитарном» носителе. Элитарность в данном случае можно трактовать по-разному.

Можно рассматривать элитарность как синоним денег: если раньше простенький проигрыватель был практически в каждом доме, то сейчас качественное устройство воспроизведения пластинок может стоить немало. И это не говоря уже о комплектующих, о том, что дорогой проигрыватель – это, фактически, один из знаковых элементов интерьера: появившись в комнате, он должен занять свой «пьедестал» и (наряду с пластинками) формирует вокруг себя своеобразную атмосферу.

Посмотрите, как этот прием умело обыгрывается в современном кинематографе:

Поистине огромная фонотека – один из мощнейших стилевых «центров притяжения» в офисе «лучшего юриста Нью-Йорка» Харви Спектера из сериала Suits

А в фильме «Механик» с Джейсоном Стэтхемом фонотека и виниловый проигрыватель – не просто «сердце» дома киллера, но и полноправные участники боевика (те, кто смотрел фильм, сразу вспомнят, о чем идет речь)

В обоих случаях виниловый проигрыватель и фонотека – это не только способ декораторов заявить о «статусности» их владельца, но и интересный художественный прием, позволяющий раскрыть характер персонажей. Что подводит нас ко второму варианту трактовки понятия «элитарности» винила – винил как символ элитарной культуры (аристократичной, самодостаточной, принципиально закрытой), подразумевает, что процесс прослушивания – это своего рода священнодействие, особый ритуал.

Согласно этому представлению, те, кто выбирает винил как музыкальный носитель, готовы тратить время и силы на подготовку к просушиванию (почистить, протереть, сдуть пыль, занять место «в первом ряду»), и слушают в таком формате не «абы что», а только милые сердцу мелодии. Эта в некотором роде даже нарочитая «ритуальность», кстати, прекрасно показана в том же «Механике» – вспомните, сколько экранного времени там отдано процессу прослушивания виниловой пластинки.

В случае с винилом присутствуют некие тактильные ощущения. Одно дело скачать файл, нажать кнопочку и слушать его, другое – взять с полки конвертик, достать из него пластинку, протереть бережно пыль щеточкой, поставить ее на проигрыватель, включить, наслаждаясь самим процессом

– Тимофей Шиколенков

Современный кинематограф любит эксплуатировать образы виниловой пластинки и проигрывателя как атрибутов богатой жизни современного интеллектуала (кстати, в этом случае на виниле в кино, слушают, как правило, не поп и рок, а джаз и классику – еще один камешек в огород денди) – естественно, такие параллели не могут не привлечь внимание аудитории.

…И как субкультура

На другом краю спектра поклонников винила находится субкультура, прямо противоположная – молодые хипстеры, активные участники «музыкальной тусовки». Для них винил как символ несет совершенно иной эмоциональный заряд и популярность его формируется из других составляющих.

Во-первых, винил – живое свидетельство «эпохи ретро» – а внутри этой субкультуры все, что имеет некое отношение к «винтажному прошлому», пользуется большим уважением.

Во-вторых, молодежная субкультура (будь то хипстеры или иные ее характерные представители) ценят все независимое: будь то инди-лейблы, независимые молодые исполнители, маленькие (и, естественно, независимые) музыкальные магазины, торгующие плодами труда этих самых музыкантов и лейблов (отличный киношный образ такого представителя поклонников винила из среды молодежной субкультуры, полностью противоположного образу богатого денди, воплотил на экране Джесси Айзенберг в «Ультраамериканцах»).

Именно поэтому в США, например, современное производство винила очень часто тяготеет к центрам притяжения современной молодежной субкультуры: так, компания Cascade Record Pressing обосновалась неподалеку от города Портленд, известного своей сильной музыкальной сценой.

А успех United Record Pressing в Нэшвилле многие объясняют тем, что этот город с его исторической связью с кантри притягивает музыкантов – в том числе и популярных у молодежи (в Нэшвилле, к примеру, записывался последний альбом американского кантри-рэпера Yelawolf – само собой, он вышел в том числе и на виниле).

Местная община — мать и для поп-музыки. Мы не бежим от современных технологий. Просто нам кажется, что использовать ленточный микрофон или аналоговую ленту куда романтичней. С другой стороны, так работать тяжелее — и это, наоборот, хорошо, потому что добавляет ценности конечному результату

– Бен Суонк, со-основатель Third Man Records

Не последнюю роль в популяризации винила в молодежной среде играют и «сопутствующие материалы» – уже упоминавшийся выше альбом Джека Уайта Lazaretto, например, вышел на виниле в сопровождении 40-страничного буклета, постера и фотографий. В такой компании (упаковка винила – это почти всегда серьезная работа для дизайнера) пластинка становится артефактом – скорее символом, нежели носителем информации.

Точно такую же роль выполняют и современные технологии на производстве самой пластинки – например, американская компания-изготовитель винила Gotta Groove 40% всей своей продукции производит в цвете.

ПВХ-гранулы, использующиеся для производства пластинки (в данном случае пластинка, судя по всему, будет розового цвета). Фото Мары Робинсон для Pitchfork

Сотрудники Gotta Groove отмечают, что при современном уровне технологий «запечатать» в пластинку можно самые разные объекты и субстанции – и музыканты (а также их аудитория) воспринимают эту идею с большим энтузиазмом. Например, на фабрику поступали заказы на создание прозрачных виниловых пластинок, в тело которых исполнители хотели поместить пепел от сгоревшей Библии, мелко порубленные купюры и даже кровь (на большую часть таких предложений компании-изготовители пластинок, как правило, отвечают отказом).

Естественно, такой яркий (а в некоторых случаях – и пугающий) объект уже перестает восприниматься как музыкальный носитель – это сувенир, место которого в рамке на стене (в этом случае даже отсутствие проигрывателя – не помеха при принятии решения о покупке пластинки).

Винил сегодня – это атрибут красивой жизни, философия, предмет коллекционирования, артефакт, выбор любителей независимых музыкантов и просто музыкальный носитель со своими особенностями, преимуществами и недостатками. Будем надеяться, что он с нами всерьез и надолго – какие бы причины ни лежали в основе его возвращения.

ссылка на оригинал статьи https://geektimes.ru/post/270418/

Улучшаем свой английский: изобретаем субтитры заново


1. Intro

— Татьяна Леонидовна, а можно, мы посмотрим это кино с субтитрами?
— Нет, малолетние дятлы, мы тренируем ваше слуховое восприятие, поэтому кино вы будете смотреть без них! С субтитрами вы будете только читать текст и не слушать.
— Татьяна Леонидовна, но без субтитров мы больше половины не понимаем!
— А вот это уже ваши проблемы.

Начало 2000-х, диалог с учителем во французской спецшколе, Санкт-Петербург.

2. В чем дело?

Сериалы и фильмы — прекрасная штука для улучшения английского. Ты уже знаешь грамматику, владеешь большим набором слов. Поддерживать свободную беседу с носителем языка еще рано, а практиковаться в тестах и упражнениях — уже скучно. Ты начинаешь смотреть кино и сериалы.

Смотришь себе и смотришь. Вроде все ясно-понятно, но тут начинается быстрый диалог двух героев, из которого ты понимаешь только предлоги. Ок, включаем сабы. И они решают проблему — ты начинаешь понимать происходящее.

Однако, посмотрев несколько видео с сабами, люди часто замечают две вещи.

  • Вместо тренировки восприятия на слух ты становишься мастером по скоростному чтению сабов на иностранном языке. Теперь ты быстро понимаешь фразу, только взглянув на нее, но слуховое восприятие прогрессирует незначительно. Отключив отображение сабов, ты снова перестаешь понимать, что же происходит в некоторых сценах на экране. Школьная учительница Татьяна Леонидовна была права, запрещая нам смотреть французские фильмы с сабами — «малолетние дятлы» и правда не прогрессировали в восприятии на слух и в языковом мышлении.
  • Некоторые участки фильма остаются абсолютно непонятными из-за того, что содержат трудные слова. «I can’t jeopardize my company’s success»? Что, простите? Jeopardize?. Окей, Гугл, я поставлю кино на паузу, а ты скажешь, что это значит.
    Есть ребята, которые предлагают смотреть фильмы с субтитрами сразу на двух языках — английском и русском. Что быстро делает вас уже абсолютным чемпионом в скоростном чтении сабов на двух языках, но мало способствует слуховому восприятию и выработке языкового мышления.

Без сабов бывает ничего не понятно, а с сабами тормозится прогресс в слуховом восприятии и… все равно бывает непонятно.

3. Now what?

На этом скрине из «Южного Парка» видно 7 слов. 6 из них знакомы почти всем, изучающим английский. И их вполне можно узнать и понять, даже если они произнесены быстро и с акцентом. Остается одно слово, с которым (с высокой вероятностью) будут проблемы. Слово weary — уставший, утомленный.

  • Это слово не так часто встречается. Велик шанс, что вы не распознаете его на слух.
  • Хорошо бы прямо на экране показать перевод. Иначе либо придется отвлекаться и переводить со словарем, либо просто забить и смотреть дальше.

А остальные слова можно выкинуть. Они знакомы почти всем и совершенно не нуждаются в показе на экране. Если применить эту логику к остальным сценам, мы получим сабы, в которых появляются только трудные слова, а остальное нам придется слушать и понимать.

Как оказалась, эта идея совсем не нова. Беглый гуглинг показал, что как минимум несколько блоггеров писали статьи с аналогичной идеей, но предлагали делать адаптацию субтитров вручную. А мы, гики, будем делать автоматическую адаптацию сабов программно!

3. Строим велосипед

Задача сводится к поиску сложных слов в тексте, которые нуждаются в переводе.

Основная идея в том, что можно проанализировать ооооочень много текстов на английском, посчитать статистику по использованию слов и понять, что одни слова используются намного реже, чем другие. Эти редкие слова и подпадают под понятие «сложное слово» — они редко встречаются, поэтому вы не знаете их перевода и написания.

Я уже занимался всем этим в качестве хобби после работы (кстати, вот статья о том, как все начиналось). Все это вылилось в проект Bamboo Ninja, который позволяет анализировать книги на английском, находить сложные слова в них, вставлять перевод и собирать книгу обратно. Субтитры — это тоже текст, поэтому я возьму наработки оттуда и применю их к субтитрам.

Мы открываем сабы, разбиваем их на кусочки, потом на отдельные слова и начинаем анализ. Для каждого слова нам нужно решить задачу бинарной классификации — пропустить слово через алгоритм, который вернет на выходе 1 или 0 — является ли слово простым для изучающего английский или сложным. Свое решение классификатор делает на основании статистических данных, полученных из анализа ~40 Гб текстовых данных из разных источников (вообще стоило собирать данные действительно по очень разным источникам: выпотрошить логи чатов, новости, тексты песен. А я поленился и использовал в основном тексты книг, но об этом чуть позже).

Дальше идет некоторое количество возни с базой данных, написания кода и получаются сабы, которые выглядят примерно так

3. Ездим на построенном велосипеде

Я прогнал через программу 3-4 десятка сабов, оценил значения метрик, которые выдал анализатор. Попробовал смотреть фильмы с тем, что получилось. Показывал друзьям, знакомым и посетителям сайта.

Для оценки результатов я использовал две классические метрики для задач машинного обучения:

  • Точность (precision) — способность правильно классифицировать слово
  • Полнота (recall) — способность находить все слова, требующие перевода

Выяснилось, что значения метрик имеют тенденцию прыгать от фильма к фильму. На одних фильмах полнота и точность показывали 85%-90% от желаемого, а на других — в районе 55%. Покопавшись в проблеме, я нашел причину — большую часть данных для статистического анализа я собрал из художественных книг за последние 300 лет и некоторые слова в них встречаются чаще, чем встречаются в современном английском. Например, слово bayonet (штык) в те времена встречалось гораздо чаще, чем сейчас, но наш классификатор это слово считает не таким уж редким.

Хотя Колин, мой друг из Британии, долго смеялся и сказал, что выражение «мой мясной штыком» (beef bayonet) сейчас очень часто встречается среди военных, но этот случай мы рассматривать не будем.

Я решил откатиться к старой версии классификатора, который я использовал еще несколько месяцев назад. Он был построен еще летом с использованием всего лишь 500 больших книг, но книги в той выборке были более разнообразными: «Гарри Поттер», «Песнь льда и пламени», техническая документация для программистов, книги по психологии, медицине и многое другое. Классификатор с меньшим но более разнообразным количеством данных оказался на порядок лучше, чем классификатор, построенный только на английской художественной литературе. Алгоритм распознавания слов стал ошибаться намного реже.

Полученный результат в целом отвечает цели, но алгоритм все еще выдает сабы, пригодные для человека, имеющего солидный опыт в использовании английского. Нужно иметь определенный навык в распознавании речи на слух и ощутимый словарный запас в несколько тысяч базовых слов. В этом случае сабы сослужат хорошую службу в улучшении английского.

Все свои опыты я оформил в сервис и прикрутил к своему хобби-сайту и добавил туда же небольшую библиотеку сабов для желающих потестить эту штуку не отходя от кассы.

4. Outro

Превратить просмотр сериалов в учебный процесс вместо тупого чтения с экрана кажется стоящей задачей. А улучшение работы алгоритмы позволит провести с пользой еще много вечеров.

Всем спасибо! Хороших фильмов и успехов в английском.

ссылка на оригинал статьи https://geektimes.ru/post/271208/

Краткая история ZTE: почему стоит доверять китайским гаджетам

Китайская компания ZTE была основана в 1985 году, хотя даже сейчас её сложно назвать известной на российском рынке. В 2011 она была вторым по величине производителем телекоммуникационного оборудования и мобильных телефонов в Китае. Она внесена в листинг Шэньчжэньской и Гонконгской фондовых бирж, и входит в состав индекса Hang Seng China Enterprises Index.

К тому же ZTE имеет 13 научно-исследовательских центров в Китае, США, Швеции и Корее, на которые тратит 10% годового дохода, и является партнёром Intel, Microsoft, IBM и Qualcomm.

51,8% акций ZTE принадлежит КНР, а это значит, что за качеством продукции следят власти страны.

image

В 1985 году группа инвесторов совместно с Министерством аэрокосмической промышленности КНР основала компанию Zhongxing Semiconductor Co., Ltd в Шэнчьжэне, где до сих пор остаётся головной офис компании. В марте 1993 название изменили на Zhongxing New Telecommunications Equipment Co., Ltd… Своё нынешнее название ZTE получила позже.

В 1997 году разместила акции на Шэньчжэньской фондовой бирже. Спустя семь лет она вошла в листинг Гонконгской биржи.

Большую часть прибыли компания получала на домашнем рынке, но в 2004 году полученные от размещения акций деньги она направила на R&D, чтобы выйти на мировой рынок. В 2006 году ZTE взяла 40% всех новых заказов на оборудование для CDMA-сетей, возглавив мировой рынок в этой отрасли. Среди клиентов компании была канадская государственная телекоммуникационная компания Telus, а сама ZTE вошла в Wi-Fi Alliance.

В 2007 году ZTE продавала оборудование британской Vodafone, испанской Telefonica, австралийкой Telstra. В 2008 году клиенты ZTE были в 140 странах.

В 2009 ZTE вышла на третье место в в списке вендоров GSM-оборудования, и 20% всего этого оборудования, продаваемого в мире, имело логотип компании.

Интересный факт: первый смартфон с GPS/ГЛОНАСС на борту был выпущен ZTE под именем МТС Глонасс 945.

image

ZTE заявляет, что тратит 10% своего годового дохода на R&D. Исследовательские центры компании работают в нескольких странах, а всего у компании есть более 48 тысяч патентных заявок и 13 тысяч патентов. В 2011 и 2012 годах ZTE получила больше патентов, чем любая другая компания. Эта компания — один из крупнейших производителей телекоммуникационного оборудования в мире, но при этом — ещё и производитель смартфонов.

В 3 квартале 2015 года по данным Gartner ZTE продала 13,7 миллионов смартфонов и заняла 9 место в мировом рейтинге производителей, отхватив 2,9% мирового рынка.

На российский рынок компания вышла лет пять назад, но тогда это были брендированные сотовым оператором телефоны. А сейчас компания предлагает ряд бюджетных телефонов и один мощный ZTE Axon Mini. Дело в том, что ещё год назад Россию не рассматривали в качестве рынка, на котором нужно продавать премиальные смартфоны, флагманы компании. Вместо этого предпочли продавать бюджетники и середнячки.

Например, ZTE Blade V2 Lite. Этот смартфон по цене около семи тысяч рублей имеет пятидюймовый TFT-экран с разрешением всего 854×480, всего 1 ГБ оперативной памяти и 8 ГБ встроенной. Зато он может похвастаться аккумулятором на 3400 мАч, двумя симками и поддержкой LTE. И весом в 150 граммов — можно обороняться от гопников. А по производительности бенчмарк Antutu поставил его между LG G3 и HTC One.

image

image

Были и ещё менее мощные гаджеты, которые можно отдать ребёнку. Например, ZTE Blade AF3 за три тысячи рублей. Этот гаджет с 4 ГБ памяти и 512 Мб оперативки не жалко отдать дочке на растерзание.

image

ZTE не зря тратят огромные суммы на R&D. Они первыми внедрили в серийный смартфон систему распознавания владельца по глазам — в ZTE Grand S3. Для этой системы нужна только фронтальная камера в 1 мегапиксель, так что дороже она телефон не делает.

image

Но если вы хотите действительно дельный гаджет с хорошим железом — то нужно смотреть, само собой, на топовые устройства ZTE. Смартфон ZTE Axon Elite 4G* построен на базе Qualcomm Snapdragon 810 processor (MSM8994) и имеет 3 ГБ RAM и 32 ГБ встроенной памяти. Основные камеры — 13 мегапикселей и 2-мегапиксельная вспомогательная, фронтальная — 8 МП.

Смартфон стоит 379,89 долларов, но сейчас его можно купить за 299,99.

image

image

image

Примерно столько же стоит ZTE Nubia My PRAGUE Elite 4G*. У него экран поменьше — 5,2 дюйма, процессор Qualcomm Snapdragon 615 и две такие же камеры, как в Axon — 13 и 8 мегапикселей. Отличный подарок для женщины на 8 марта.

Да, здесь на борту 3 ГБ оперативной памяти и 32 ГБ встроенной, разрешение экрана Full HD и опять же LTE. Память можно расширить благодаря слоту для MicroSD, который одновременно является слотом для второй симки.

Экран защищён Gorilla Glass 3. И цвет приятный — называется «Shampagne».

image

Фаблет ZTE Nubia Z7 обычно стоит 761 доллар, но сейчас в магазине какая-то сказочная скидка — его предлагают за 199,99*.

Он в первую очередь отличается экраном: при 5,5 дюймах разрешение — 4K, то есть 1440х2560 пикселей. Камеры — 13 и 4 МП. Процессор — Snapdragon 801 Quad Core 2.5GHz. И снова две симки и LTE, 3 ГБ оперативной памяти и 32 встроенной. Только microSD аппарат не поддерживает.

image

Модель ZTE Nubia Z9* имеет Full HD разрешение 5,5-дюймового экрана, 2 ГБ оперативной и 32 ГБ встроенной памяти. Но самое интересное — это стеклянная задняя панель. Дизайн очень лаконичный. Обойдётся телефон в 17 250 рублей.

image

image

Гораздо дешевле будет стоить ZTE V5 с 2 ГБ оперативной памяти, 16 ГБ встроенной, 5,5-дюймовым Full HD экраном, но более простым дизайном с пластиковым корпусом. Устройство стоит около 10 000 рублей*. Снова нужно добавить, что LTE смартфон поддерживает.

image

Я сам тестировал несколько бюджетных и средних по цене смартфонов ZTE — Blade S6*, Grand S2, совсем дешёвый Blade AF3, Blade V2 Lite. Да, у некоторых был древний экран, но качество сборки и общее впечатление всегда оставались положительными. На IFA 2015 в Берлине я потрогал новинки от ZTE, включая Axon Elite — отличный от компании, у которой есть опыт в телекоммуникационном оборудовании. Так что смело могу рекомендовать гаджеты от этого производителя.

image

image

На этом всё, с вами был простой сервис для выбора сложной техники Dronk.Ru. Не забывайте подписываться на наш блог и канал на YouTube, будет ещё много интересного.

p.s.* — вы можете вернуть до 5% стоимости покупки, приобретая товар по этим ссылкам.
Подробнее: dronk.ru/cashback

Другие наши публикации:
Компания Onda и ее планшеты — можно ли доверять «китайцу»?
Обзор бюджетного 8" планшета Chuwi Vi8 Plus на Windows 10 за $88
Обзор мощного планшета Chuwi Hi10 на полноценной Win10 за $180
Семь актуальных коптеров до $20, которые можно положить в карман
Компания Xiaomi. Дешевле без ущерба к качеству уже не бывает
Chuwi Ilife V5 — робот-пылесос за 99$ или как превратить ежедневную уборку в развлечение
Обзор граверного лазера NEJE или перспективная бизнес модель

ссылка на оригинал статьи https://geektimes.ru/post/271536/

Расчеты и обоснования для «рукотворной звезды» — РА Маяк

Данный пост является продолжением дискуссии, которая возникла в комментариях к этому посту, посвященному запуску энтузиастами космического спутника, видимого с орбиты невооруженным глазом.

Сейчас на площадке boomstarter продолжается сбор средств на испытание конструкции спутника
На сегодня, собрано более 1,5 млн рублей.
Сайт проекта http://cosmomayak.ru
Запуск планируется через 127 дней.

В ходе дискуссии с основателем и руководителем проекта Александром Шаенко возникли вопросы обоснования расчетной яркости спутника и условий его наблюдения. После, обсуждение было продолжено электронной почте, а данный пост является его результатом.

Хотя Александр и его команда участвовали в обсуждении этих расчетов, и ими не были указаны какие-либо ошибки, но расчеты выполнял я, и претензии по их корректности тоже следует направлять мне, а не официальной команде проекта. В связи с чем, я буду благодарен если кто-либо возьмется их проверить и при обнаружении ошибок, обязательно сообщит мне в ЛС или в комментариях.

Немного для тех, кто не знает о проекте.

Команда энтузиастов делает микроспутник, с целью популяризация космонавтики. Спутник выводится на орбиту в составе пускового контейнера, а потом раскрывает тетраэдр из полимерной плёнки, растянутой на каркасе, и раскручивается до угловой скорости не менее 1 об/с.

Длина ребер тетраэдра составляет 3 метра, и представляют собой упруго деформируемые профили (полотна рулетки). При раскрытии они растягивают отражающую пленку. После чего конструкция раскручивается.

Видео о проекте


Официальные характеристики для наблюдателя: видимая звездная величина -10.
По мере приближения к Земле возрастает до -13 (яркость полной луны).

Расчет видимой звездной величины РА «Маяк».

Уже в ходе обсуждения в комментариях к прошлой статье, возникли сомнения в возможности обеспечить планируемую яркость, а также другие вопросы, что в итоге и привело к созданию этой статьи.

При расчете видимой звездной величины, основными этапами являются: корректное описание рассеяния потока света по поверхности, и анализ видимой яркости объекта невооруженным взглядом.

Рассмотрим каждый этап по отдельности.

1. Определение размеров блика на поверхности Земли

Отражатель спутника представляет собой плоскую поверхность площадью 3,8 м2 отражающую свет солнца в сторону земной поверхности.

Чтобы найти наблюдаемую яркость нужно знать какой ширины луч дойдет до поверхности Земли, и как световой поток будет распределен внутри луча.

Так как поверхность пленки неровная, то участниками команды был проведен эксперимент.
Пленка была сфотографирована с расстояния 2 метра, в темноте, но с использованием вспышки.
Посчитав плотность распределения бликов на пленке можно найти функцию распределения светового потока. Что и было проделано.

Анализируемая фотография

Расчет
Расчет в формате mathcad, для проверки и экспериментов

Результаты расчетов.

В качестве результата был определен характеристический угловой размер светового пучка, отраженного от поверхности пленки.

Характеристический размер – это угол отклонения от середины пучка, при котором световой поток уменьшается в 2 раза.

Характеристический угловой размер составил 21 градус.

Что даст характеристический размер пятна света на поверхности Земли – 222 километра.

В реальности, размер пятна будет больше, примерно на 7 км, за счет углового размера солнца (0,53 градуса). Но в данном случае этим фактором можно пренебречь т.к. он меньше погрешности определения.

Зная характеристический размер светового пятна, можно переходить к определению плотности распределения света.

2. Определение распределения света по поверхности и видимая звездная величина

Для определения плотности распределения освещенности использована функция нормального распределения по плоскости. Это очевидный выбор так как рассеивание происходит из-за случайных отклонений отраженного луча. Плюс, конечно тот факт, что суммарная плотность всегда даст нам единицу, что позволяет определив поток света падающий на отражатель спутника – сразу найти его распределение по поверхности.

Расчет
Расчет в формате mathcad, для проверки и экспериментов

Важным моментом является серьезное отличие пиковой яркости (расчетной светимости в центре светового потока), от наблюдаемой яркости.

Суть эффекта в том, что у человеческого зрения есть аналог «выдержки» фотоаппарата. Некоторое время фотоны «накапливаются» в сетчатке, а потом сигналы отправляются мозгу. При этом как и в случае фотоаппарата, человек видит усредненную яркость, а не пиковую.

Элементарным примером действия этого эффекта являются светодиодные экраны.

Для экономии энергии светодиоды в экране не меняют интенсивность свечения, а всегда горят одинаково ярко. В случае, если нужно показать пиксель более темного оттенка, светодиод просто не горит постоянно, а делает короткие вспышки той же (максимальной) яркости. Чем темнее оттенок пикселя – тем короче вспышки. Этот эффект обеспечивает ШИМ-генератор. Если бы человек всегда видел пиковую яркость, то мы не могли бы увидеть оттенки на светодиодном экране.

Обычно базовая частота вспышек равняется 48Гц. Но она отличается для разных устройств. Кстати, на том же принципе работает кинематограф (человек не замечает изменение интенсивности между кадрами).

Этот эффект не очевиден, так как мы легко можем видеть такие короткие вспышки как, например, молнии или фотовспышки. Но суть в том что глаз просто усредняет короткую вспышку, из-за чего ее яркость воспринимается нами ниже чем фактическая пиковая яркость, но все равно гораздо выше чем освещенность без вспышки.

В своих расчетах я использовал оценку средней яркости за 1/30 секунды, как средний показатель. Хотя легко увидеть, что при изменении «выдержки» в два раза, до 1/60 – расчетная яркость меняется не так значительно, всего на 20%.

Длительность вспышки от РА маяк будет очень короткой. Вращаясь со скоростью 1 об/с на высоте 600 км, он даст блик света движущийся по поверхности земли ко скоростью от 7500 км/с. При размере блика в 222 км, это даст вспышку длительностью менее 0,03 секунды.

Итак. Основной результат расчетов.

Видимая звездная величина будет составлять -0.9 при высоте орбиты 600 км.
По мере снижения аппарата яркость постепенно достигнет -3 звездной величины, после чего аппарат сгорит в атмосфере.

Некоторые следствия расчетов.

Так как не все читатели могут разбираться в оценке видимой яркости звезд, я приведу некоторые примеры.

0. Отличие расчетной яркости от официально объявленной — примерно в 4000 раз.

1. РА Маяк, не будет самой яркой звездой, по крайней мере в начале своего движения. Например, Сириус в созвездии большого пса, примерно в 1,68 раза ярче.

2. Многие объекты на небе будут гораздо ярче. Например, МКС имеет звездную величину -4, а значит будет ярче при мерно в 17 раз. Венера – в 31 раз.

Также стоит прояснить некоторые моменты относительно наблюдения РА Маяк.

3. Судя по описанию проекта и презентационному видео может сложиться впечатление, что увидеть РА маяк будет достаточно просто. На самом деле это не совсем так.

По расчетам команды проекта, с которыми можно ознакомиться здесь . В течение 25 дней пребывания спутника на орбите, его можно будет наблюдать примерно 13 раз (слайд 24). Окно наблюдения, это временной интервал около 5 минут, в течение которого может наблюдаться одна или несколько вспышек длительностью до 0,03 секунды. Вероятность того, что в течение 5 минут, сложатся условия для наблюдения вспышки из точки размещения наблюдателя, пока не вычислена, но предварительная оценка обсуждалась в комментариях к прошлой статье составляет от 50% (по словам Александра). Мои оценки более пессимистичны.

Некоторую сложность наблюдателю доставит тот факт, что за время наблюдения (5 минут), объект будет двигаться, от одного горизонта к противоположному, поэтому ожидая вспышку, нужно будет отслеживать точку ее вероятного появления с большой точностью, иначе ее будет легко пропустить.

4. И последнее. Не могу не упомянуть, что в ходе обсуждения возник вопрос о конструктивных особенностях аппарата.
Технически, конструкция разворачивается с помощью выдвижных лент (рулеток), и она не может быть проверена в условиях тяготения, так как жесткости лент недостаточно чтобы удерживать пленку вопреки силе тяготения.

Однако, легко заметить, что вращаясь со скоростью 1 об/с, и имея размеры ребер равных 3 метрам, грани тетраэдра будут испытывать гораздо большие центробежные силы. Центростремительное ускорение составит от 4,5 до 12 g. Что приведет к деформации оболочки.

Даже если удастся добиться точного соответствия оси вращения и оси симметрии тетраэдра, центробежные силы просто вытянут оболочку в сильно сжатый сфероид. Что приведет к рассеиванию света и сделает объект ненаблюдаемым без спец средств.

Если же отказаться от вращения объекта, то вероятность его наблюдения очень сильно снизится.

В качестве заключения хочу сказать следующее.

Я всецело поддерживаю энтузиазм в целом и космический в особенности. Цель этой статьи не критика расчетов, а попытка внести ясность в интересный проект.

Также я очень поддерживаю движение краудфандинга и считаю его оптимальным для подобных проектов. Но вынужден напомнить, что 1,5 млн. уже собранные в этом проекте направлены «на испытания устройства». Не на расчеты, обоснования возможностей или эксперименты. А на испытания готового устройства. Но простейшие расчеты показывают, что поставленные цели, при текущей конструкции аппарата недостижимы.

Я считаю, что это неправильно. А вы?

Ваше отношение к написанному

Никто ещё не голосовал. Воздержавшихся нет.

Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.

ссылка на оригинал статьи https://geektimes.ru/post/271620/