Введение в Data Science от дилетанта

от автора

Этот материал не является конкурентом курсов по Data Science, машинному обучению, нейросетям, искусственному интеллекту и прочим хайповым направлениям, потому что там обучают профессионалы, по крайней мере, должно быть так, а здесь набирателем букв и составителем слов является такой же новичок. Однако, нет лучше способа изучить какой-либо предмет или дисциплину чем попробовать научить кого-то еще. Это и есть основная причина, по которой я пишу этот цикл статей. Не я придумал этот способ, но он реально работает, и не только в сторону учителя, но и в сторону ученика. Потому что ученику очень сложно пробиться до заоблачных мыслей гуру, намного легче спросить у такого же студента: «Ты понял, чё он сказал?».

Чем же еще будет отличаться этот материал от множества курсов? В то время как классическое обучение начинается с нудной теории, которая студентам не понятна, не потому что они её не любят, или тупые, или не подготовлены для восприятия этой информации, а потому что не знают что с этим делать, в какой отсек положить эти знания. А к тому времени как эта теория понадобится, к сожалению, от неё остается крохи, если вообще что-либо остается. Здесь же мы сначала на практике столкнемся «нос к носу» с проблемой, а уж потом будем делать отсылки на теорию, а может быть даже попытаемся её узнать. Это положительно мотивирует людей разбираться в предмете, а может быть даже увлечься им. Даже если этот материал поможет только одному человеку, то уже он станет не бесполезным.

Начнем с постановки задачи, которую будем решать. А не замахнуться ли нам на наш рубль, точнее доллар, точнее валютную пару доллар в рублях, а если короче — доллар-рубль. Последние события показали, что этот финансовый инструмент активно влияет на жизнь не только трейдеров, банков, фондов и т.д., но и простых граждан, даже если эти граждане не занимаются внешнеэкономической деятельностью. Поэтому иметь прогноз этого финансового актива очень даже полезно, пусть даже этот прогноз будет плохим, но это все же лучше, чем отсутствие оного.

Тут мы просто обязаны сделать уточнение, напоминание, предупреждение, что данный материал не является инвестиционной рекомендацией, потому как мы делаем прогноз в учебных целях. А если вы захотите использовать эти знания в корыстных целях, например, для торговли на бирже, то будете делать это на свой страх и риск.

А поможет нам в этом бесплатный, пока еще доступный, веб-ресурс Google Colaboratory. Есть и другие «вражеские» похожие ресурсы, например, у того же Гугла имеется целая платформа для соревнований Kaggle. У «родного» Яндекса есть подобный бесплатный облачный сервис DataSphere, но скорость работы его явно намекает на использование платного варианта. Можно, конечно, устроить собственную лабораторию, в которой поднять Jupyter Notebook, но мы будем использовать colab.

Если у вас по какой-то причине нет любой гугловской учетной записи, например, в YouTube, то самое время её завести. Я думаю, что с этим у вас не возникнет никаких вопросов. После чего можно перейти по выше указанной ссылке (на всякий случай продублирую её: colab. Для создания нового блокнота (здесь так называется страничка или проект) вам достаточно в меню «Файл» выбрать пункт «Создать блокнот».

Создание нового блокнота в Google Colab
Создание нового блокнота в Google Colab

Можем сразу же переименовать, например, в FirstNote: Файл -> Переименовать. Сделаем еще одно действие в colab, а именно подключим Google-диск. Это нужно, чтобы сохранить данные между сессиями.

Сохранение происходит автоматически, но перед закрытием лучше убедиться, что сохранены последние изменения. Теперь мы готовы к первому уроку. Надеюсь, что материал был понятен и полезен.


ссылка на оригинал статьи https://habr.com/ru/post/659505/