Магистратура ИИИИ от Физтеха и ВТБ: Data Science с человеческим лицом

В современном мире невозможно быть энциклопедистом. Со времён Вольтера и Дидро человечество накопило слишком много знаний, и они не поместятся в одну голову. Однако это не значит, что не стоит даже пытаться. Как говаривал Козьма Прутков, «специалист подобен флюсу». А флюс — штука нездоровая.

Меня зовут Константин Воронцов, я завкафедрой машинного обучения и цифровой гуманитаристики МФТИ. Сегодня хочу рассказать вам, как найти золотую середину между этими крайностями. Почему дата-сайентисту неплохо бы знать Платона и уметь строить отношения с людьми, не забывая, впрочем, про дискретную математику и Python. Ещё расскажу, где всему этому научиться.

О времени и о себе

Я окончил МФТИ в 1994 году (факультет управления и прикладной математики). Анализом данных занимаюсь с 1990 года — получается, уже более 30 лет. Впрочем, все эти годы название области моей деятельности постоянно менялось: было и «распознавание образов», и «машинное обучение», и data mining. Для меня это не более чем периодическая смена флага под влиянием научной моды. Суть всегда оставалась неизменной — постоянно думать, как решить задачу.

Всё это время я работаю в Вычислительном центре РАН, которым руководил мой учитель (точнее, Учитель) академик Константин Владимирович Рудаков, к сожалению, недавно нас покинувший. В 2003 году он открыл специализацию «Интеллектуальный анализ данных» (ИАД). А с 2004 года я читаю на ИАД курс лекций по машинному обучению. В 2017 году под моим руководством была создана лаборатория машинного интеллекта МФТИ. В 2021 году я оставил её на попечение Алексея Гончарова, одного из выпускников, а сам возглавил новую кафедру — машинного обучения и цифровой гуманитаристики МФТИ.

Наряду с основной деятельностью, успел поработать много где: в институте Склифосовского, на ММВБ, в «Форексисе», «Яндексе», Сбербанке. Но никогда не переставал заниматься наукой. Просто разменивать своё время на деньги и карьерное продвижение всегда казалось мне банальным и слишком скучным. Научное познание мира — это, по моему глубокому убеждению, самое крутое, чем человек может заниматься по жизни. Но важно приобретать практический опыт, чтобы наука от этой самой жизни не отрывалась. Расширять кругозор и приумножать знания, чтобы затем передать свой опыт студентам.

Откуда есть пошла

Магистерская программа «Искусственный интеллект и интердисциплинарные исследования» (сокращённо ИИИИ) появилась не на пустом месте. На физтехе традиционно много программ по искусственному интеллекту — на разных кафедрах, с разными индустриальными и научными партнёрами. Машинное обучение давно присутствует в программе ФПМИ (физтех-школа прикладной математики и информатики). Так что с «машинной» стороны у ИИИИ крепкая база.

С интердисциплинарной стороны наша магистратура тоже опирается на богатый опыт. Помимо кафедры машинного обучения и цифровой гуманитаристики, в разработке программы участвовали Лаборатория междисциплинарного анализа, социума, культуры и истории (МАСКИ) и Центр обучения проектированию и разработке игр (ЦОПРИ). Причём здесь игры, поведаю чуть ниже, пока скажу лишь, что ЦОПРИ не только про игры. Точнее, не только про игры в узком смысле.

Сейчас сложно даже сказать, кому именно в голову пришла идея открытия ИИИИ. Разговоры с коллегами велись давно, и в какой-то момент возникло общее понимание, что такая магистратура нужна. Бизнес в лице ВТБ разделил с нами это понимание — и вот мы уже принимаем абитуриентов.

Обдумывая концепцию ИИИИ, мы не ориентировались на существующие интердисциплинарные программы, но, как оказалось, они есть — схожие не по содержанию, но по духу. Например, программа Эдинбургского университета Philosophy and Mathematics — и философия, и математика в ней даются крайне серьёзно. Совершенно замечательная инициатива есть и у Стэнфорда — Stanford Program in Science, Technology & Society. В ней три компонента: инженерный, научный и социогуманитарный.

T-shaped people

Кажется, этот термин придумали в консалтинговой компании McKinsey — для обозначения сотрудников, у которых глубокие компетенции в их узкой сфере (вертикальная черта буквы Т) и неглубокие, но широкие — в других сферах (горизонтальная черта). У нас это обычно называется «знать многое о немногом и немногое о многом».

Хорошо это или плохо, но стереотипный компьютерщик, асоциальный и узконаправленный, — типаж, уходящий в прошлое. Современные программные продукты, по крайней мере самые сложные и интересные, создаются людьми и для людей. Не одним человеком, а целой командой. И не ради чьих-то индивидуальных хотелок, а для удовлетворения некого запроса общества. И зачастую они влияют на общество.

Незаметно, но неотвратимо наступил век T-shaped people. Хорошему специалисту уже недостаточно быть специалистом в смысле афоризма Пруткова. Нужно ещё то, что называют софт-скилами: умение общаться с людьми, работать в команде, руководить командой. Кроме того, нужно нечто большее, чем софт-скилы. Некое более общее понимание того, как устроен мир, как устроено общество. Узкий специалист может прекрасно понимать, как сделать что-то, но не понимать, что именно, а главное — зачем.

Это может прозвучать как прекрасная утопия, вроде советской педагогической максимы о «воспитании всесторонне развитой личности». Однако в последние годы бизнес всё лучше осознаёт свою потребность в таких сотрудниках. И наша совместная с ВТБ магистратура — наглядное тому подтверждение.

Программа ИИИИ состоит из компьютерных наук, софт-скилов и общегуманитарных предметов в соотношении примерно 3:1:1. Можно сказать, она тоже T-shaped. И бизнес заинтересован во всех этих составляющих. Например, именно по просьбе коллег из ВТБ мы включили в гуманитарную часть восточную философию. Никакого идеализма, лишь умный и дальновидный прагматизм.

Теперь, пожалуй, расскажу о каждом направлении подробнее.

Алгебра — царица полей

Если с гуманитарными науками приходится заниматься некоторой апологетикой, то в важности для дата-сайентиста математики и компьютерных наук никто, к счастью, не сомневается. Математические предметы в программе ИИИИ преподаются хорошо и глубоко, но при этом с ориентацией на практику. Математический анализ, линейная алгебра, теория вероятностей — всё даётся с конкретными кейсами, иллюстрирующими, как эти знания применяются в анализе данных.

В магистратуру могут прийти студенты с разным уровнем математических знаний, и наша программа учитывает это. Желающие знать побольше математики могут обратиться к преподавателям, и их желание будет удовлетворено — на формальном уровне (спецкурсы и т. п.) или на неформальном (посоветуют литературу для чтения перед сном).

Что касается более практических дисциплин, таких как разработка ПО и прикладные методы машинного обучения, курсы составляют и преподают специалисты, работающие непосредственно в индустрии. Никакого временного лага между технологиями, с которыми знакомят студентов, и современным индустриальным стандартом. Впрочем, это относится не только к нашей магистратуре. Дедушка, преподающий фортран по книжке 80-х, — это в принципе не в стиле МФТИ: физтех всегда стремится давать актуальные знания.

Лабораторные работы и дипломные проекты — это, конечно, хорошо, но ещё лучше — настоящая практика, боевые задачи. Студенты ИИИИ получают возможность проходить стажировку в ВТБ и участвовать в работе над настоящими «энтерпрайзными» продуктами. Если обе стороны останутся довольны, уходить после стажировки совершенно необязательно.

Добрым словом и револьвером

За софт-скиловую, коммуникативную часть магистратуры отвечает уже упоминавшийся выше ЦОПРИ — Центр обучения проектированию и разработке игр. И на то есть три веские причины.

Во-первых, несмотря на формальное название, ЦОПРИ — это не только про игры, но и про управление, про организацию разработки чего-либо в широком смысле. Руководитель ЦОПРИ Анна Кулашова — один из директоров «Лаборатории Касперского», в прошлом была топ-менеджером Microsoft. В общем, человек с очень богатым руководящим опытом. И все люди, которые читают курсы по коммуникации, обладают большим реальным опытом.

Коммуникативная часть ИИИИ имеет практическую направленность: в ней нет вещей типа общей психологии или социологии. Там разбирают конкретные кейсы, распространённые ситуации рабочего и делового общения. Преподаватели знакомы с этими ситуациями не понаслышке и делятся со студентами опытом из первых, а не вторых-третьих-пятых рук.

Во-вторых, игры удобно использовать для моделирования реальности. Многие консалтинговые компании используют обучающие настольные игры, чтобы моделировать те или иные рабочие ситуации, научить игроков с ними справляться. И у нас такие обучающие настолки тоже есть. С их помощью студент может выступить активным участником учебного процесса, не только слушать прохладные истории преподавателей и решать контрольные работы, но и действовать в интерактивной среде и иметь дело пусть с игрушечными, но последствиями.

В принципе, этих двух причин вполне достаточно, однако есть ещё и третья, более философского плана. Издревле настольные игры были распространены среди военной аристократии — правителей или, по крайней мере, командного состава. Об этом можно догадаться, посмотрев на шахматную доску: там и пехота, и конница, и боевые слоны, и осадные башни. Игры учили тактическому мышлению — не тактике самой по себе, в них всё-таки слишком много условностей вроде коня, перепрыгивающего через слона. А вот способность думать наперёд, просчитывать варианты, планировать действия и прикидывать, как могут поступить другие, — это полезное приобретение как для полководца, так и для руководителя, например, IT-отдела.

Тем не менее ИИИИ готовит не просто полководцев. Можно следовать правилам игры, а можно сделать их объектом изучения. Думать о них, о том, как они устроены, почему они именно такие и что будет, если их изменить. Это очень важный навык сейчас, когда технологии способны менять правила игры. Дальновидный разработчик должен задумываться о том, как изменится мир, когда в нём появится тот или иной продукт. Как станут вести себя люди, использующие его. Как говорится: «Что наша жизнь? Игра!».

Платон мне друг

Гуманитарная часть ИИИИ состоит из истории античности, античной и восточной философии, римского права и (опционально) латыни. Пожалуй, эта часть требует наибольшей апологетики, так что приступим к ней немедля.

Положа руку на сердце, я не могу сказать, что эта часть магистратуры должна быть именно такой. Что в ней должно быть именно римское право, а не, допустим, культурология. Были жаркие дискуссии с коллегами, в итоге коллективным разумом пришли к актуальной программе. Однако конкретный выбор гуманитарных предметов не так важен, как их наличие в принципе и, разумеется, качество их преподавания.

Одна из главных вещей, которую даёт гуманитарное образование учёному-технарю, — понимание, что есть другой подход. Не менее научный, но при этом другой — в силу специфики предметной области. В истории невозможны эксперименты и расчёты (по крайней мере, в том же смысле, что и в естественных науках) — однако это важная область знания с развитой собственной методологией. К чему приводит непонимание этого факта, можно увидеть на примере академика Фоменко и его «Новой хронологии».

Большую ценность имеет свежесть и широта взгляда. Конечно, в каждой работе есть рутинные типовые задачи, но наиболее интересны те, к которым даже не сразу понятно, с какой стороны подступиться. Математик, биолог или физик, разбирающий монографию по индоевропейской морфологии, обладает умственной дерзостью забраться в параллельный мир, не имея под ногами прочной почвы. Физтех любит смелых. Sapere aude!

Каким-то боком гуманитарные компетенции примыкают к софт-скилам. Если разработчик знает иностранный язык (не только английский), серьёзно интересуется историей или философией, этот человек определённо интересен, у него шире кругозор и, что важно, более трезвая оценка своих способностей.

Может показаться, что античная философия сейчас имеет лишь культурологическую ценность. Если уж изучать философию, то кого-то посовременнее: не Платона, а Дерриду или Метцингера. В какой-то степени это верно. Прочитав платоновское «Государство», не стоит пытаться устроить современное общество по его образцу. Однако можно посмотреть на это общество и подумать, какие из идей Платона оно воплотило, пусть и в изменённом виде. А ещё подумать, что такое справедливость, какими полномочиями должны обладать те, кто охраняет страну, и тому подобное. Возможно, у древних эллинов и не было верных ответов, но они задавали очень хорошие вопросы.

Достижения античности лежат в фундаменте современной западной цивилизации, западной культуры. Римское право до сих пор изучают на юридических специальностях не потому, что это забавный исторический артефакт, а потому, что его корни до сих пор несложно проследить в законах самых разных стран. Точно так же общественное устройство античных государств находит своё отражение в современности. Чтобы понять общество, стоит обратиться к истокам.

Или взять, например, восточную философию, которую мы добавили в программу по рекомендации коллег из ВТБ. Конфуцианство лежит в фундаменте современного китайского общества даже в большей степени, чем античная мысль в современных обществах Запада. Возможно, Китай — самая философская нация в мире. И чтобы эффективно взаимодействовать с восточными партнёрами (а это всё более и более актуально), очень полезно понимать их культурные особенности.

Ну и, наконец, латынь — язык с очень интересной и развитой грамматикой. Недаром им интересуются компьютерные лингвисты как языком, на котором можно проверять и обкатывать технологии. Знание латыни развивает чувство языка в целом. Для специалиста, который хочет заниматься обработкой естественных языков, это весьма полезно. Впрочем, изучение языка — довольно трудоёмкая задача, поэтому мы оставили латынь опциональным курсом.

Per aspera ad astra

Магистратура ИИИИ — не конечная цель, а лишь один шаг из многих. Как для тех студентов, кто решат её пройти, так и для нас, её создателей. Поэтому хотелось бы поделиться планами на будущее и в каком-то смысле планами на прошлое.

Разумеется, знания и умения, приобретённые благодаря ИИИИ, помогут выпускнику получить хорошую работу. Но мне, конечно, хочется несколько большего: взрастить не просто разработчиков, но и учеников, соратников, «братьев по разуму», которые будут совмещать работу в индустрии с научной деятельностью.

Сейчас мои студенты и научная группа занимаются технологиями семантического поиска и текстовой аналитики в больших текстовых коллекциях. Работая с коллекциями научных публикаций, мы ставим перед собой задачу создать «Мастерскую знаний» — поисково-рекомендательную систему для исследователей, которая на порядок ускорит сбор и дальнейший анализ тематических подборок научных статей. Работая с новостными потоками, мы строим и исследуем модели выявления мнений, политической поляризации, приёмов пропаганды и речевых манипуляций, психоэмоциональных воздействий текста на массовые целевые аудитории.  

С выпускниками ИИИИ я тоже надеюсь поработать над интересными задачами, научными и не очень — от геймификации языкового обучения до анализа древних текстов.

А ещё очень хочется пойти, так сказать, в обратном направлении и создать для этой магистратуры соответствующий бакалавриат, который бы не делал из человека узкого специалиста, но давал ему фундаментальную двойную подготовку по математике и гуманитарным дисциплинам.

Знающий геометрию да войдёт

Если я сумел вас достаточно заинтересовать нашей программой (а я на это очень надеюсь), пора рассказать о поступлении.

Кого именно мы ждём? Скорее всего, не гуманитария: ему потребуется математическая база и опыт разработки. Впрочем, упорство способно преодолеть всё. Мы ждём абитуриента, который осознаёт, что настоящие открытия делаются на стыке наук. Которому хочется чего-то нового. Который задумывается о социальной ответственности бизнеса, об этике ИИ и алгоритмизации общества. Которому недостаточно просто писать код, а хочется создать из него продукт.

Стоимость обучения — 390 тысяч рублей в год. Успеть записаться надо до 18 августа. Контактное лицо по всем вопросам — Дмитрий Базанов (пишите на bazanov@phystech.edu).

Что нужно сделать, чтобы попасть в программу?

1. Зарегистрироваться на сайте https://pk.mipt.ru/ и подать заявление.

  • Конкурсная группа: ФПМИ Математика, информатика и компьютерные технологии.

  • Кафедра машинного обучения и цифровой гуманитаристики.

  • Специализация (магистерская программа): искусственный интеллект и интердисциплинарные исследования.

2. На дистанционном экзамене 24 августа будет следующее:

  • алгебра, геометрия, линейная алгебра, матанализ, теория вероятностей, алгоритмы, комбинаторика, компьютерные науки (первые два раздела из программы экзамена по специальности: https://vk.cc/ceslHO); 

  • кроме того, будет кафедральное собеседование — поговорим о машинном обучении и о том, почему вам захотелось прийти именно на 4И.

Сегодня я многое рассказал о нашей магистратуре. Надеюсь, скоро вы придёте к нам и расскажете о себе. До встречи!


ссылка на оригинал статьи https://habr.com/ru/company/vtb/blog/681064/

Добавить комментарий

Ваш адрес email не будет опубликован.