Содержание
- Европейский университет в Санкт-Петербурге
- Как появилась идея открыть новый поток
- Собеседование
- Почему важно развивать математическую интуицию
- Паша Губко, Москва
- Как поступить в Школу анализа данных от Яндекса
- Как проходит набор?
- Подготовка
- Стажировки
- Подготовка к поступлению
- Data scientist
- Максим Спорышев
- Сергей Бондарев, Минск
- Московский физико-технический институт
- [править] Сотрудничество с вузами
- Турмец Макоев
Европейский университет в Санкт-Петербурге
Чему мы учим?
В 2020 году Европейский университет и Яндекс запустили программу дополнительного профессионального образования ПАНДАН (Прикладной АНализ ДАНных). Мы пригласили абитуриентов с гуманитарным образованием, чтобы они за восемь месяцев освоили основы классической статистики, машинного обучения, NLP и компьютерного зрения и научились работать с разными типами данных.
В 2021 году помимо программы дополнительного образования запустится магистерская программа ПАНДАН, где студентов ждёт более глубокое изучение алгоритмов и программирования, больше проектной работы и практики, плюс 25 факультативных курсов на выбор с любого направления Европейского университета. Всего на программе будет 10 мест.
Учебный план ПАНДАН основан на проектной работе и отвечает реальным научным потребностям антропологов, историков, историков искусства и других исследователей, которые мало знакомы с современными методами работы с данными. В общественных и гуманитарных областях есть много ценного, например, Госкаталог с информацией о всех музейных фондах страны, оцифрованные данные архивов, рукописи, дневники, письма, базы государственных ведомств. Кроме того, постоянно появляются и накапливаются цифровые следы: данные о маршрутах, репосты, новости. Вся эта информация, если уметь поставить к ней правильные вопросы, может послужить основой для неожиданных выводов об устройстве повседневной жизни и реальном положении дел в разных сферах — от криминологии до атрибуции картин.
Для первого набора выбраны четыре проекта:
- Бомбардировки Ленинграда — совместно с факультетом истории. Магистранты создадут карту бомбардировок города в сентябре 1941-го и узнают, какие цели были поражены в первую очередь и как это сказалось на жизни города.
- Госкаталог — совместно с факультетом истории искусств. Студенты приведут в порядок фонд, в котором хранится четверть музейных объектов со всей страны, так, чтобы он стал удобным инструментом для исследователей.
- Еврейские надгробия — совместно с центром «Петербургская иудаика». Студенты создадут инструменты для распознавания, расшифровки и перевода базы из тысяч фотографий еврейских надгробий на территории бывшей черты оседлости.
- Дневники подростков — совместно с центром эго-документов «Прожито». Студенты научатся смотреть на дневники подростков как на данные: оцифровывать их с помощью распределённых команд и Яндекс.Толоки и сравнивать по эпохам.
В будущем планируется ещё один проект, связанный с геоданными и безопасностью дорог. Над каждым из проектов будут работать 4–5 слушателей плюс кураторы из Европейского университета и Яндекса. В конце учебного года проектные группы представят готовые продукты, обладающие научной ценностью.
Как появилась идея открыть новый поток
Когда только открывался ШАД, его идея была такова: учить математиков и физиков машинному обучению. Предполагалось, что приходят люди с серьёзной математической подготовкой, а им объясняют, как применять эти знания.
Это работающий подход, но с ним есть одна проблема: специалисты с хорошим математическим бэкграундом – это довольно узкий круг людей. Яндекс растёт, сегодня он ищет сотню сильных профессионалов, а завтра начнёт искать тысячу. И ШАД призван помогать в таком поиске. К тому же, в ШАДе давно существовала идея обучать более широкую аудиторию. Конечно, эти люди не будут во всех аспектах обладать таким же уровнем навыков и знаний, как те, кто пять лет учил математику в вузе. Но у ШАДа и нет цели вырастить продвинутого математика. Основная задача — научить тому, что имеет конкретные приложения в машинном обучении.
Первый поток курса «Математика для Data Science» уже прошел в ШАДе с сентября по декабрь 2020 года. В основном в нём участвовали студенты Школы, но были и вольнослушатели. Например, сотрудники Яндекса, у которых основное образование не связано ни с программированием, ни с математикой, и которые хотели усилить фундаментальную подготовку.
Собеседование
Андрей Спиридонов: Собеседование – самый увлекательный этап отбора. Я пришёл на него с четырьмя баллами из восьми, набранными на очном туре, стараясь думать, что с этим можно работать. Чтобы расслабиться, я сидел на кофе-поинте в ШАДе и параллельно решал какую-то домашнюю работу у себя в тетради. Вокруг мельтешили другие ребята: ходили из стороны в сторону и нервничали. Я знал, что Школа анализа данных — это популярное место, но перед собеседованием я впервые ощутил, что людям действительно нравится ШАД, и они мечтают туда поступить. Я отложил в сторону тетрадь и решил пообщаться с другими поступающими, сказать: «Ребят, не переживайте, всё будет хорошо». С некоторыми из них мы теперь вместе учимся.
Собеседование проходило в три этапа: сперва я обсудил мотивацию для поступления, потом решал математические задачи и наконец отвечал на вопросы по алгоритмам. C кофе-поинта меня забрал парень, который представился Никитой, и повёл говорить про то, зачем я хочу поступать в ШАД. Я стал рассказывать ему про то, как сильно люблю теоретическую физику, что я изучил, и какими исследованиями в теории струн хочу заниматься.
Кажется, моя теория подтвердилась: Никита увлечённо меня слушал и задавал уточняющие вопросы. Я рассказывал ему про бордизмы (понятие из дифференциальной геометрии; многообразия, границами которых служат два заданных многообразия). Свойства бордизмов часто изучаются в теории струн: потому что перемещения струн описываются не кривыми, а плёнками.
Я стал описывать эти плёнки и то, какие топологические характеристики у них изучают. Я вошёл в раж и стал у доски рассказывать про то, как склеить тор из квадрата, и почему при разных склейках получаются разные фундаментальные группы. Так прошло минут сорок: я просто рассказывал про то, что меня увлекает, и это был не анализ данных.
В какой-то момент мой рассказ внезапно подошёл к концу, и я подумал: «Чёрт, а теперь-то что рассказывать». Сел на стул и говорю: «Вот то, чем я занимаюсь, а в ШАД я пришел, потому что прочитал на Хабре, что у вас очень успешно учатся физики. Был такой выпускник МФТИ — Никита Казеев, который потом использовал анализ данных для поиска частиц, работая на Большом адронном коллайдере».
Мой собеседник ехидно заулыбался. Я вспомнил, что его зовут Никита. И это был он. Вот почему он так понимающе меня слушал: потому что сам физик. Мы по душам поговорили про научную составляющую в физике и в анализе данных, а формального интервью так и не произошло. Но думаю, что это скорее исключение из правил.
У меня было очень хорошее настроение, когда мы разошлись. Потом Стас Федотов позвал меня решать задания по математике: я чувствовал себя уверенно и поэтому сразу решил все. С частью по алгоритмам было сложнее: я рассказывал про алгоритм поиска подстроки Ахо-Корасик сначала студентке ШАДа, а потом Максиму Бабенко
Максим задавал много уточняющих вопросов: важно было действительно разбираться в теме, а не знать её поверхностно
Как мне тогда казалось, я задержался на собеседовании допоздна — и освободился в семь вечера. А теперь я учусь в ШАДе и не ухожу из Яндекса раньше одиннадцати: охраннику даже приходится меня выгонять.
Стас Федотов: Для нас собеседование – это шанс узнать о поступающем что-то такое, что мы не узнали на предыдущих этапах. В первую очередь о его мотивации: о том, насколько человек интересуется анализом данных или инфраструктурой больших данных, насколько он понимает, что происходит в ШАДе и чему хотел бы здесь научиться, насколько он готов к временным и ресурсным затратам, которые его ожидают.
Помимо этого на заключительном этапе нужно решать задачи. В каком-то смысле это шанс компенсировать те проблемы, которые могли возникнуть на втором этапе, и показать себя с лучшей стороны. Решать задания на собеседовании намного проще: ведь мы подсказываем, когда видим, что человек зашёл в тупик, и не пытаемся никого «завалить».
Почему важно развивать математическую интуицию
Внутреннее устройство математики – это формальный язык, символы на листе бумаги, которые написаны по заранее заданным правилам. На таком формальном уровне символов с ними могут оперировать компьютеры. Есть языки программирования и специальные инструменты, при помощи которых можно доказывать теоремы или проверять, верны ли их доказательства. Однако компьютер пока не способен рождать новые математические результаты, и в целом все процедуры укладываются в алгоритмы.
Понятно, что человек мыслит иначе. Профессиональный математик постоянно повышает уровень абстракции, который он применяет в работе. Так, когда он думает про непрерывную функцию, то представляет себе непрерывную линию. Например, если дана непрерывная функция на отрезке, которая справа положительна, а слева отрицательна, то почему у неё обязательно есть ноль? Потому что если провести непрерывную линию, которая начинается ниже горизонтальной оси и заканчивается выше, то она обязана где-то пересечь ось. Именно эта мысль находится в голове человека, когда тот пытается решить задачу, в которой нужно работать с непрерывной функцией.
Мозг профессионального математика автоматически компилирует неформальные идеи в формальные доказательства. Не думаю, что кто-то из математиков размышляет на языке машинного кода, все предпочитают оперировать более наглядными понятиями.
Кроме того, всё то, что можно представлять и визуализировать, проще использовать, связывать и соотносить с другими представлениями. Можно вообразить это так: у тебя в руках мешок, полный самых разных работающих теорий и механизмов. Ты ставишь себе цель и думаешь, как до неё добраться с их помощью. Не наугад, а на основании прошлого опыта и зная, какие инструменты раньше позволяли тебе решать похожие задачи.
Это рассуждение происходит не на математическом языке, а на языке высокоуровневых идей, которые у тебя накопились. Так строится приблизительный план решения самой сложной задачи. Если на этом пути человек встретил пропасть и первым придумал, что применить для её преодоления, то можно сделать открытие. Уже потом, в научной статье формальный язык опишет это открытие, склеит полученные результаты в строгий текст.
Я думаю, что у музыкантов, архитекторов и разработчиков это работает так же. Как можно построить огромное здание, думая только про бетон и кирпичи? Нужно думать о более глобальных вещах, используя свой талант, знания и прошлый практический опыт.
Паша Губко, Москва
До поступления в ШАД я бы точно не смог попасть на работу в Яндекс, а сейчас я в службе машинного обучения Такси. К сожалению, даже такие крутые места, как Физтех, не всегда хорошо готовят к решению рабочих задач. ШАД же имеет преимущества и по актуальности знаний, и по тому, как эти знания преподаются. Концентрация полезного гораздо выше, чем в любом вузе.
В первом семестре было нереально сложно, часто возникали мысли это всё окончательно бросить или взять академ и хотя бы отсрочить. Но всегда было понимание, что через это нужно пройти, иначе легче в будущем не будет.
И пока сложно придумать, чем его занять. Напоминает момент, когда после первого семестра мы закрыли все дедлайны, и уже не было смысла приходить в ШАД в последний день перед каникулами. А все всё равно пришли в Школу и ходили с потерянными лицами, потому что не знали, что делать, когда не нужно, как обычно, неистово ботать. Так и сейчас.
Как поступить в Школу анализа данных от Яндекса
Школа анализа данных рассчитана на студентов и выпускников инженерных и математических специальностей, готовых несколько раз в неделю посещать вечерние занятия. Для обучения в ШАД требуется хорошая математическая подготовка. Чтобы принять участие в отборе, до 10 мая заполните анкету поступающего и пройдите онлайн-тестирование. Кроме того, 8 апреля в Москве прошел День открытых дверей ШАД. Вы можете посмотреть видеозапись встречи.
Как проходит набор?
Отбор в школу проходит в три этапа:
- Онлайн тестирование: после заполнения анкеты поступающего вы получите письмо со ссылкой. На решение заданий теста отводится пять часов.
-
Письменный экзамен: для поступающих в московское отделение ШАД экзамен состоится очно в Москве в конце мая или в начале июня.
Поступающие в филиалы и на заочное отделение сдадут экзамен онлайн в начале июня. В письменном экзамене могут поучаствовать только те, кто успешно прошли этап онлайн-тестирования. - Собеседование: в конце июня — начале июля для всех, кто успешно прошел первые два этапа, пройдут собеседования в отделениях ШАД или по скайпу.
Подготовка
При поступлении в ШАД проверяются знания в рамках общей программы, включающей базовые разделы высшей алгебры, математического анализа, комбинаторики, теории вероятностей, а также основы программирования. Примеры заданий письменного экзамены:
- Набор 2012 года
- Набор 2013 года
- Набор 2014 года
- Набор 2015 года (статья на хабрахабр с решениями)
- Набор 2015 года (статья выпускника ШАД на хабрахабр с решениями)
- Набор 2016 года
- Набор 2017 года
Платное обучение
Поступающие, хорошо показавшие себя на собеседовании, но не прошедшие по общему конкурсу, смогут начать учиться на платной основе (только в московском отделении). Платная учёба ничем не отличается от бесплатной — нужно выполнять все те же непростые задания, укладываясь в жёсткие сроки. Обучение стоит 110 000 рублей за семестр. Если студент заканчивает семестр на «хорошо» и «отлично», стоимость обучения для него снижается до 55 000 за семестр. Сдавший на «хорошо» и «отлично» две сессии подряд дальше учится бесплатно.
Стажировки
Если вы чувствуете, что ваших знаний достаточно для непосредственной работе в Яндексе, подобрали несколько открытых вакансий:
-
Стажер-тестировщик
-
Стажер-исследователь (Data Mining, Machine Learning)
-
Дежурный администратор
- Вакансии для начинающих специалистов
Подробнее о стажировках в компании можно прочитать на сайте Яндекса.
Работа стажёра
- наукоёмкие технологии
- реальные сервисы
- «боевые» задачи
Подготовка к поступлению
Андрей Спиридонов, студент первого курса ШАДа: Я учусь на пятом курсе физфака МГУ: занимаюсь теоретической физикой и изучаю теорию струн. В первый раз я попробовал поступать в ШАД ещё после школы, но мне не хватило ни математического аппарата, ни мотивации. Я учился в СУНЦ, участвовал в олимпиадах, и Школа анализа данных была везде на слуху. Мне просто хотелось попробовать туда попасть, а понимания зачем это нужно не было, — поэтому я, наверное, и не прошёл.
Андрей Спиридонов
Нельзя сказать, что я ответственно готовился к поступлению во второй раз: но занятия теоретической физикой прокачивают как знания, так и мотивацию. Прежде чем посвятить себя фундаментальной науке, хочется попробовать что-то ещё — например, анализ данных.
Я начал готовиться за полгода до экзамена: раз в неделю по два-три часа прорешивал математические задачи. В интернете много материалов для подготовки: поступать в ШАД — распространённое развлечение для бывших олимпиадников и просто тех, кто любит математику. Я читал наработки сообщества и анализировал их.
Ещё я взял для подготовки две книги: по теории вероятности и математической статистике и по алгоритмам. Чтобы разобраться с алгоритмами, я использовал «Искусство программирования» Дональда Кнута: там содержатся сведения из дискретной математики, а в ШАДе любят давать задания на суммирование рядов и восстановление рекуррентных последовательностей. Я почувствовал, что есть вещи, которые не запомню, и что сборники пригодятся мне на очном экзамене. Я взял их с собой, хотя они и были тяжёлыми.
Стас Федотов, руководитель Школы анализа данных в Москве: На вступительных экзаменах поступающему могут встретиться олимпиадные задачи, требующие скорее не конкретных знаний, а хорошо выработанной математической интуиции. Мы постарались собрать те темы, которые, на наш взгляд, могут оказаться полезными в анализе данных: вы не встретите в заданиях теории групп или интегралов по поверхности. Однако не у всех способных людей, которые уже вовсю изучают анализ данных самостоятельно, есть внушительный математический багаж. В этом году мы решили дать таким поступающим больше возможностей проявить себя и открыли новый трек отбора: на нём можно будет не решать зубодробительные задачи, но придётся впечатлить комиссию достижениями в сфере машинного обучения: статьями, участием в проектах и так далее.
Data scientist
Никита Попов, выпускник 2016 года:
«Data scientist — так сейчас называют аналитиков всех мастей. Мы в Яндексе привыкли считать, что data scientist — это человек, который отлично владеет машинным обучением и статистикой и, главное, на практике может извлечь полезную информацию из огромного объема данных.
Сейчас я работаю в команде метрик Поиска. Мы работаем над тем, чтобы оценивать качество нашего поиска, выбирать, в какую сторону двигаться и какой из множества проводимых экспериментов действительно увеличит “счастье пользователя”. В команду я попал через стажировку сразу после окончания ШАДа. Школа анализа данных дала мне отличную базу: курсы по машинному обучению и вероятностным моделям — это как раз то, что я использую каждый рабочий день.
Я поступил за компанию со своими одногруппниками, но уже с первых семинаров стало понятно, что ШАД — это безумно интересно. Именно там я осознал, чем хочу заниматься. Думаю, что каждый data scientist должен хорошо разбираться в различных методах машинного обучения, знать их плюсы, минусы и область применения, уметь находить в данных зависимости и делать правильные выводы на их основе. Несмотря на то, что работаю я аналитиком, очень часто приходится заниматься и разработкой. Недавно я допилил сервис, для которого разрабатывал и фронтенд, и бекенд, и сами алгоритмы — data scientist должен уметь всё».
Максим Спорышев
Я приехал учиться в ШАД из Владивостока. Размышлял о переезде всегда, ещё со школы, но большую часть времени жил в родном городе, потому что меня вдохновляли преподаватели из ДВФУ. После специалитета я продолжил заниматься там подводной робототехникой, ведь наш вуз — самое подходящее для этого место в России: рядом море, есть Институт проблем морских технологий (ИПМТ), в котором ещё со времен СССР изучали подводную робототехнику. Также я занимался олимпиадным программированием: участвовал в школьных и студенческих соревнованиях. Кроме того, с 2013 года я преподаю робототехнику в родном университете.
Мне кажется, что сейчас мало таких роботов, которые приносили бы коммерческую пользу. Но это постепенно меняется: людям становятся доступны дроны и роботы-пылесосы, бизнесу — промышленные роботы, роботизированные «руки» на конвейерах заводов и роботы на складах, которые помогают переносить грузы. Задач, которые человеку сложно выполнять по сравнению с машиной, очень много.
Поэтому моя мечта — попасть в коммерческий проект, связанный с робототехникой, в котором можно будет и разрабатывать алгоритмы, и учиться у других разработчиков.
В ШАДе есть много предметов, которые могли бы в этом помочь: особенно на направлении «Инфраструктура больших данных», на котором я теперь учусь. А ещё меня интересуют распределённые системы — это довольно динамичная область.
О ШАДе я узнал ещё в 2013 году, когда стажировался в Яндекс.Картах в Москве. Потом вернулся во Владивосток, пытался поступить на заочное отделение, но плохо подготовился и не смог выполнить задание по математике. Попробовать снова решил в 2020 году, когда уже окончил аспирантуру. Так как поступать в ШАД по моему направлению можно было только очно, то я переехал в Москву. Меня ничего не держало дома: я работал разработчиком плагинов для обработки видео на фрилансе.
Для того, чтобы попасть в ШАД по традиционной траектории, нужно решить олимпиадные задания по математическому анализу, линейной алгебре и теории вероятностей. Я изучал математику в университете, но не использовал эти знания регулярно, и поэтому плохо решал задачи. Когда я пробовал выполнять тестовые задания на сайте ШАДа, то легко справлялся с алгоритмической частью и программированием, а вот с математикой буксовал.
Потом я узнал о альтернативном треке поступления: его отличали другие требования — упор на практический опыт в портфолио и меньший акцент на математических знаниях. Однако о нём было мало информации, и поэтому я продолжал готовиться к общему треку отбора.
В январе 2020 года я начал заниматься с репетитором и решать тестовые задания прошлых лет. В апреле открылся набор в Школу: онлайн-тестирование было общим для всех треков, и я справился. Вскоре выложили пробные варианты экзаменов по математике и программированию, я посмотрел на задания и понял, что новый трек подходит мне больше.
Экзамен проходил онлайн в два этапа. На первом этапе были теоретические задачи по математике и программированию. Я готовился к более сложным вещам, поэтому эту часть экзамена прошёл легко. Зато на втором этапе были задания по программированию и анализу данных: они были сложнее тестовых и больше походили на олимпиадные.
После экзамена нужно было пройти три собеседования: по математике, программированию и на мотивацию. На последнем задают казалось бы простые вопросы: нужно рассказать о себе и о том, зачем ты поступаешь в ШАД
Но важно сформулировать ответы заранее, ведь если начать рассуждать на ходу, то есть риск быть неверно понятым или выразиться неточно.
Я рад тому, что поступил в ШАД, а не в магистратуру, ведь здесь я могу заниматься только тем, что мне интересно. Было сложно, но я окончил первый семестр на «отлично». Самые приятные курсы для меня — это дополнительные. Например, в этом семестре я проходил курс “Theory and practice of concurrency”. А в прошлом полугодии у меня были занятия по архитектуре компьютеров и операционных систем.
Математикой я начал заниматься за полгода до поступления, но многие знания и навыки можно подтянуть и за меньшее время. Можно посмотреть задания прошлых лет, порешать олимпиадные задачи для того, чтобы отработать навык и изучить распространённые подходы к их решению.
Но самое главное — это понимать, что нет ничего страшного в том, чтобы оступиться и не пройти с первого раза. Вы всегда можете подготовиться лучше и попробовать снова.
Сергей Бондарев, Минск
ШАД сильно изменил мои представления о будущей профессии: раньше я даже не планировал заниматься машинным обучением, а сейчас считаю себя настоящим датасаентистом. Благодаря Школе я стал чувствовать себя гораздо увереннее, стал как-то глобальнее мыслить, думать о будущем.
Учебу в ШАДе я совмещал с работой и учебой в аспирантуре. Было, мягко говоря, непросто — даже пришлось брать год академа. Но плохое быстро забывается, остается только хорошее. Например, иногда вспоминаю, как сижу я ночью, в четыре утра уже птицы начинают петь, а я всё еще что-то пишу. Глаза дико болят, хочется спать. Но и в такие моменты даже мысли не было взять это всё и бросить. Непонятно откуда появлялось просто дикое упрямство и желание идти вперед.
Единственное, о чем я жалею, что не было возможности учиться очно. Потому что живое общение с преподавателями, возможность что-то спросить дополнительно по теме — это бесценно, невозможно заменить этот опыт никакими видеолекциями. Ради него стоит даже переехать в другой город.
Московский физико-технический институт
Чему мы учим?
Уже больше десяти лет кафедра Яндекса в МФТИ готовит специалистов в области Data Science. Студенты осваивают актуальные методы хранения, обработки и анализа данных, а также получают опыт работы над реальными задачами в разных областях: от голосовых помощников до беспилотных автомобилей. Сильная теоретическая подготовка в сочетании с большим количеством практики позволяет магистрантам не только пользоваться самыми продвинутыми методами и инструментами Data Science, но и создавать собственные.
В 2020 году открылась новая магистерская программа — «Инфраструктура больших данных». Программа соответствует направлению «Инфраструктура больших данных» ШАДа и подойдёт тем, кто любит программировать, интересуется сложными алгоритмами и хотел бы стать разработчиком распределённых систем.
Как поступить?
На программе «Анализ данных» есть два трека: базовый и продвинутый. Базовый трек предлагается тем, кто недавно пришёл в IT и хочет всему научиться. Обязательное условие для абитуриентов — поступление в ШАД. Отбор в ШАД проводится ежегодно. Подать заявку и пройти первый этап можно с начала апреля до первых чисел мая. Подробнее об экзаменах можно прочитать здесь.
Продвинутый трек подойдёт тем, кто окончил ШАД или сильный бакалавриат в области Data Science, но хочет погрузиться в тему ещё глубже или заняться наукой. Для поступления нужно нужно пройти отбор, включающий контест и собеседование по статистике, машинному обучению и основам оптимизации. Чтобы участвовать в конкурсе, во второй половине мая или в июне напишите на почту st-fedotov@yandex-team.ru.
Желательным условием для абитуриентов программы «Инфраструктура больших данных» является поступление в ШАД. Те, кто по каким-то причинам не выполнил это условие, могут связаться со мной по почте в июле и пройти собеседование на оставшиеся места.
[править] Сотрудничество с вузами
В 2007 году при поддержке ШАД на базе МФТИ была создана кафедра анализа данных. Для студентов Физтеха обучение начинается на 3-4 курсах бакалавриата, магистерская программа доступна всем желающим.
Весной 2014 года Высшая школа экономики и Яндекс открыли факультет компьютерных наук. Преподаватели ШАД и сотрудники компании участвуют в создании учебного плана, ведут занятия для студентов.
С сентября 2011 года ШАД сотрудничает с факультетом прикладной математики и информатики Белорусского государственного университета. В 2014 году на ФПМИ БГУ стартовала магистерская программа по направлению «Алгоритмы и системы обработки больших данных».
Программа Школы анализа данных и магистратуры механико-математического факультета МГУ действует с 2012 года. Для обучения по ней требуется одновременно поступить в ШАД и в магистратуру университета по специальности «Компьютерная алгебра».
УРФУ
С сентября 2017 года в рамках направления «Компьютерные науки» открыта совместная магистратура ШАДа и Уральского федерального университета в Институте естественных наук и математики по траектории «Анализ данных».
ННГУ
Ряд дисциплин института информационных технологий, математики и механики Нижегородского государственного университета преподаётся с использованием материалов ШАД. В 2018 году в ННГУ запущена магистерская программа «Когнитивные системы», учебный план и материалы которой подготовлены при участии преподавателей Школы анализа данных Яндекса.
РЭШ
В 2019 году ШАД и Российская экономическая школа создали программу подготовки специалистов, обладающих одновременно навыками экономического моделирования и анализа данных. При прогнозировании в дополнение к классическим моделям машинного обучения они смогут учитывать экономические факторы, поведение людей, строение сложных экосистем.
ИТМО
Магистерская программа «Аналитика данных» открылась в Университете ИТМО в 2020 году при содействии Яндекса. Студентов учат создавать, адаптировать и применять методы анализа данных к разным предметным областям, используя машинное обучение, анализ временных рядов, компьютерное зрение, интеллектуальный анализ изображений, звуков и текстов на естественном языке.
ЕУ СПб
Осенью 2020 года Европейский университет в Санкт-Петербурге и Яндекс запустили программу профессионального образования «Пандан» (Прикладной анализ данных). В рамках образовательного цикла выпускники гуманитарных и общественных специальностей узнают больше о количественном повороте в своих и смежных областях, а выпускники технических направлений получат представление о проблемах в общественных науках.
СПбГУ
При участии Яндекса и СS-центра в Санкт-Петербургском государственном университете был создан факультет математики и компьютерных наук.
ЦЕРН
ШАД — участник совместных экспериментов с LHCb и ЦЕРН по применению возможностей машинного обучения и анализа данных в задачах физики высоких энергий.
Турмец Макоев
Я думал о поступлении в ШАД с первого курса университета. C каждой новой попыткой поступить у меня получалось справляться со вступительными чуть лучше. И только на четвёртом курсе я наконец смог пройти в Школу. Так получилось, что в 2020 году появился новый трек поступления, и я — как раз его целевая аудитория.
В портфолио для поступления, которое мы с кураторами разбирали на собеседовании, я использовал один из наших учебных проектов — сервис для анализа содержимого набора изображений при помощи модели Yolo V2. Мы использовали его для того, чтобы анализировать фотографии людей, откликнувшихся на вакансии в компании: например, если у соискателя в социальных сетей много снимков с животными, то, вероятно, он лучше подойдёт на позицию ветеринара.
Помимо портфолио нужно было подготовить развёрнутый рассказ о своём опыте для одного из вопросов анкеты. Кроме того, нужно было пройти два экзамена, а потом ещё три интервью — но я со всем справился.
Я со школы занимался олимпиадным программированием, но не углублённо, не уходя в него с головой. А в ШАДе как раз ценится олимпиадный подход к решению проблем: компактность логики решения, его скорость и то, оптимальное ли оно по сравнению с другими вариантами. В Школе меня привлекало в первую очередь это. Кроме того, я понял, что инфраструктурная разработка мне ближе, чем машинное обучение, и поэтому сейчас я изучаю высоконагруженные распределённые системы.
Если вы поступаете в ШАД, то ваш главный ресурс — это время и усилия. С ними вы решите любую задачу. Ещё важны единомышленники, которые смогут помочь вам и поддержать вас во время учёбы: к счастью, среди поступающих в Школу и её студентов таких людей много.