Специализация

«Машинное обучение и анализ данных»

Получите востребованную специальность, решайте более сложные задачи, 
повысьте продуктивность сотрудников.
Расскажи друзьям
 
64%
64% российских компаний со штатом от 500 человек имеют аналитика.
Средняя зарплата специалиста в Москве 140 000 рублей.
?
«64% российских компаний со штатом от 500 человек имеют аналитика. Средняя зарплата специалиста в Москве 140 000 рублей, максимальная — 350 000.
* В течение 10 лет Data Scientist станет самой популярной профессией века».
Data
Scientist
В течение 10 лет Data Scientist станет самой популярной профессией века.

Для кого эта
специализация

Для
выпускников
и студентов

инженерных, технических 
и естественно-научных факультетов,
которые не изучали анализ данных, 
но хотят получить востребованную специальность и хорошо зарабатывать.

Для
профессиональных
аналитиков

которые хотят решать новые, более сложные задачи или оптимизировать существующие.

Для
директоров
компаний

которые понимают важность анализа данных и хотят обучить сотрудников, чтобы повысить их эффективность.

 

Особенности
специализации

от А до Я

Специализация подходит людям, незнакомым с анализом данных. Серия курсов постепенно, от простого к сложному, погружает в предмет. В первом курсе рассказывается о математическом аппарате и основах программирования на Python.

Полностью на русском

Это отличная возможность получить современные навыки людям, которые предпочитают обучение на русском.

Практические инструменты

Авторы серии курсов — сотрудники Yandex Data Factory и преподаватели МФТИ. Методики, которым вы научитесь, применяются каждый день в реальной работе.

Повышение квалификации на базе МФТИ

Вы можете пройти курс с персональным ментором для более глубокого погружения в тему. А сдав дополнительную итоговую аттестацию, слушатель имеет возможность получить удостоверение МФТИ о повышении квалификации.

Дистанционно

Обучение проходит в формате МООС
?
Massive open online course — массовый открытый онлайн курс (одна из форм дистанционного образования).
: вы смотрите лекции в удобное для вас время и получаете различные форматы заданий в виде тестов и перекрестных проверок.

Дипломный проект,
применимый на практике

В финальном проекте вы сможете применить полученные знания к реальным данным в электронной коммерции, социальных медиа, информационном поиске, бизнес-аналитике. Вы пройдете все этапы анализа данных — от подготовки до построения финальной модели и оценки её качества. В результате в портфолио появится проект, который смело можно указать в резюме и показать работодателю на собеседовании.

Трудоустройство
в топовые компании

Успешно оконченная специализация открывает путь в передовые компании России и мира. Мы не обещаем сразу топовые позиции, но гарантируем рассмотрение вашей кандидатуры в приоритетном порядке.

Лекторы

Константин Воронцов

доктор физико-математических наук, профессор РАН, заведующий отделом Интеллектуальных систем ФИЦ ИУ РАН, преподаватель ШАД

Вадим Стрижов

доктор физико-математических наук, доцент МФТИ, ведущий научный сотрудник ФИЦ ИУ РАН

Евгений Рябенко

кандидат физико-математических наук, доцент МФТИ, преподаватель ВМК МГУ, ШАД, data scientist Yandex Data Factory

Евгений Соколов

преподаватель ВМК МГУ, ВШЭ, ШАД, руководитель исследовательской группы Yandex Data Factory

Виктор Кантор

старший преподаватель ФИВТ МФТИ, преподаватель ШАД, руководитель исследовательской группы Yandex Data Factory

Эмели Драль

преподаватель ФИВТ МФТИ, РУДН, руководитель исследовательской группы Yandex Data Factory

Программа обучения

5 курсов

+

Дипломный проект

6 месяцев
3-6 часов в неделю
дистанционное участие
место проведения — Coursera
?
Coursera.org — платформа онлайн-обучения от ведущих мировых университетов.
Неделя 1

Введение.

Неделя 2

Библиотека Python и линейная алгебра.

Неделя 3

Оптимизация и матричные разложения.

Неделя 4

Случайность

Анализ данных и машинное обучение опираются на результаты из математического анализа, линейной алгебры и теории вероятностей. Без фундаментальных знаний по этим наукам невозможно понять методы анализа данных.

Первый курс сформирует этот фундамент. Мы без сложных формул и доказательств раскроем смысл математических понятий и объектов.

Неделя 1

Машинное обучение и линейные модели.

Неделя 2

Линейные модели и оценка качества.

Неделя 3

Решающие деревья и композиции моделей.

Неделя 4

Нейронные сети и обзор методов.

Обучение на размеченных данных или обучение с учителем — это возможность предсказать величину для любого объекта, имея конечное число примеров. Например, уровень пробок на участке дороги, возраст пользователя по его действиям в интернете, цену на подержанную машину. На этом курсе вы научитесь формулировать и решать такие задачи.

Неделя 1

Методы кластеризации.

Неделя 2

Понижение размерности и матричные разложения.

Неделя 3

Визуализация данных и поиск аномалий.

Неделя 4

Тематическое моделирование.

Из курса вы узнаете об алгоритмах кластеризации данных, с помощью которых можно искать группы схожих клиентов мобильного оператора. Вы научитесь строить матричные разложения и решать задачу тематического моделирования, понижать размерность данных, искать аномалии и визуализировать многомерные данные.

Неделя 1

Основы статистики и проверка гипотез.

Неделя 2

АБ-тесты: основы планирования, дизайн и интерпретация результатов.

Неделя 3

Анализ зависимостей.

Неделя 4

Скоринг, биоинформатика.

Влияет ли знание методов анализа данных на уровень заработной платы? Работает ли система оценки кредитоспособности клиентов банка? Действительно ли новый баннер лучше старого? Чтобы ответить на такие вопросы, нужно собрать данные. 99% данных содержат "шум", поэтому выводы на их основе не верны, а только вероятны. На этом курсе вы научитесь строить корректные выводы, оценивать параметры, проверять гипотезы и устанавливать причинно-следственные связи.

Неделя 1

Рекомендательные системы.

Неделя 2

Прогнозирование временных рядов.

Неделя 3

Скоринг, прогнозирование и CTR.

Неделя 4

Анализ текстов и другие прикладные задачи.

В этом курсе мы разберем прикладные задачи из различных областей анализа данных: анализ текста и информационный поиск, коллаборативная фильтрация и рекомендательные системы, бизнес-аналитика, прогнозирование временных рядов.

Вы научитесь сводить задачу заказчика к формальной постановке задачи машинного обучения и поймёте, как проверять качество построенной модели на исторических данных и в онлайн-эксперименте. На каждой задаче мы изучим плюсы и минусы пройденных алгоритмов машинного обучения.

Финальный проект даст вам возможность применить полученные в рамках специализации знания к задаче из реального мира. Под руководством успешных специалистов в науке о данных вы сможете поработать над актуальным проектом в одной из областей: электронная коммерция, социальные медиа, информационный поиск, бизнес-аналитика и др.

Авторы курса

Партнёр курса

Отзывы
студентов

Стоимость специализации

4 000
 ₽
в месяц
22 966
 ₽
за 6 месяцев
Подпишитесь на всю серию и получите доступ к:
  • Учебным материалам, оцениваемым заданиям, форумам обсуждений и многому другому.
  • Сертификатам, которые можно добавить в резюме или профиль на LinkedIn.
  • Круглосуточной поддержке пользователей.

Финансовая
помощь

Если вы хотите пройти специализацию, но не можете оплатить, заполните заявку на получение помощи от Coursera по программе Coursera Financial Aid.