Учитесь у лучших Kagglers


Курс, в котором лучшие Кагглер делятся своим опытом, только что возобновился на Coursera. Это часть нового набора курсов, которые включают недавно введенную специализацию Advanced Machine Learning Specialization.

Название этого курса «Как победить в конкурсе по науке о данных: учитесь у лучших Kagglers» расскажет вам большую часть того, что вам нужно знать перед регистрацией. Как и остальные шесть курсов, составляющих специализацию, он создан Национальным исследовательским университетом «Высшая школа экономики» (НИУ ВШЭ), одним из ведущих исследовательских университетов России. Пять инструкторов этого курса: Дмитрий Ульянов, Александр Гущин, Михаил Трофимов, Дмитрий Алтухов и Мариос Михайлидис, все они – видные члены сообщества Kaggle.

Напомним, Kaggle, который присоединился к Google в 2017 году, был сформирован в 2010 году как платформа для соревнований по прогнозному моделированию и аналитике. Недавно компания запустила собственную образовательную платформу, см. Мой отчет «Знакомство с Kaggle Learn» для тех, кто хочет заняться машинным обучением, программированием на R, визуализацией данных и глубоким обучением.

С другой стороны, этот курс предназначен в первую очередь для тех, кто хочет участвовать в соревнованиях Kaggle. В описании курса говорится:

Если вы хотите заняться наукой о конкурентных данных, этот курс для вас! Участие в соревнованиях по прогнозному моделированию может помочь вам получить практический опыт, улучшить и использовать свои навыки моделирования данных в различных областях, таких как кредитование, страхование, маркетинг, обработка естественного языка, прогнозирование продаж и компьютерное зрение, и многие другие. В то же время вы можете делать это в условиях конкуренции с тысячами участников, каждый из которых пытается построить наиболее предсказуемый алгоритм. Максимальное давление друг на друга может привести к повышению производительности и уменьшению ошибок прогнозирования. Возможность постоянно достигать высоких рангов может помочь вам ускорить вашу карьеру в области науки о данных.

Студенты могут рассчитывать на то, что они будут проводить 6-10 часов в неделю в течение 6 недель, и завершится финальным проектом, который сам по себе является конкурсом Kaggle, в котором вы соревнуетесь с другими участниками курса. Заявление об отказе от ответственности для этого класса гласит:

Это не курс машинного обучения в общем смысле. Этот курс научит вас получать высококлассные решения против тысяч конкурентов с упором на практическое использование методов машинного обучения, а не на теоретические основы, стоящие за ними.

Учитывая сугубо конкретную цель класса, многие студенты, вероятно, будут рассматривать его как отдельный MOOC. Однако для других он станет вторым компонентом специализации Coursera по продвинутому машинному обучению, которая предназначена для ознакомления с глубоким обучением, обучением с подкреплением, пониманием естественного языка, компьютерным зрением и байесовскими методами для студентов, которые уже знакомы с основами машинного обучения. В описании программы указано:

Вы усовершенствуете свои навыки, решая широкий спектр реальных задач, таких как создание подписей к изображениям и автоматическая игра на протяжении всего проекта курса. Вы получите практический опыт применения передовых методов машинного обучения, которые составляют основу современного состояния искусственного интеллекта.

Отправной точкой для специализации является Введение в глубокое обучение (6 недель, 6-10 часов в неделю), а предварительные условия – базовые знания Python; основы линейной алгебры и вероятности, а также базовые знания машинного обучения, включая линейную регрессию, логистическую регрессию, градиентный спуск для линейных моделей, проблему переобучения и регуляризацию для линейных моделей.

Остальные компоненты специализации, которые можно изучать в любом порядке, а также проходить как отдельные курсы:

Байесовские методы машинного обучения 6 недель, 6 часов в неделю

Обработка естественного языка 5 недель, 4-5 часов в неделю

Практическое обучение с подкреплением, 6 недель, 3-9 часов в неделю

Глубокое обучение в области компьютерного зрения, 5 недель, начало в апреле 2018 г.

Решение проблем больших адронных коллайдеров с помощью машинного обучения, 5 недель, начало в мае 2018 г.

Самая последняя дата начала первых пяти курсов Advanced Machine Learning – 9 апреля, и они будут проводиться повторно на регулярной основе. Поскольку это не первая презентация книги «Как победить в конкурсе по науке о данных», у нас есть рейтинги и отзывы студентов. В целом он получил 4,7 звезды из 168 оценок, и 87% присвоили ему полный 5-звездочный рейтинг. Вот полезный 5-звездочный обзор:

Так же, как и курс 1 этой специализации, курс 2 на конкурсе по практическим наукам о данных очень быстрый, поэтому викторины и задания действительно необходимы и очень полезны (даже для финального проекта). Некоторые задачи по программированию и финальный проект довольно сложны и отнимают много времени. Но стоит овладеть практическими знаниями / навыками и поработать над реальным программным решением.

Одним из аспектов, который лишил звезд курса, было качество голосов преподавателей и их использование английского языка, как показано в этом 2-звездочном обзоре:

Контент действительно хорош. Но доставка порой непонятна. Вопросы о заданиях тоже не очень понятны.

В этом обзоре с 1 звездой была высказана другая критика:

Должен был быть помечен как «Как обмануть конкурс Data Science». Целая неделя посвящена утечке данных и тому, как ее использовать, а не в духе соревнований, как создать модель, которая действительно решает проблему.

Чтобы полностью принять участие в этом курсе, вам нужно будет заплатить – маршрут аудита дает доступ только к видеолекциям и некоторым заданиям. Существует 7-дневная бесплатная пробная версия, после которой вы платите 49 долларов в месяц – поэтому чем быстрее вы работаете, тем меньше вы платите, а плата покрывает все курсы. Финансовая помощь доступна, но рассмотрение заявки занимает не менее 15 дней.


Добавить комментарий