Задача Машинного обучения Бозона Хиггса На Kaggle


Конкурс Каггла, спонсируемый экспериментом ATLAS в ЦЕРНЕ, проводится для изучения потенциала передовых методов машинного обучения в обнаружении бозона Хиггса.

Вызов Хиггса начался 12 мая и продлится до 15 сентября. В нем уже принимают участие 658 команд (всего 701 человек), но осталось еще много времени, чтобы присоединиться к этому интересному и актуальному конкурсу, где HEP (Физика высоких энергий) встречается с ML (Машинное обучение).

Чтобы внести эффективный вклад, не требуется никаких знаний в области физики элементарных частиц; вместо этого вам нужно хорошо разбираться в классификации и статистических методах.

ATLAS-это эксперимент по физике элементарных частиц, проводимый на Большом адронном коллайдере в ЦЕРНЕ, который ищет новые частицы и процессы с использованием лобовых столкновений протонов необычайно высокой энергии. Недавно он наблюдал сигнал распада бозона Хиггса на две тау-частицы, но этот распад представляет собой небольшой сигнал, скрытый фоновым шумом. Эта задача состоит в том, чтобы “улучшить значимость открытия эксперимента”, используя передовые методы машинного обучения для классификации событий в моделируемых данных в “тау-тау распад бозона Хиггса” по сравнению с “фоном”.

Предоставленные данные состоят из: 

training.csv – Обучающий набор из 250000 событий со столбцом идентификатора, 30 столбцами функций, столбцом веса и столбцом метки

test.csv – Тестовый набор из 550000 событий со столбцом идентификатора и 30 столбцами функций

Участникам также предоставляется образец файла представления в требуемом формате и скрипт на Python для расчета показателя оценки конкурса hte. Другое доступное программное обеспечение включает в себя тестовый скрипт MultiBoost и стартовый комплект Go.

Правила соревнований на Kaggle. Они включают в себя ограничение на размер команды из 4 членов и возможность отправлять заявки только с одной учетной записи Kaggle.

Конкурсанты могут подавать до 5 заявок в день, при этом поддерживается общественный совет лидеров. Это рассчитано примерно на 18% тестовых данных. Окончательный результат будет основан на остальных 82%, и участники могут выбрать до 2 окончательных работ для судейства. Денежные призы в размере $7000, $4000 и $2000 будут вручены трем лучшим игрокам на доске лидеров.

Существует также награда HEP meets ML, которая будет присуждена команде, создавшей модель, наиболее полезную для эксперимента ATLAS, по мнению членов сотрудничества ATLAS в организационном комитете.

Такая модель не обязательно будет самой эффективной на доске лидеров, но будет такой, которая оптимизирует точность, демонстрирует простоту и прямолинейность подхода, имеет разумные требования к производительности (требования к процессору и памяти) и надежность в отношении отсутствия статистики обучения. Победившая команда будет приглашена на встречу с физиками из коллаборации ATLAS в ЦЕРНЕ и получит до 2700 долларов для покрытия своих путевых расходов.

Кроме того, у сильных участников конкурса может быть возможность внести свой вклад в семинар NIPS в Монреале. Чтобы получить право на рассмотрение, команды должны представить свою модель (кодекс с достаточно подробной информацией о принципах, лежащих в его основе) к крайнему сроку проведения конкурса.


Добавить комментарий