Как прошел первый хакатон «Газпром-Медиа» GPM AdTech Challenge

В марте 2024 прошел первый хакатон сейлз-хауса «Газпром-Медиа» и programmatic-платформы Getintent – GPM AdTech Challenge. Участники работали над созданием сервиса для перевода и дубляжа видеоконтента в первом треке, а для второго готовили модель машинного обучения, способную предсказывать post-click конверсии в онлайн-рекламе.

Соревнование было проведено на платформе Codenrock.  Все тонкости организации таких мероприятий, итоги финала в Москве и эмоции участников – в нашем кейсе.

Подготовка к хакатону

GPM AdTech Challenge – масштабный проект, в котором организаторам предстояло решить две разные задачи:

  • Провести классический конкурс, на который участникам следует подготовить проект, презентацию и питчинг. 
  • Организовать ML-соревнование. На нем важно корректно определить точность моделей, разработанных участниками. 

Для каждого трека необходимо привлечь целевую аудиторию, которая заинтересуется задачами и сможет представить для них подходящие решения. Кроме того, нужно постоянно коммуницировать с участниками, оперативно отвечать на вопросы и решать проблемы. GPM AdTech Challenge проведен «под ключ» платформой Codenrock:

  • Для сбора заявок была запущена специальная страница. Участники могли создавать команды и присоединиться к ним прямо на платформе. 
  • Первый трек проведен со стандартными настройками хакатона. Для конкурсантов было создано задание, в котором они могли ознакомиться со всеми исходными данными и требованиями к проекту. Готовые решения участники загружали сразу на платформу. После завершения этапа члены жюри проголосовали за проекты по заданным критериям. Победили команды, набравшие больше всего баллов. 
  • Второй трек был проведен при помощи функционала для ML-соревнований. Участники получили ссылку на Gitlab с проектом и датасетом. В репозиторий они могли загрузить свою модель и запустить расчет ее точности по заданной метрике на серверах платформы, оптимизированных для работы с ИИ. Результаты подсчитывались автоматически и отображались в лидерборде. 
  • Эксперты Codenrock помогли проанализировать задания и подготовить их для участников.
  • Хакатон регулярно освещался в социальных сетях платформы. Информация о конкурсе публиковалась в email-рассылках и дайджестах IT-соревнований. Для участников был запущен чат, где они получали уведомления обо всех ключевых этапах GPM AdTech Challenge, могли задавать вопросы и получать обратную связь.

В результате более 300 участников две недели работали над проектами. Основные специальности конкурсантов:

  • DS-специалисты. 
  • Аналитики.
  • Backend-разработчики.

Возраст большинства конкурсантов – 18-35 лет. Уровень квалификации – Junior, Middle и Senior.

Как прошел хакатон

Отборочный этап хакатона стартовал 1 марта. С этой даты участники могли загружать через платформу Codenrock идеи своих проектов. Параллельно продолжалась регистрация на конкурс, потому что начало основного этапа соревнования было запланировано на 18 марта. В течение 10 дней команды, успешно прошедшие отбор, готовили проект в рамках одного из двух треков:

  • Задача 1: Сервис перевода и дубляжа видеоконтента.
  • Задача 2: Прогнозирование post-click конверсий в онлайн-рекламе.

Всего конкурсанты подготовили 42 решения. 

По итогам основного этапа GPM AdTech Challenge жюри отобрало по 5 лучших команд в каждом из заданий, которые получили возможность выступить с питчингом в финале в Москве. Помимо презентации проектов, участников ждал кофе-брейк и интерактивная игра «Полиглот». Конкурсанты могли отвлечься от языков программирования и переключиться на языки мировые. Ведущий включал записи разговоров, а задачей участников было угадать, на каком языке общаются люди. 

Завершился финал фуршетом и DJ-сетом. 

Итоговый видеоролик хакатона

Задачи хакатона

Трек 1. Сервис перевода и дубляжа видеоконтента

  • Задача участников – разработать сервис, который сможет транскрибировать аудиодорожку видео, перевести ее на иностранный язык и подготовить дубляж ролика. Решение должно поддерживать интеграцию с российскими open source инструментами, работать с популярными расширениями mp4 и mov, выдавать итоговый файл размером не более 5 ГБ в формате, подходящем для загрузки на видеохостинги. Использование платных модулей нежелательно. 
  • Решаемая проблема. Холдингу «Газпром-Медиа» больше 25 лет, за которые 8 телевизионных каналов накопили огромную библиотеку развлекательного видеоконтента: фильмов, сериалов, шоу-программ. Эти ролики могут быть интересны не только русскоговорящим пользователям. Качественный дубляж – это долго и дорого. С помощью машинного обучения это можно сделать быстрее, эффективнее и дешевле. Поэтому возникает потребность в сервисе, который способен переводить и дублировать развлекательный видеоконтент на английский язык.
  • Итоговый результат – готовый к использованию сервис для перевода видео. Участникам также было необходимо предоставить код проекта, презентацию и ролик, демонстрирующий возможности решения. Критерии оценки: высокое качество транскрибации, перевод шуток, диалектов и особенностей речи, простота и удобство интерфейса, точность дублирования с передачей эмоций актеров, синхронизацией голоса и сохранением фоновых звуков. 

Трек 2. Прогнозирование post-click конверсий в онлайн-рекламе 

  • Задача участников – классическая бинарная классификация. На входе конкурсанты получили три датасета: информация о площадке для показа рекламы и пользователях, сведения о действиях, которые они совершают, и данные о сторонних конверсиях. Также предоставлялся тестовый датасет для проверки точности модели. Для решения задачи можно было использовать только open-source библиотеки.
  • Решаемая проблема. Рекламная платформа заинтересована в повышении качества трафика. Рекламодатели хотят не просто показывать рекламу в Интернете, а видеть превращение посетителей в покупателей. Поэтому возникает потребность в продукте, который способен отличать потенциальных клиентов от тех, кто не совершит покупку, с учетом времени с момента показа объявления.
  • Итоговый результат – обученная модель, которая способна предсказывать post-click конверсии в онлайн-рекламе. Целевая метрика – ROC-AUC. Победители определялись по результатам тестирования решения на валидационном датасете. Все расчеты происходили автоматически на серверах Codenrock. 

Победители

Трек 1. Лучшие сервисы для перевода и дублирования видеоконтента представили:

🥇 Команда «Квадрицепс» – 300 000 рублей.

🥈 Команда Good Genius – 100 000 рублей.

🥉 Bitcoin Bandits – 50 000 рублей.

Трек 2. Самые точные модели для предсказания 3rd-party конверсий разработали:

🥇 Команда «Дайте Два» – 300 000 рублей.

🥈 Команда Random Click – 100 000 рублей.

🥉 Команда WB Heroes – 50 000 рублей.

Приз зрительских симпатий получили команды:

🎁 Netrunners – 50 тысяч рублей.

🎁 «Потом Придумаю» – 50 тысяч рублей.

Эксперты

Отзывы участников

Мы очень рады, что у нас была возможность поучаствовать в финале в таком приятном, атмосферном месте. Члены жюри и зрители были очень хорошо настроены к нам, внимательно слушали и дали подробную оценку проекта – рассказали нюансы, посоветовали, что можно дополнить и исправить.

Надежда Агафонова, команда Netrunners

Проект был интересным, задача – далеко не самая простая, и я считаю, решение, которые было предложено нашей командой, можно рассмотреть для будущих работ в этой области. Организация была на высшем уровне, очень вкусная еда, кофе тоже хороший. Все тайминги соблюдены. Респект «Газпром-Медиа», что занимаются такими сложными проектами. 

Иван Ворфоломеев, команда Netrunners

Отличная организация хакатона. Конкурс помогает научиться использовать различные системы оценивания. Хороший финал. Все понравилось. 

Олег Жолобов, команда «Потом Придумаю»

Отзывы организаторов

Мы задумали хакатон как некую сущность, которая показывает текущую роль «Газпром-Медиа» на рынке. Когда-то мы начинали как сейлз-хаус, который продавал только телевизионный инвентарь, и достаточно быстро убежали из этой тесной ниши. Сейчас мы ассоциируемся с передовым решением для любых рекламных задач. Внутри «Газпром-Медиа» уже есть много цифровых активов, и они часто сопряжены с поиском оптимальных IT-решений. Первый хакатон показал, что мы нащупали несколько крутых команд, которые показали крутые решения. Мы уверены, что будем продолжать с ними работать. 

Алексей Филия, директор департамента стратегии и развития рекламных продуктов Сейлз-хаус «Газпром-медиа»

Миссия хакатона – найти решение, которое даст возможность предлагать нашим клиентам новые продукты. Круто, что есть возможность посмотреть на то, как мыслят другие специалисты, как они подходят к нашим проблемам. Здорово, что есть ребята, которые с таким энтузиазмом занимаются подготовкой и участием в хакатонах. Для нас – это классная возможность выйти из зоны комфорта и понять, что можно еще делать из того, что мы не делаем. Спасибо всем участникам! Было очень интересно. 

Екатерина Макаренкова, генеральный директор компании Getintent

Хочу поблагодарить команду, которая организовывала мероприятие. Это была работа на протяжении двух-трех месяцев. Отличная площадка, отличная организация. Мы надеемся, что хакатон станет регулярным событием, и в следующем году, а может даже к концу этого, мы сможем нечто подобное повторить. 

Сергей Савинкин, руководитель направления продуктовой стратегии сейлз-хауса «Газпром-Медиа»
Оцените статью
Codenrock Blog


    Оставьте заявку, мы подберем для вас лучшие решения для работы с ИТ-сообществом

    X


      Оставьте заявку, мы подберем для вас лучшие решения для работы с ИТ-сообществом