Твой максимум баллов на Wink AI Challenge: разбираем советы экспертов

Wink AI Challenge — не пропусти Wink AI Challenge — первый в России ИИ-хакатон в киноиндустрии. Создай своё решение, которое ускорит производство фильмов и сериалов.. Призовой фонд — 1 125 000 рублей.

Перед стартом хакатона прошёл митап, где организаторы подробно рассказали о целях соревнования и задачах каждого трека. В обсуждении приняли участие:

  • Евгения Мельникова — директор по маркетингу Wink.
  • Артём Орлов — директор направления инноваций и ИИ Wink.
  • Владислав Момджян — медиаменеджер, создатель и руководитель сервиса автоматизации кинопроизводства FilmToolz.
  • Тимур Харин — эксперт платформы Codenrock.

Из расшифровки вы узнаете, зачем Wink проводит хакатон, как ИИ может помочь продюсерам, режиссёрам и сценаристам, какие решения получат наивысший балл и по каким критериям. 

Полная запись митапа Wink AI Challenge

Цели хакатона 

С приветственным словом к участникам митапа обратилась Евгения Мельникова, директор по маркетингу Wink. Она рассказала о развитии онлайн-кинотеатра и о том, почему компания решила провести хакатон.

Wink — один из крупнейших онлайн-кинотеатров на рынке. Он занимает второе место по количеству платящих подписчиков. Сервис является совместным предприятием двух крупных холдингов — Национальной Медиа Группы и Ростелекома.

У нас огромная техническая база, большой сервис, много посетителей и подписчиков. Мы активно развиваем продукты, постоянно ищем новые гипотезы, тестируем, проверяем, совершенствуем их. Wink — это не только платформа, но и медиабизнес. Мы создаём сериалы: наверняка вы видели такие проекты, как «Слово пацана», «Москва слезам не верит», «Фишер» и другие. 

Сегодня онлайн-кинотеатры — один из главных двигателей медиаиндустрии. За последние годы заметно выросло качество контента.

Всё это и привело нас сюда — потому что нам нужно производить больше и качественнее.

Чтобы выпускать фильмы и сериалы чаще и лучше, важно оптимизировать производство. Wink — зрелый, устойчивый бизнес, который должен быть эффективным, и не можем позволить себе снимать проекты, не приносящие прибыль.

Поэтому нам нужно искать новые подходы и решения, которые помогут делать больше отличных сериалов. И именно для этого мы сегодня здесь — чтобы вместе с вами найти такие инструменты. Мы планируем создавать ещё больше хитов — и надеемся, что вы нам в этом поможете.

Трек 1. Платформа автоматического разбора и структурирования сценариев

Первый трек представил Владислав Момджян, медиаменеджер, создатель и руководитель сервиса автоматизации кинопроизводства FilmToolz.Он объяснил, как сегодня устроена работа со сценариями и какие задачи в этом процессе может решить искусственный интеллект.

FilmToolz — инструмент, которым пользуются 90 % кинокомпаний в России. В нем планируют съёмки, ведут бюджетирование проектов. Команда сервиса запустила крупнейшую кастинг-базу в стране и автоматизировала процессы препродакшена.

Работа со сценарием выглядит так. Пользователь — обычно это второй режиссёр или продюсер — импортирует сценарий. Технически его можно достаточно легко распознать на сцены, персонажей и локации, даже без использования ИИ. После этого второй режиссёр, чтобы спланировать съёмки и передать информацию исполнительному продюсеру для составления бюджета, вручную вычитывает сценарий, анализируя каждую сцену и выписывая так называемые неявные ресурсы. Это, например, трюки, драки, погони, реквизит — сабля, шпага, телефон, компьютер и другие элементы. Затем вместе со съёмочной группой эти ресурсы обсуждаются и уточняются.

Внедрение в FilmToolz автоматического импорта сценария и связи данных с бюджетом сэкономило продюсерам много времени: можно быстро загрузить сценарий, увидеть количество объектов, актёров, мест съёмки и сразу приступить к предварительной смете. 

Но остаётся сложной задача распознавания косвенных упоминаний, которые теряются при автоматическом парсинге. Индустрии не хватает инструмента для экспресс-анализа сценария на наличие скрытых ресурсов, которые пока приходится извлекать вручную.

Поэтому задача первого трека — научить искусственный интеллект помогать составлять документ, называемый либретто или режиссёрский сценарий, то есть формировать описание каждой сцены со всеми необходимыми элементами съёмки, исходя из текста сценария. 

Трек 2. Интеллектуальный сервис превизуализации сценариев

О втором треке рассказал Артём Орлов, директор направления инноваций и ИИ Wink. Он пояснил, как сценарий превращается в визуальный материал и почему индустрии нужен гибкий инструмент для превизуализации.

Второй трек посвящён графической составляющей. Если первый про текст и работу со сценарием, то здесь речь идёт об изображении, которое не менее важно, чем само текстовое описание.

Сценарий проходит несколько этапов. Один из них — питчинг, когда проект презентуют генеральным продюсерам разных направлений. К этому моменту необходимо иметь хотя бы базовую визуализацию, чтобы показать идею.

Сценарий — живой документ, он меняется в процессе съёмок. Поэтому очень важно, чтобы вся команда оставалась в едином визуальном поле. Если текст задаёт основу, то визуализация помогает всем участникам съёмочного процесса видеть одну и ту же картину.

Сейчас искусственный интеллект позволяет продвинуться дальше: уже появляются аниматики — черновые визуальные версии сценариев, создаваемые ещё до выхода проекта на съёмочную площадку. Обычно процесс выглядит так: сначала текст, потом изображение, затем видео или аниматики — и только после этого начинается производство.

Многие уже используют готовые инструменты, например, Higgsfield или Runway. Но это, как правило, зарубежные решения. И продюсеры или режиссёры часто сталкиваются с тем, что такие сервисы сильно ограничены: шаг влево, шаг вправо, и нужный результат получить сложно. Тогда приходится подключать технических специалистов, которые собирают сложные пайплайны в нодовых редакторах, чтобы добиться одной картинки.

Поэтому задача второго трека — найти баланс между этими двумя крайностями и сделать инструмент, который будет понятен продюсерам и режиссёрам, позволит работать в привычной для них среде и подстраиваться под их потребности.

Трек 3. Автоматическая проверка возрастной категории по сценарию

Третий трек снова представил Владислав Момджян. Он показал, как можно автоматизировать юридическую проверку сценариев и использовать ИИ для оценки соответствия возрастным ограничениям.

Перед запуском проекта в производство юридический отдел вычитывает сценарии. Это нужно было, во-первых, чтобы проверить сценарий на соответствие договору с заказчиком, если продукт создавался по контракту. А во-вторых, чтобы убедиться, что сценарий соответствует возрастному рейтингу, например 12+, согласно закону «О защите детей от информации, причиняющей вред их здоровью и развитию». После всех редакторских правок юристы вручную сверяют, нет ли в сценарии сцен, нарушающих возрастной ценз. 

Вторая типичная ситуация — когда сценарий поступает на рассмотрение ещё на этапе покупки. Продюсерам материал может понравиться, они готовы запускать проект, но юристы открывают текст и находят в нём сцены с насилием и другими вещами, которые делают его 18+. В итоге такой сценарий нельзя продать или выпустить в запланированном формате.

 На мой взгляд, такая проверка — рутинная работа, которую вполне можно автоматизировать. Это понятная и чётко формализуемая задача, напрямую связанная с текстовыми моделями. Нужно просто корректно интерпретировать законодательство: в законе перечислены основные категории, на которые обращают внимание — сцены насилия, употребление алкоголя, драки, наличие определённых объектов или действий в кадре.

Задача трека — создать систему, которая автоматически анализирует сценарий на соответствие возрастным ограничениям и визуализирует результаты проверки в удобной форме. Чтобы пользователь сразу видел, какие фрагменты могут вызывать вопросы у юристов, и мог легко с этим работать.

Вопросы и ответы

После презентаций спикеры ответили на вопросы. При поддержке эксперта Codenrock Тимура Харина участники митапа обсудили доступные данные, критерии оценки, технические требования и детали финальной защиты.

— Можно ли использовать данные из открытых источников и предобученные модели? Есть ли ограничения по стеку технологий?

Да, конечно. Мы поддерживаем использование любых дополнительных открытых данных, если это помогает повысить качество решения. Главное, чтобы источники были легальными и релевантными задаче. Допустимо использование любых подходящих моделей, если они помогают решить задачу эффективнее. Единственное требование: взаимодействие с ML-моделью должно идти через OpenRouter, чтобы мы могли воспроизвести ваш результат в нашем окружении. Мы планируем запускать решения участников в локальном контуре, чтобы убедиться, что всё работает так же, как на демонстрации. 

— Какие данные будут предоставлены для работы?

Участники получат набор сценариев — это реальные тексты серий сериалов, отражающие содержание эпизодов. Сценарии будут неразмеченными, без заранее подготовленных таблиц. Для первого трека мы дополнительно предоставим примеры, какие столбцы и сущности могут присутствовать. Также мы предоставим лимитированный токен для работы с OpenRouter — через него можно будет направлять запросы к выбранным моделям. Это позволит протестировать и отладить решения. В реальной эксплуатации подобный процесс будет интегрирован во внутренний контур, но принципы и протокол взаимодействия останутся теми же.

— По каким критериям будут оценивать готовые решения? Что в приоритете — точность, интерфейс или техническая сложность?

В первую очередь оценивается функциональность и корректность результата. Важно, чтобы продукт действительно выполнял свою задачу и содержал заявленный функционал. Всё остальное — интерфейс, глубина ML-модели и технические детали — вторично, если основная цель не достигнута.

— Какое финальное решение ожидается на защите? Это должен быть работающий веб-сервис или достаточно локального прототипа и презентации?

На финале нужно будет предоставить три элемента: презентацию, демонстрацию работы и исходный код. Код мы будем запускать самостоятельно локально, чтобы проверить функциональность. 

Мы ожидаем, что у решения будет полноценный визуальный интерфейс. Пользователь должен видеть процесс анализа сценария, результаты проверки и иметь возможность взаимодействовать с ними — например, редактировать или уточнять данные. В описании третьего трека подробно показан путь пользователя: что он делает в системе и что видит на каждом этапе.

— Анализ сценариев должен строиться строго по критериям закона «О защите детей от информации, причиняющей вред их здоровью и развитию», или у Wink есть собственные внутренние стандарты оценки контента? И как быть с пограничными случаями?

Основой остаётся федеральный закон № 436-ФЗ. Мы не оцениваем субъективные или моральные аспекты, а опираемся на формулировки правового акта. Неважно, оправдано ли насилие или показано в негативном контексте — если оно присутствует, это автоматически тянет за собой возрастное ограничение 16+ или 18+.

Например, в практике был случай: даже бокал шампанского на Новый год вызывал повышение рейтинга, потому что формально упоминание алкоголя уже требует маркировки. Приходилось убирать такие детали из сценария или заменять их абстрактными.

Если это кровавый исторический фильм — у него будет «взрослый» рейтинг. А в фильмах вроде «Мстителей» могут быть драки, но без крови и явных повреждений, поэтому рейтинг — 6+. В рамках хакатона стоит фокусироваться на чётких формулировках закона и обработке всех явных случаев.

У Wink, конечно, есть собственная редакционная проверка, но она вторична. Если контент прошёл прокатное удостоверение, значит, он и так соответствует нормам. Наша цель — ориентироваться именно на № 436-ФЗ, а не на внутренние интерпретации. Другие законы, регулирующие, например, оскорбление религиозных чувств, к маркировке не относятся, поэтому на них можно не ориентироваться при разработке решения. 

— В сценаристской среде есть лайфхак: придумывать «мягкие» аналоги ругательств, похожие по звучанию, но не являющиеся матерными. Нужно ли учитывать такие случаи?

Если приём действительно работает и такие сценарии принимают, это не нарушение. Например, в сериале «Воронины» использовались собственные вымышленные ругательства, и проект имел рейтинг 6+.

На этапе подачи сценариев в Минкульт тексты с нецензурной лексикой не проходят. Но при этом на платформах могут выходить версии «18+» с матом. Поэтому мы ориентируемся только на официальный перечень бранных слов, признанных Минкультом. Всё, что не входит в него, не считается нарушением.

— Как планируется встраивание нейросети в рабочий процесс? Нужно ли делать отдельный веб-клиент для работы с моделью?

Техническая реализация остаётся на усмотрение команды. Главное, чтобы у пользователя был понятный визуальный интерфейс для работы с результатами анализа. Мы не требуем Swagger, OpenAPI или админку — акцент на полноценном UX, где сценарист или продюсер может интуитивно взаимодействовать с системой.

— Нужно ли связывать решение с Film Tools или можно сделать отдельный инструмент?

Интеграция с Film Tools не требуется. Мы ищем самостоятельные решения, а не дополнения к существующим сервисам. После хакатона будем рассматривать, какие из них можно внедрить в рабочие процессы. Сейчас важно показать концепт, который сам по себе ценен и жизнеспособен.

— Будут ли сертификаты для участников, не прошедших в финал?

Да, сертификаты получат все, кто загрузит решение. В них будет указано участие в Wink AI Challenge и трек, по которому вы выступали.

— По второму треку: что будет оцениваться выше — полностью локальное решение без токенов или гибрид с внешними API?

Всё зависит от результата. Главное — бизнес-эффект и качество решения. Если несколько команд покажут сопоставимый результат, тогда эксперты посмотрят на техническую реализацию и эффективность: как рационально расходуются ресурсы и насколько решение устойчиво. Важно не то, на каком стеке реализовано решение, а то, насколько оно помогает достичь цели трека.

— Можно ли реализовать финальный продукт в формате чат-бота?

Мы ожидаем полноценный сервис, с которым можно взаимодействовать напрямую. Предпочтительно, чтобы это был веб-интерфейс, где пользователь сможет выполнять все необходимые операции.

— По каким критериям будут отбираются победители?

Все критерии чётко прописаны и основаны на экспертной оценке. Пример для первого трека: функциональная полнота решения. Мы оцениваем, насколько корректно вы сегментируете сценарий на сцены, определяете их номера, извлекаете ключевые элементы  и правильно заполняете таблицу.

— Будет ли ещё один митап после открытия треков для уточнений?

Да, будет. Запланированы три чекпоинта, где участники смогут задать вопросы и обсудить возникающие детали.

Пожелания экспертов участникам

В конце митапа спикеры обратились к участникам с напутственными словами.

Владислав: Хочу, чтобы участники довели свои решения до конца и прислали такие работы, которые заинтересуют нас и Wink для внедрения в индустрию. Это, наверное, самое приятное — когда твоим решением начинают пользоваться реальные проекты и компании. 

Евгения: Пожелаю ребятам энергии — прорывной, созидательной, чтобы всё получилось и чтобы мы действительно сделали что-то полезное для индустрии.

Артем: Я, наверное, просто пожелаю удачи, потому что у нас всё-таки соревнования, и без удачи никуда — она всё равно нужна. И всем желаю настойчивости и сил, чтобы выдержать: у нас путь достаточно длинный, а задачи не самые простые. Так что — сил, настойчивости и удачи.

Тимур: Я пожелаю, во-первых, дождаться открытия, потом внимательно всё прочитать, реализовать весь свой потенциал, насладиться моментом достижения финала, выступить прекрасно на питчинге и дальше взаимодействовать с целью внедрения вашего результата и, возможно, дальнейшего сотрудничества с Wink.


    Оставьте заявку, мы подберем для вас лучшие решения для работы с ИТ-сообществом

    Будьте в курсе лучших кейсов хакатонов, ML-турниров, CTF и соревнований по спортивному программированию на Codenrock
    Добавить комментарий