AI Open News провела в 2023 году хакатон AI News Hack. Участники разрабатывали сервис удаления дубликатов и классификации новостей на основе машинного обучения для новостного Telegram-ассистента. Лучшие решения были использованы для доработки сервиса, а лучшие команды получили приглашение присоединиться к компании. Среди них оказался и коллектив NaturaLP, занявший 3 место.
Мы пообщались с заместителем капитана Никитой Ворожбитовым, который сейчас работает в AI Open News в роли Python & ML-developer. Он рассказал, как эффективно действовать в условиях нехватки времени, какие события запомнились больше всего, а также поделился советами для участников ML-соревнований.
Какую конкретную проблему решала ваша команда на хакатоне?
На хакатоне наша команда NaturaLP решала задачу автоматизации классификации новостных сообщений и удаления дубликатов. Мы работали над улучшением сервиса AI News с помощью машинного обучения и искусственного интеллекта. Основная цель заключалась в создании модели, которая классифицировала новости по 29 категориям и удаляла дубликаты новостей с использованием технологии нечеткого сравнения. Это значительно повысило эффективность обработки данных в новостных сервисах.
Как участие в хакатоне повлияло на ваше профессиональное развитие?
Участие в хакатоне дало мне ценный опыт работы с мультиязычными моделями и глубокое понимание нейросетевых архитектур, таких как BERT и LaBSE. Я усовершенствовал свои навыки по векторизации текстов и внедрению моделей в реальных приложениях, что положительно повлияло на мое профессиональное развитие как backend и NLP разработчика.
Расскажите, какие инструменты выбрали для своего решения и для каких задач их применяли?
Мы использовали следующие технологии:
- LaBSE для векторизации новостных сообщений (поддержка английского и русского языков);
- BERT-Classifier для классификации текстов на 29 категорий;
- FastAPI для разработки backend-части;
- React.js для создания удобного и интуитивно понятного интерфейса;
- Docker для контейнеризации и удобного развертывания проекта.
Как распределение ролей в команде помогло довести проект до финала?
В нашей команде была четкая структура:
- Я занимался разработкой моделей для классификации и обработки данных на backend.
- Другие члены команды были ответственны за frontend-разработку и визуализацию данных.
Мы также работали совместно над интеграцией всех частей проекта, что позволило создать комплексное и эффективное решение.
Как вы справились с работой в условиях жестко ограниченного времени?
Мы организовали работу по спринтам, четко распределив задачи и роли. Разделили задачи на небольшие этапы и ежедневно обсуждали прогресс, что помогло быстрее находить решения возникающих проблем — данный подход носит название SCRUM, также используется в современных компаниях.
Что запомнилось больше всего на прошедшем соревновании?
Хакатон оставил отличные впечатления. Это был вызов, но в то же время отличная возможность развить свои навыки, поработать в команде и обменяться опытом с другими профессионалами. Формат мероприятия позволил глубже понять современные вызовы и задачи в области ИИ и машинного обучения. Это дало стимул продолжать развиваться в данной сфере.
Какое напутствие можете дать будущим участникам хакатонов?
Участие в ИТ-соревнованиях — это уникальная возможность для профессионального роста. В ограниченные сроки ты учишься эффективно управлять временем, работать в команде и решать реальные задачи. Хакатоны помогают лучше понять текущие тенденции и технологии, а также находить новые пути решения сложных проблем. Отличный способ испытать свои навыки и выйти за пределы привычных задач. Желаю всем успехов в хакатоне!