
Скоро стартует хакатон Siam ML Hack, который пройдёт с 28 февраля по 19 марта. Это отличная возможность для разработчиков, аналитиков и специалистов в области машинного обучения предложить свои решения для реальных задач нефтесервисной отрасли.
Мы пообщались с экспертом хакатона — Исуповым Сергеем Вадимовичем, начальником отдела автоматизации компании «СИАМ», чтобы узнать, какие вызовы стоят перед участниками, какие перспективы открываются перед победителями и как хакатон может стать стартовой точкой для карьерного роста в инновационной сфере. В интервью Сергей Вадимович поделился инсайтами о технологиях компании, ключевыми задачами мероприятия и том, как участие в хакатоне может изменить профессиональную траекторию.
О компании «СИАМ»
Компания «СИАМ» — одна из ведущих организаций в нефтесервисной отрасли, специализирующаяся на разработке и внедрении передовых технологий для анализа данных, автоматизации процессов и повышения эффективности работы на месторождениях. С 1990 года компания предоставляет комплексные нефтесервисные услуги, включая гидродинамические и геолого-промысловые исследования, химико-аналитические исследования, а также испытания и трассерные исследования скважин.
Томское Научное Производственное и Внедренческое Общество «СИАМ» разрабатывает и производит широкий спектр оборудования для мониторинга работы скважин, которое пользуется высоким спросом среди крупнейших нефтегазовых компаний России. В структуру организации также входит инжиниринговый центр, предоставляющий аналитические услуги и консультации в формате очных курсов и вебинаров.
Компания «СИАМ» — лидер внутреннего рынка по поставке исследовательского оборудования и входит в структуру Группы компаний «Интегра». Узнать больше о компании можно на официальном сайте: www.siamoil.ru.
О компании и технологиях
Компания «СИАМ» работает в нефтесервисе с 1990 года. Как за это время изменились подходы к анализу данных, и какие технологии сейчас наиболее востребованы?
За прошедшие десятилетия методы сбора и анализа данных в нефтесервисе претерпели колоссальные изменения. Если до 1990-х годов на месторождениях использовались в основном механические приборы, которые писали показания на бумагу (по принципу, схожему с кардиограммами в больницах), то анализ таких данных приходилось проводить вручную с помощью линейки, циркуля и других «античных» инструментов. Эти бумажные ленты складывали, обрабатывали и лишь затем делали выводы.
С развитием цифровых технологий появилась возможность сохранять данные в электронном виде, загружать их в базы и автоматизировать часть расчетов. Собственно, с этого этапа начала свою деятельность и наша компания: мы начали разрабатывать приборы, заменяющие устаревшие механические устройства, и предлагать первые программные инструменты для аналитики.
Позднее, по мере роста вычислительных мощностей и увеличения объёмов доступных данных, стали набирать популярность сложные численные методы анализа. Сегодня мы внедряем инструменты на базе искусственного интеллекта, которые фактически развивают идеи прежних аналитических и численных подходов, но работают автономнее и позволяют обрабатывать большие потоки информации без постоянного ручного контроля со стороны инженеров.
Как машинное обучение применяется в гидродинамических исследованиях? С какими типами данных вы работаете?
Мы используем разные архитектуры нейронных сетей: полносвязные (Fully Connected), сверточные (Convolutional) и рекуррентные (Recurrent). Каждая из них решает свои «атомарные» задачи, а затем все вместе объединяются в комплексные системы для выполнения более сложных интеллектуальных инженерных задач.
Основные типы данных, с которыми мы работаем:
- Временные ряды: непрерывные измерения параметров со скважин.
- Графические данные: изображения графиков, которые могут содержать визуальные паттерны.
- Табличная априорная информация: справочные сведения, различные параметры объектов и т.д.
В последнее время мы активно изучаем большие языковые модели (LLM) и разрабатываем на их основе специализированных агентов, которые помогают автоматизировать рутинные задачи в аналитике и обработке данных.
Почему компания выбрала название «СИАМ»? Есть ли за этим интересная история?
«СИАМ» расшифровывается как «Системы Измерений и Автоматизации Месторождений», что напрямую отражает наш основной профиль. Есть и забавный момент: слово «СИАМ» созвучно названию бывшего королевства Сиам (ныне Таиланд). Это скорее языковое совпадение, которое никак не повлияло на выбор названия, однако вдохновило на создание маскота компании — сиамского кота, который стал символом бренда и покорил сердца многих.
Также интересен наш логотип: если его повернуть на 180 градусов, он практически сохраняет читаемость. Сложно сказать, как правильно назвать такой приём. «Палиндромом» в привычном смысле он не является, но зрительная симметрия присутствует и делает логотип достаточно уникальным.
О внутренних процессах компании
Как вы видите развитие машинного обучения в нефтесервисе? Какие задачи в будущем можно будет автоматизировать?
Тренды примерно те же, что и в других отраслях: любая рутинная и не слишком «высокоинтеллектуальная» работа постепенно будет автоматизирована при помощи ИИ. Прежде всего, это сбор, классификация, предобработка данных, а также простейшие интерпретации.
Мы видим, что большие языковые модели (LLM) и интеллектуальные агенты могут найти применение не только в аналитике, но и, например, в диспетчеризации и логистике. При идеальном сценарии люди продолжат решать стратегические и тяжелые научные (rocket science) задачи, а повседневный «оператив» возьмёт на себя искусственный интеллект. Разумеется, путь к этому довольно долгий и трудоёмкий, но те, кто первыми добьются результата, получат значительное конкурентное преимущество.
Как выстраиваются отношения между IT-отделами и другими сотрудниками компании?
У нас налажена дружеская и при этом продуктивная атмосфера. Формальные процессы, такие как сбор требований и фиксация задач, идут через стандартные инструменты — баг-трекеры, таск-трекеры и т.д. Однако мы не ограничиваемся строгими регламентами: если появляется срочная проблема или новое интересное решение, сотрудники могут напрямую взаимодействовать с разработчиками или инженерами.
Часто возникают ситуации, когда кто-то из пользователей просит «быстро поправить» функционал, либо наоборот разработчик просит «протестировать» новую фичу на реальных данных. Иногда такие «пробы пера» вырастают в полноценный продукт. Мы стараемся сохранять баланс между формальной структурой и живым творческим процессом.
О перспективах для участников
Будут ли финальные решения хакатона использоваться в работе компании? Возможно ли дальнейшее сотрудничество с участниками?
Если хакатон принесёт результат, который превосходит наши внутренние наработки, мы немедленно возьмём его в работу. Сейчас мы находимся в фазе активной разработки и можем достаточно быстро интегрировать новое решение в наши продукты, разумеется, после необходимой обкатки и тестирования.
Что касается сотрудничества, то это одна из главных причин, по которым мы решили провести хакатон. Нам нужны специалисты, и если мы увидим сильные команды или отдельных участников, мы будем рады предложить им сотрудничество или даже постоянное место в компании.
Есть ли перспективы для участников в компании? Например, на hh.ru нет вакансий для разработчиков. Планирует ли «СИАМ» привлекать IT-специалистов?
Мы не особо полагаемся на hh.ru, поскольку наш опыт показывает, что найти профильных и мотивированных сотрудников там бывает непросто. Поэтому сейчас пробуем альтернативные способы привлечения специалистов — хакатон является одним из них. Нам действительно нужны IT-кадры, и мы всегда открыты для предложений от потенциально подходящих кандидатов.
Какие навыки нужны IT-специалистам, чтобы работать в нефтесервисной отрасли? Что важно помимо машинного обучения?
Мы ищем инженеров, которые умеют эффективно решать задачи и создавать работоспособные продукты. Формальные «прокачанные» знания — это хорошо, но нам куда важнее практический склад ума и способность доводить проект до результата.
Мы не гонимся за «рок-звёздами» или специалистами, которые жаждут осваивать все новые технологии ради самих технологий. Для нас приоритет — надёжность, инженерное мышление и желание разбираться в специфике нефтесервиса.
Если мы видим, что человек «горит» задачей, умеет держаться и показывать реальные результаты, — это наш потенциальный сотрудник.
Возможна ли удаленная работа для IT-специалистов в вашей компании?
Да, мы давно перешли к распределённой модели: сотрудники отдела разработки сейчас находятся минимум в четырёх разных городах. Удалённая форма работы показала себя эффективной, поэтому мы спокойно относимся к географической разбросанности команды.
О задачах хакатона
Какие реальные бизнес-задачи стоят за треками хакатона? Можно ли сказать, что они приближены к кейсам, с которыми сталкиваются специалисты «СИАМ»?
Задачи хакатона — это не отвлечённые упражнения, а самые настоящие бизнес-кейсы, с которыми наши инженеры сталкиваются в повседневной работе. К примеру, трек по определению бинарных признаков помогает дополнить сложные алгоритмы интерпретации и улучшить точность итоговых моделей.
Другая задача — определение областей полезных данных в непрерывном потоке замеров со скважин. Важно автоматически понимать, какие временные интервалы или сегменты заслуживают дальнейшего анализа, а какие можно отсеять как нерелевантные. Если упростить: первая задача помогает интерпретировать данные, вторая — решает вопрос, какие данные вообще нужно интерпретировать.
Почему были выбраны именно эти треки? Они рассчитаны на инновации, новые решения или привлечение новых сотрудников в компанию?
У нас две цели, связанные с этими задачами:
Улучшение или поиск альтернативных решений:
- Одна из задач у нас уже решена, но мы хотим посмотреть, нет ли более оптимального или «свежего» подхода. Всегда полезно увидеть, как другие специалисты, незашоренные контекстом, подходят к задаче.
- Вторая задача пока не имела готовой реализации внутри компании, поэтому мы надеемся получить либо прототип, либо полноценное решение.
Расширение команды:
- Хакатон — это отличная возможность найти людей, которым интересен наш профиль. У нас очень много идей и проектов, и нам постоянно нужны новые разработчики.
На какой уровень рассчитаны задачи хакатона? Кто является целевой аудиторией мероприятия?
По своей природе это скорее задачи среднего уровня, возможно даже ближе к начальному. Ключевые операции — классификация, регрессия и базовая работа с данными. Однако их актуальность и ценность от этого не становятся меньше: именно такие «типовые» задачи составляют значительную часть реальной практики машинного обучения в нефтесервисе.
О хакатоне и успешных проектах
Что привело к решению провести хакатон? Это ведь первое подобное мероприятие для компании.
Да, это действительно наш первый опыт в проведении подобных мероприятий. Идея пришла после того, как мы начали активно набирать молодежь, у которой был опыт участия в хакатонах. Они рассказали, насколько это эффективный формат для поиска инноваций, прокачки компетенций и нетворкинга.
Мы видим для себя несколько целей:
- Повышение узнаваемости компании в информационном пространстве.
- Получение реальных решений для реальных кейсов.
- Привлечение новых сотрудников — у нас много планов и проектов, и мы хотим найти людей, готовых ими заниматься.
Расскажите о наиболее успешных проектах, которые были реализованы совместно с IT-специалистами в компании «СИАМ». Какие результаты они принесли и как повлияли на развитие компании?
SiamWellTest
Это наш основной продукт для интерпретации гидродинамических и газодинамических исследований. Фактически он замещает собой импортные аналоги и закрывает большинство потребностей в данной области. Мы успешно продвигаем этот продукт на российском рынке (хотя это весьма узкая ниша), и мы активно развиваем его в направлении автоматизации анализа с помощью моделей ИИ.
SiamEngy
Мобильное приложение, ориентированное на более широкую аудиторию — от начинающих нефтяников и студентов до практикующих инженеров. Оно предоставляет справочные данные и функционал, упрощающий повседневную работу. На сегодняшний день им пользуются порядка 15 тысяч человек (на обеих платформах – Android, iOS). Для своей ниши это очень хороший показатель, а само приложение распространяется бесплатно. Мы не нашли на рынке аналогов, сопоставимых с ним по качеству и содержанию.
SiamDataSpectrum
Новый программный комплекс для системного хранения больших массивов данных, поступающих с датчиков. В нефтесервисе такие данные представляют собой непрерывные высокодискретные потоки. Это могут быть терабайты информации в месяц, которые нужно не только хранить, но и уметь быстро индексировать и сегментировать, получать доступ к нужным интервалам «по щелчку». Сейчас продукт находится в стадии бета-тестирования внутри компании, и мы готовим его к выводу на рынок.
Нефтяная отрасль обладает огромным потенциалом для внедрения машинного обучения, что создаёт уникальные возможности для участников соревнования. Хакатон Siam ML Hack — это шанс предложить собственные инновационные решения для реальных задач отрасли. Для победителей мероприятие открывает двери в команду компании «СИАМ», где они смогут работать над передовыми проектами, внося вклад в развитие технологий нефтесервиса и автоматизации процессов.