Made in Russia: дайджест №10 новостей из мира IT, науки, космоса и технологий

В первом юбилейном, десятом выпуске — самые важные достижения российских разработчиков в сфере ИИ-технологий. 

MERA Code — первый открытый бенчмарк для оценки LLM в задачах программирования на русском языке

Альянс в сфере ИИ запустил MERA Code —бенчмарк, созданный специально для оценки качества работы больших языковых моделей (LLM) в прикладных задачах программирования на русском языке. Это первый открытый комплексный стандарт, ориентированный на реальные потребности отечественного IT-рынка.

В разработке приняли участие команды ведущих технологических компаний России: Сбербанка, «Т-Банка», MWS AI (МТС), «Ростелекома», Университета Иннополис, ИТМО, Сколтеха, Центрального университета и компании «Сибирские нейросети».

Современные кодовые языковые модели и модели общего назначения (ChatGPT, Claude, Qwen, YandexGPT, GigaChat и др.) быстро развиваются, но их сравнение затруднено из-за отсутствия единой методологии оценки. Мы предлагаем открытый инструкционный бенчмарк, основанный на фиксированном наборе тестов с чёткими критериями.

Представители Альянса в сфере ИИ

Создатели MERA Code применили единые стандарты, чтобы обеспечить объективность и воспроизводимость результатов:

  • Стандартизированные конфигурации: единые промпты и параметры генерации.
  • Задачи, основанные на реальных сценариях из индустрии.
  • Методология оценки: код проверяется через выполнение в независимых средах, адаптированных под каждый язык программирования.

Как работает бенчмарк:

  • MERA Code предлагает 11 задач, приближённых к реальной практике разработчиков.
  • Форматы: text2code, code2text, code2code.
  • Языки: Python, Java, C#, JavaScript, Go, C, C++ и Scala.
  • Оценка: запуск сгенерированного кода в изолированной среде.
  • Открытая платформа: общедоступный рейтинг, сквозная система баллов и единый фреймворк.

Методика учитывает специфику русскоязычных заданий и документации, что делает MERA Code репрезентативным инструментом для оценки эффективности LLM в русскоязычной среде.

Почему это важно:

  • Впервые появился стандарт для оценки генерации кода на русском языке.
  • Бенчмарк позволяет объективно сравнивать открытые и проприетарные модели.
  • Разработчики получают прозрачный инструмент для выбора лучших моделей под конкретные задачи.
  • Компании могут принимать решения об интеграции ИИ на основе фактической эффективности, а не маркетинговых заявлений.

«Яндекс» подтвердил соответствие международному стандарту ответственной разработки ИИ

«Яндекс» получил международный сертификат ISO/IEC 42001, который подтверждает соответствие процессов разработки YandexGPT требованиям этичности, безопасности и устойчивого управления ИИ.

Яндекс всегда очень бережно подходил ко всему, что связано с искусственным интеллектом. Мы начали выстраивать процессы, которые обеспечивали бы этичность и безопасность ИИ, задолго до публичного анонса YandexGPT. Получение сертификата — ещё одно подтверждение, что мы всё делаем правильно.

Анна Зинчук, руководитель службы комплаенса и обучения информационной безопасности

Аудит подтвердил, что «Яндекс»:

  • обеспечивает безопасность пользовательских данных;
  • мониторит ошибки и аномалии в работе моделей;
  • отслеживает качество и этичность ответов;
  • анализирует обратную связь и ведет документацию;
  • учитывает социальные и этические риски;
  • обучает сотрудников принципам ответственной разработки.

 ISO/IEC 42001:2023 — это международный стандарт для систем менеджмента в организациях, которые разрабатывают или используют решения на основе искусственного интеллекта. Он оценивает не сами ИИ-продукты, а подход к их созданию и внедрению: насколько прозрачно и безопасно действует компания, насколько эффективны её процессы.

Почему это важно:

  • Подтверждено международное соответствие процессов работы с ИИ в крупной российской IT-компании.
  • Опыт «Яндекса» может стать ориентиром для других российских компаний в области ответственного ИИ.
  • Принципы ответственного ИИ «Яндекса» опубликованы в открытом доступе и поддержаны декларацией Альянса в сфере ИИ.

Исследователи T-Bank AI Research научились управлять поведением ИИ без дообучения моделей

На конференции ICML 2025 исследовательская команда T-Bank AI Research представила новый метод интерпретации и управления языковыми моделями — SAE Match с графом потока признаков. Это первый подход, который позволяет не только анализировать, как модель «думает», но и точечно управлять ее поведением без изменения архитектуры и переобучения.

Метод вычисляет наиболее похожие концепты с предыдущих модулей модели

Метод основан на отслеживании того, как смысловые признаки (концепты) формируются, трансформируются и исчезают внутри модели: между слоями и модулями, такими как attention и feedforward. Исследователи впервые сформировали карту движения признаков, которая помогает точно определить, откуда берется тот или иной смысл в ответах ИИ.

Возможности нового метода:

  • Можно отследить, как активируются внутренние знания модели и как они взаимодействуют с контекстом.
  • Точное управление генерацией текста: можно усиливать или подавлять признаки, например, менять тональность или тематику текста.
  • Вмешательство происходит напрямую на уровне активаций без изменения весов модели.
  • Контроль позволяет заранее устранять нежелательные темы в ответах модели.
  • Метод не требует дополнительных данных и работает с уже обученными LLM.

Исследование демонстрирует, что многоуровневое вмешательство (на нескольких слоях) гораздо эффективнее, чем попытки изменить отдельный этап генерации.

Почему это важно: 

  • Подходит для регулирования поведения ИИ в чувствительных сценариях: чат-ботах, голосовых ассистентах и ИИ-сервисах в медицине, образовании, госсекторе.
  • Помогает создавать более надёжные и этичные модели без лишних затрат на переобучение.
  • Даёт разработчикам инструмент для профилактики нежелательных реакций модели до их возникновения.
  • Открывает путь к созданию прозрачных, предсказуемых и безопасных ИИ-систем.

Yandex Research разработал TabM — нейросеть для табличных данных

Исследователи Yandex Research представили новую нейросетевую архитектуру TabM, разработанную специально для работы с табличными данными. Она демонстрирует высокую точность предсказаний при разумных затратах вычислительных ресурсов и может применяться в бизнесе, медицине, науке и промышленности.

Модель представляет собой ансамбль подмоделей, каждая из которых делает собственное предсказание. Итоговый результат формируется на основе усреднения этих прогнозов — за счёт этого достигается стабильность и высокая точность. Архитектура успешно протестирована на платформе Kaggle и превзошла классические алгоритмы градиентного бустинга (CatBoost, XGBoost, LightGBM) по ряду метрик.

Результаты:

  • TabM заняла в среднем 1,7 место на 46 открытых датасетах (против 2,9 у ближайшего конкурента).
  • Продемонстрировала высокую стабильность и универсальность.
  • Применялась для решения медицинских задач, в том числе для прогноза выживаемости пациентов после трансплантации костного мозга.

Архитектура уже доступна разработчикам и исследователям на GitHub, а научная статья — на arXiv

Почему это важно:

  • TabM стабильно превосходит популярные бустинг-модели в табличных задачах.
  • Позволяет использовать глубокое обучение без потерь в интерпретируемости и эффективности.
  • Открытый доступ к коду стимулирует внедрение решений в продуктах и исследованиях.

В России запущен онлайн-сервис для фиксации авторских прав на любые IT-решения и творческие проекты

Создан ЕДРИД — единый депозитарий результатов интеллектуальной деятельности. Это онлайн-сервис, который позволяет авторам юридически закрепить своё авторство на музыку, тексты, дизайн, программный код и другие виды интеллектуального труда. Пользователь получает официальный сертификат депонирования, который можно использовать в суде или при урегулировании споров.

Сегодня мало быть автором — нужно быть автором с доказательством. Если у вас нет официальной фиксации, вы просто один из тысяч в очереди, чье творчество могут использовать без спроса.

Евгений Пен, руководитель онлайн-сервиса ЕДРИД

Сервис подходит как независимым авторам, так и студиям, агентствам, разработчикам ПО и другим специалистам, которые хотят защитить свои произведения от копирования и недобросовестного использования.

Почему это важно:

  • Защита авторских прав — основной инструмент в цифровую эпоху, особенно на фоне развития нейросетей.
  • Единая система фиксации прав снижает юридические риски для независимых авторов и стартапов.
  • Сервис способствует развитию цифрового рынка интеллектуальной собственности в России.

Yandex B2B Tech запускает ИИ-агента для аналитики и визуализации данных

Yandex B2B Tech представил Нейроаналитика — нового ИИ-агента, предназначенного для анализа таблиц и графиков. Инструмент встроен в BI-сервис Yandex DataLens и работает в формате чата. С его помощью пользователи могут находить инсайты, корректировать формулы и создавать визуализации с помощью запросов на естественном языке.

Платформа уже используется внутри Яндекса: за первые две недели ИИ-агента протестировали более 4 тысяч сотрудников. Например, Яндекс Еда применяет его для анализа воронки регистрации курьеров и конверсий, а Yandex Cloud — для подготовки аналитических отчётов.

 Мы видим будущее нашей BI-платформы в развитии новых функций на базе искусственного интеллекта. С ними аналитика становится ещё более доступной для различных ролей в компаниях. Важно, чтобы менеджеры и специалисты по продажам могли самостоятельно работать с данными — так они смогут быстрее реагировать на изменения рынка и принимать оптимальные бизнес-решения.

Иван Пузыревский, технический директор платформы Yandex Cloud

Первая внешняя версия станет доступна в сентябре 2025 года — компании уже могут записаться в лист ожидания

Почему это важно:

  • Автоматизация анализа и визуализации снижает нагрузку на аналитиков и ускоряет проверку гипотез — в среднем на 30%.
  • BI-инструменты с ИИ становятся доступными для сотрудников без технического бэкграунда.
  • Новый агент — часть экосистемы Yandex Cloud, ориентированной на корпоративных пользователей и развитие корпоративного ИИ.

Сбербанк пригласил на работу 20 золотых медалистов олимпиады «Я — профессионал»

Сбербанк вручил офферы на трудоустройство 20 победителям Всероссийской студенческой олимпиады «Я — профессионал». Все приглашённые — золотые медалисты, показавшие лучшие результаты в ключевых для банка направлениях: математике, моделировании, IT, кибербезопасности, экономике и управлении цифровыми продуктами.

Офферы действительны в течение пяти лет, и выпускники могут присоединиться к Сберу в любой удобный момент. Среди приглашённых — студенты и выпускники МФТИ, ИТМО, ВШЭ, СПбГУ, МАИ, ДГТУ, СПбПУ и МГТУ им. Баумана.

Когда узнал, что представитель «Сбера» находится на площадке, хотел попросить у него оффер. Но через три минуты его и так дали! А я сейчас как раз ищу работу в связи с переездом в Санкт-Петербург, поскольку поступаю в магистратуру. И я изначально рассматривал «Сбер» как одного из наиболее интересных работодателей. Невероятное совпадение! В «Сбере» хочу работать в робототехнике.

Дмитрий Савинов, золотой медалист олимпиады «Я — профессионал»

Проект реализуется в рамках президентской платформы «Россия — страна возможностей» и поддерживается Сбербанком с 2017 года. За это время более 2 500 участников прошли стажировку в банке, а 1 200 победителей и призёров уже стали его сотрудниками.

Олимпиада «Я — профессионал» уже восьмой год успешно объединяет лучшие образовательные организации и бизнес-сообщество. В VIII сезоне партнерами олимпиады стали более 700 компаний, среди них и те, что поддержали сразу несколько дисциплин: Росатом, Сбер, Трубная Металлургическая Компания, ВТБ, Газпромбанк и Альфа-Банк.

Александр Шохин, Президент Российского союза промышленников и предпринимателей, заместитель главы Совета Ассоциации организаторов студенческих олимпиад «Я — профессионал»

Почему это важно:

  • Победители олимпиад получают возможность начать карьеру без дополнительных отборов.
  • Система подготовки кадров в ИТ и науке получает поддержку крупнейших работодателей.
  • Интеграция образования и бизнеса ускоряет внедрение новых технологий.

Подписывайся на наш Telegram-канал — там мы рассказываем о главных достижениях России в IT, науке, космосе и инженерии. Если у тебя есть интересные новости о российских технологиях, присылай их на support@codenrock.com


    Оставьте заявку, мы подберем для вас лучшие решения для работы с ИТ-сообществом

    Будьте в курсе лучших кейсов хакатонов, ML-турниров, CTF и соревнований по спортивному программированию на Codenrock
    Добавить комментарий