Made in Russia: дайджест №10 новостей из мира IT, науки, космоса и технологий

Коротко

Альянс в сфере ИИ запустил MERA Code — первый открытый бенчмарк оценки LLM в программировании на русском: 11 задач, 8 языков.
Яндекс получил сертификат ISO/IEC 42001 за ответственную разработку ИИ-процессов вокруг YandexGPT.
T-Bank AI Research на ICML 2025 показал метод SAE Match — управление поведением LLM без дообучения и смены весов.
Yandex Research представил TabM — новую нейросетевую архитектуру для табличных данных.

Made in Russia: дайджест №10 новостей из мира IT, науки, космоса и технологий

В первом юбилейном, десятом выпуске — самые важные достижения российских разработчиков в сфере ИИ-технологий.

Содержание

MERA Code — первый открытый бенчмарк для оценки LLM в задачах программирования на русском языке
«Яндекс» подтвердил соответствие международному стандарту ответственной разработки ИИ
Исследователи T-Bank AI Research научились управлять поведением ИИ без дообучения моделей
Yandex Research разработал TabM — нейросеть для табличных данных
В России запущен онлайн-сервис для фиксации авторских прав на любые IT-решения и творческие проекты
Yandex B2B Tech запускает ИИ-агента для аналитики и визуализации данных
Сбербанк пригласил на работу 20 золотых медалистов олимпиады «Я — профессионал»

MERA Code — первый открытый бенчмарк для оценки LLM в задачах программирования на русском языке

Альянс в сфере ИИ запустил MERA Code —бенчмарк, созданный специально для оценки качества работы больших языковых моделей (LLM) в прикладных задачах программирования на русском языке. Это первый открытый комплексный стандарт, ориентированный на реальные потребности отечественного IT-рынка.

В разработке приняли участие команды ведущих технологических компаний России: Сбербанка, «Т-Банка», MWS AI (МТС), «Ростелекома», Университета Иннополис, ИТМО, Сколтеха, Центрального университета и компании «Сибирские нейросети».

Современные кодовые языковые модели и модели общего назначения (ChatGPT, Claude, Qwen, YandexGPT, GigaChat и др.) быстро развиваются, но их сравнение затруднено из-за отсутствия единой методологии оценки. Мы предлагаем открытый инструкционный бенчмарк, основанный на фиксированном наборе тестов с чёткими критериями.
Представители Альянса в сфере ИИ

Создатели MERA Code применили единые стандарты, чтобы обеспечить объективность и воспроизводимость результатов:

Стандартизированные конфигурации: единые промпты и параметры генерации.
Задачи, основанные на реальных сценариях из индустрии.
Методология оценки: код проверяется через выполнение в независимых средах, адаптированных под каждый язык программирования.

Как работает бенчмарк:

MERA Code предлагает 11 задач, приближённых к реальной практике разработчиков.
Форматы: text2code, code2text, code2code.
Языки: Python, Java, C#, JavaScript, Go, C, C++ и Scala.
Оценка: запуск сгенерированного кода в изолированной среде.
Открытая платформа: общедоступный рейтинг, сквозная система баллов и единый фреймворк.

Методика учитывает специфику русскоязычных заданий и документации, что делает MERA Code репрезентативным инструментом для оценки эффективности LLM в русскоязычной среде.

Почему это важно:

Впервые появился стандарт для оценки генерации кода на русском языке.
Бенчмарк позволяет объективно сравнивать открытые и проприетарные модели.
Разработчики получают прозрачный инструмент для выбора лучших моделей под конкретные задачи.
Компании могут принимать решения об интеграции ИИ на основе фактической эффективности, а не маркетинговых заявлений.

«Яндекс» подтвердил соответствие международному стандарту ответственной разработки ИИ

«Яндекс» получил международный сертификат ISO/IEC 42001, который подтверждает соответствие процессов разработки YandexGPT требованиям этичности, безопасности и устойчивого управления ИИ.

Яндекс всегда очень бережно подходил ко всему, что связано с искусственным интеллектом. Мы начали выстраивать процессы, которые обеспечивали бы этичность и безопасность ИИ, задолго до публичного анонса YandexGPT. Получение сертификата — ещё одно подтверждение, что мы всё делаем правильно.
Анна Зинчук, руководитель службы комплаенса и обучения информационной безопасности

Аудит подтвердил, что «Яндекс»:

обеспечивает безопасность пользовательских данных;
мониторит ошибки и аномалии в работе моделей;
отслеживает качество и этичность ответов;
анализирует обратную связь и ведет документацию;
учитывает социальные и этические риски;
обучает сотрудников принципам ответственной разработки.

ISO/IEC 42001:2023 — это международный стандарт для систем менеджмента в организациях, которые разрабатывают или используют решения на основе искусственного интеллекта. Он оценивает не сами ИИ-продукты, а подход к их созданию и внедрению: насколько прозрачно и безопасно действует компания, насколько эффективны её процессы.

Почему это важно:

Подтверждено международное соответствие процессов работы с ИИ в крупной российской IT-компании.
Опыт «Яндекса» может стать ориентиром для других российских компаний в области ответственного ИИ.
Принципы ответственного ИИ «Яндекса» опубликованы в открытом доступе и поддержаны декларацией Альянса в сфере ИИ.

Исследователи T-Bank AI Research научились управлять поведением ИИ без дообучения моделей

На конференции ICML 2025 исследовательская команда T-Bank AI Research представила новый метод интерпретации и управления языковыми моделями — SAE Match с графом потока признаков. Это первый подход, который позволяет не только анализировать, как модель «думает», но и точечно управлять ее поведением без изменения архитектуры и переобучения.

Метод основан на отслеживании того, как смысловые признаки (концепты) формируются, трансформируются и исчезают внутри модели: между слоями и модулями, такими как attention и feedforward. Исследователи впервые сформировали карту движения признаков, которая помогает точно определить, откуда берется тот или иной смысл в ответах ИИ.

Возможности нового метода:

Можно отследить, как активируются внутренние знания модели и как они взаимодействуют с контекстом.
Точное управление генерацией текста: можно усиливать или подавлять признаки, например, менять тональность или тематику текста.
Вмешательство происходит напрямую на уровне активаций без изменения весов модели.
Контроль позволяет заранее устранять нежелательные темы в ответах модели.
Метод не требует дополнительных данных и работает с уже обученными LLM.

Исследование демонстрирует, что многоуровневое вмешательство (на нескольких слоях) гораздо эффективнее, чем попытки изменить отдельный этап генерации.

Почему это важно:

Подходит для регулирования поведения ИИ в чувствительных сценариях: чат-ботах, голосовых ассистентах и ИИ-сервисах в медицине, образовании, госсекторе.
Помогает создавать более надёжные и этичные модели без лишних затрат на переобучение.
Даёт разработчикам инструмент для профилактики нежелательных реакций модели до их возникновения.
Открывает путь к созданию прозрачных, предсказуемых и безопасных ИИ-систем.

Yandex Research разработал TabM — нейросеть для табличных данных

Исследователи Yandex Research представили новую нейросетевую архитектуру TabM, разработанную специально для работы с табличными данными. Она демонстрирует высокую точность предсказаний при разумных затратах вычислительных ресурсов и может применяться в бизнесе, медицине, науке и промышленности.

Модель представляет собой ансамбль подмоделей, каждая из которых делает собственное предсказание. Итоговый результат формируется на основе усреднения этих прогнозов — за счёт этого достигается стабильность и высокая точность. Архитектура успешно протестирована на платформе Kaggle и превзошла классические алгоритмы градиентного бустинга (CatBoost, XGBoost, LightGBM) по ряду метрик.

Результаты:

TabM заняла в среднем 1,7 место на 46 открытых датасетах (против 2,9 у ближайшего конкурента).
Продемонстрировала высокую стабильность и универсальность.
Применялась для решения медицинских задач, в том числе для прогноза выживаемости пациентов после трансплантации костного мозга.

Архитектура уже доступна разработчикам и исследователям на GitHub, а научная статья — на arXiv.

Почему это важно:

TabM стабильно превосходит популярные бустинг-модели в табличных задачах.
Позволяет использовать глубокое обучение без потерь в интерпретируемости и эффективности.
Открытый доступ к коду стимулирует внедрение решений в продуктах и исследованиях.

В России запущен онлайн-сервис для фиксации авторских прав на любые IT-решения и творческие проекты

Создан ЕДРИД — единый депозитарий результатов интеллектуальной деятельности. Это онлайн-сервис, который позволяет авторам юридически закрепить своё авторство на музыку, тексты, дизайн, программный код и другие виды интеллектуального труда. Пользователь получает официальный сертификат депонирования, который можно использовать в суде или при урегулировании споров.

Сегодня мало быть автором — нужно быть автором с доказательством. Если у вас нет официальной фиксации, вы просто один из тысяч в очереди, чье творчество могут использовать без спроса.
Евгений Пен, руководитель онлайн-сервиса ЕДРИД

Сервис подходит как независимым авторам, так и студиям, агентствам, разработчикам ПО и другим специалистам, которые хотят защитить свои произведения от копирования и недобросовестного использования.

Почему это важно:

Защита авторских прав — основной инструмент в цифровую эпоху, особенно на фоне развития нейросетей.
Единая система фиксации прав снижает юридические риски для независимых авторов и стартапов.
Сервис способствует развитию цифрового рынка интеллектуальной собственности в России.

Yandex B2B Tech запускает ИИ-агента для аналитики и визуализации данных

Yandex B2B Tech представил Нейроаналитика — нового ИИ-агента, предназначенного для анализа таблиц и графиков. Инструмент встроен в BI-сервис Yandex DataLens и работает в формате чата. С его помощью пользователи могут находить инсайты, корректировать формулы и создавать визуализации с помощью запросов на естественном языке.

Платформа уже используется внутри Яндекса: за первые две недели ИИ-агента протестировали более 4 тысяч сотрудников. Например, Яндекс Еда применяет его для анализа воронки регистрации курьеров и конверсий, а Yandex Cloud — для подготовки аналитических отчётов.

Мы видим будущее нашей BI-платформы в развитии новых функций на базе искусственного интеллекта. С ними аналитика становится ещё более доступной для различных ролей в компаниях. Важно, чтобы менеджеры и специалисты по продажам могли самостоятельно работать с данными — так они смогут быстрее реагировать на изменения рынка и принимать оптимальные бизнес-решения.
Иван Пузыревский, технический директор платформы Yandex Cloud

Первая внешняя версия станет доступна в сентябре 2025 года — компании уже могут записаться в лист ожидания.

Почему это важно:

Автоматизация анализа и визуализации снижает нагрузку на аналитиков и ускоряет проверку гипотез — в среднем на 30%.
BI-инструменты с ИИ становятся доступными для сотрудников без технического бэкграунда.
Новый агент — часть экосистемы Yandex Cloud, ориентированной на корпоративных пользователей и развитие корпоративного ИИ.

Сбербанк пригласил на работу 20 золотых медалистов олимпиады «Я — профессионал»

Сбербанк вручил офферы на трудоустройство 20 победителям Всероссийской студенческой олимпиады «Я — профессионал». Все приглашённые — золотые медалисты, показавшие лучшие результаты в ключевых для банка направлениях: математике, моделировании, IT, кибербезопасности, экономике и управлении цифровыми продуктами.

Офферы действительны в течение пяти лет, и выпускники могут присоединиться к Сберу в любой удобный момент. Среди приглашённых — студенты и выпускники МФТИ, ИТМО, ВШЭ, СПбГУ, МАИ, ДГТУ, СПбПУ и МГТУ им. Баумана.

Когда узнал, что представитель «Сбера» находится на площадке, хотел попросить у него оффер. Но через три минуты его и так дали! А я сейчас как раз ищу работу в связи с переездом в Санкт-Петербург, поскольку поступаю в магистратуру. И я изначально рассматривал «Сбер» как одного из наиболее интересных работодателей. Невероятное совпадение! В «Сбере» хочу работать в робототехнике.
Дмитрий Савинов, золотой медалист олимпиады «Я — профессионал»

Проект реализуется в рамках президентской платформы «Россия — страна возможностей» и поддерживается Сбербанком с 2017 года. За это время более 2 500 участников прошли стажировку в банке, а 1 200 победителей и призёров уже стали его сотрудниками.

Олимпиада «Я — профессионал» уже восьмой год успешно объединяет лучшие образовательные организации и бизнес-сообщество. В VIII сезоне партнерами олимпиады стали более 700 компаний, среди них и те, что поддержали сразу несколько дисциплин: Росатом, Сбер, Трубная Металлургическая Компания, ВТБ, Газпромбанк и Альфа-Банк.
Александр Шохин, Президент Российского союза промышленников и предпринимателей, заместитель главы Совета Ассоциации организаторов студенческих олимпиад «Я — профессионал»

Почему это важно:

Победители олимпиад получают возможность начать карьеру без дополнительных отборов.
Система подготовки кадров в ИТ и науке получает поддержку крупнейших работодателей.
Интеграция образования и бизнеса ускоряет внедрение новых технологий.

Подписывайся на наш Telegram-канал — там мы рассказываем о главных достижениях России в IT, науке, космосе и инженерии. Если у тебя есть интересные новости о российских технологиях, присылай их на support@codenrock.com.