Made in Russia: дайджест №16 новостей из мира IT, науки, космоса и технологий

В свежем выпуске Made in Russia — разработки, которые усиливают цифровую независимость России: от датасетов мирового уровня и новых инструментов в облаке до решений для авиации, микроэлектроники и криптоиндустрии.

«Т-Технологии» выложили крупнейший кросс-доменный датасет для рекомендательных систем

Центр искусственного интеллекта группы «Т-Технологии» опубликовал в открытом доступе T-ECD — один из крупнейших в мире датасетов для развития рекомендательных систем в e-commerce. Он собран на основе анонимизированных данных 44 миллионов пользователей сервисов «Город» и рекламной платформы «Т-Банка» и включает 30 миллионов товаров и более 135 миллиардов взаимодействий.

Датасет T-ECD состоит из пяти взаимосвязанных источников:

  • история транзакций и чеков;
  • отзывы;
  • взаимодействия с FMCG и non-FMCG товарами;
  • активации и использование спецпредложений;
  • данные о показах рекомендаций (включая источник — поиск, каталог или рекомендации).

 Мы с командой считаем важным вносить вклад в развитие открытых датасетов и моделей для дальнейшего развития рекомендательных систем. Датасет T-ECD может стать одним из новых бенчмарков и принести ценность ML-сообществу для улучшения качества персонализации и клиентского опыта реальных пользователей. Похожий набор данных используется для развития наших внутренних продуктов и сервисов.

Марина Ананьева, руководитель направления рекомендательных систем в «Т-Банке»

Набор охватывает глубину данных от 1 года до 3,5 лет, включая явную (лайки, покупки) и неявную (просмотры) обратную связь, что позволяет строить профили пользователей и анализировать динамику их поведения. Такой подход делает T-ECD универсальным инструментом для тестирования моделей. Он подходит для задач от классической коллаборативной фильтрации до графовых и контекстных методов глубокого обучения.

Датасет доступен на Hugging Face под лицензией Apache 2.0, допускающей свободное использование и модификацию в коммерческих проектах.

Почему это важно:

  • T-ECD решает ключевую проблему: большинство открытых датасетов устарели и не отражают современное поведение пользователей.
  • Наличие данных о «показах без реакции» повышает точность моделирования и приближает эксперименты к реальным сценариям.
  • Датасет может стать новым бенчмарком для ML-сообщества и ускорить развитие персонализации в рекомендательных системах.

В Yandex Cloud AI Studio стало возможным создание ИИ-агентов для бизнеса без написания кода

Yandex Cloud AI Studio добавила возможность создавать ИИ-агентов без навыков программирования. Теперь компании могут собирать собственные решения для автоматизации задач для составления квартальных отчётов, проверки комплаенс-рисков, обслуживания клиентов в контакт-центрах и других целей.

Как это работает:

  • Поддерживаются текстовые и голосовые агенты.
  • Среди доступных моделей: YandexGPT 5, Llama 3.3, GPT-oss и Qwen3, которые могут искать данные в интернете, текстах, таблицах и изображениях через AI Search.
  • Доступна интеграция с партнёрскими сервисами Yandex Cloud по MCP-протоколу: уже подключены amoCRM и «Контур.Фокус», список расширят.
  • Можно создавать мультиагентные системы: например, один агент анализирует спрос, другой параллельно планирует закупки.

Пользователи также получили обновленную платформу командной разработки SourceCraft с улучшенной навигацией по коду, глубокой интеграцией с облачной экосистемой и ИИ-помощником SourceCraft Code Assistant, который подсказывает оптимальные правки. Кроме того, появились ИИ-ассистенты для работы с сервисами Yandex Cloud: они помогают подбирать решения, развертывать инфраструктуру или выполнять задачи по запросу пользователя.

Российские компании тратят на функции техподдержки, юридической службы, бухгалтерии и HR более 3 трлн рублей в год, при этом в некоторых сферах сотрудников по‑прежнему не хватает. ИИ‑агенты помогут работникам быть продуктивнее и сэкономить время на решение рутинных задач.

Артур Самигуллин, руководитель продуктового направления ML Yandex Cloud

Почему это важно:

  • Снижается порог входа в использование ИИ для бизнеса: агенты создаются без программирования.
  • Мультиагентные системы позволяют автоматизировать комплексные бизнес-процессы.
  • Интеграция с CRM-система обеспечивает готовые бизнес-кейсы.
  • Обновления SourceCraft и появление ассистентов упрощают работу команд и ускоряют внедрение ИИ-решений.

В МАИ протестировали новую операционную систему JetOS для российских самолётов

В Московском авиационном институте завершено тестирование новой отечественной операционной системы реального времени JetOS, которая будет использоваться в кабинах гражданских самолётов МС-21 и SJ-100. Система отвечает самому высокому уровню критичности А, применяемому в авиационном софте.

Разработала программу и методику тестирования JetOS выпускница МАИ и специалист ФАУ «ГосНИИАС» Ольга Ступак. Её дипломная работа включала создание единой инструкции для подготовки и проведения тестов и программу с удобным графическим интерфейсом. 

Предложенная мной программа минимизирует вероятность возникновения ошибок в системе, вызванных некорректно указанными тестовыми сценариями.

Ольга Ступак, разработчик проекта, специалист ГосНИИАС

JetOS будет установлена в многофункциональные индикаторы: крупные дисплеи в кабине пилота, отображающие скорость, высоту, карты и другие важные параметры. Особенность разработки в том, что она создаётся с учётом жёстких требований к безопасности и точности работы.

Почему это важно:

  • JetOS — первая операционная система для современных российских гражданских самолётов, созданная с уровнем критичности А.
  • Система будет управлять ключевыми индикаторами в кабине пилотов МС-21 и SJ-100.
  • Новая методика тестирования снижает вероятность ошибок и упрощает работу разработчиков.
  • Проект усиливает технологическую независимость и безопасность отечественной авиации.

В НовГУ создали ИИ-софт для выявления дефектов микросхем

В Новгородском университете разработали программное обеспечение на базе нейросетей для автоматического распознавания внешних дефектов монолитных интегральных схем (МИС). Решение позволит ускорить процесс контроля качества изделий и увеличить объёмы выпускаемой микроэлектроники.

Дефекты МИС — царапины, следы грязи, пыли или смазанная металлизация — зачастую видны только под микроскопом. При этом на одной полупроводниковой пластине может находиться сотни микросхем, и ручная проверка каждой из них делает процесс дорогостоящим и замедляет производство. 

Благодаря нашей разработке частично автоматизируется монотонный и времязатратный процесс отбраковки. Это позволяет нарастить объём выпускаемой продукции и перераспределить труд квалифицированных специалистов на другие более важные задачи.

Владислав Рысев, автор проекта, ассистент кафедры радиосистем НовГУ 

Алгоритм работает в два этапа: первая модель фиксирует наличие дефекта, а вторая сверяет его по базе и формирует аналитический отчёт. На его основе оператор принимает решение о пригодности изделия. По словам автора проекта Владислава Рысева, прямых аналогов такого решения для микроэлектроники сегодня нет, хотя схожие системы используются в металлургии, нефтехимии и других отраслях.

Программа имеет ещё одно преимущество — её можно адаптировать под конкретное производство без глубоких знаний в программировании: софт легко дообучить или переобучить. Уже создана бета-версия, которая будет протестирована на одном из заводов региона. В дальнейшем команда планирует расширить функционал, добавив возможность обнаружения не только внешних, но и внутренних дефектов.

Почему это важно:

  • Первое российское решение для автоматической детекции внешних дефектов микросхем.
  • Программа снижает затраты на контроль качества и ускоряет выпуск изделий.
  • Софт легко адаптируется к задачам разных производств без сложного программирования.
  • В будущем система позволит анализировать и внутренние дефекты, упрощая контроль качества микроэлектроники.

В МФТИ создали алгоритм для защиты криптопроектов от мошенников

В Московском физико-техническом институте разработан алгоритм на базе машинного обучения, который выявляет сети поддельных аккаунтов в криптовалютных экосистемах. Технология протестирована на 2,5 миллионах кошельков и показала точность 90% — это вдвое выше существующих решений. Алгоритм уже помог предотвратить несправедливое распределение токенов на $10,2 миллионов в одном из крупнейших блокчейн-проектов.

Алексей Саплин, автор проекта, выпускник кафедры блокчейн МФТИ

Что делает алгоритм:

  • Анализирует десятки параметров: поведение кошельков, кросс-чейн-активность, сетевые связи.
  • Учитывает время жизни кошельков, объемы транзакций и характер взаимодействия с протоколами.
  • Находит скрытые связи через общие источники пополнений и выводов средств.
  • Способен обработать миллионы кошельков всего за несколько дней.

Решение принципиально отличается от существующих подходов: оно использует машинное обучение для кластеризации данных, находя неочевидные шаблоны и связи. Алгоритм способен обрабатывать миллионы кошельков всего за несколько дней. В перспективе разработка может применяться для защиты любых криптопроектов и airdrop-программ.

Почему это важно:

  • Точность работы в 90% в два раза превышает существующие решения.
  • Позволяет защищать криптопроекты от масштабных мошеннических схем.
  • Анализирует не только транзакции, но и скрытые связи между кошельками.
  • Может стать универсальным инструментом для защиты экосистем Web3.

Подписывайся на наш Telegram-канал — там мы рассказываем о главных достижениях России в IT, науке, космосе и инженерии. Если у тебя есть интересные новости о российских технологиях, присылай их на support@codenrock.com


    Оставьте заявку, мы подберем для вас лучшие решения для работы с ИТ-сообществом

    Будьте в курсе лучших кейсов хакатонов, ML-турниров, CTF и соревнований по спортивному программированию на Codenrock
    Добавить комментарий