«Нужно знать много идей и алгоритмов, придумывать что-то нестандартное»
Студент ФКН Вышки Андрей Кузнецов стал победителем Data Fusion Contest 2024. Он занял первое место по решению задач по теме «Геоаналитика» и выиграл в специальной номинации Companion. Соревнование прошло в рамках конференции в области больших данных и ИИ-технологий Data Fusion 2024. Исследователи НИУ ВШЭ на конференции представили результаты своих работ и прикладные разработки.
В рамках конференции также прошло соревнование Data Fusion Contest 2024, на которое зарегистрировалось свыше 1550 участников из 33 стран, включая Россию, Армению, Великобританию, Казахстан, Нидерланды и США. В турнире принимали участие как продвинутые ИТ-специалисты, так и те, кто интересуется Data Science и только начинает свой профессиональный путь.
Первое место по задаче «Геоаналитика» занял студент второго курса образовательной программы «Прикладная математика и информатика» факультета компьютерных наук Андрей Кузнецов. Он также победил в специальной номинации Companion за лучшие открытые решения по каждой из задач, опубликованные участниками до завершения испытаний.
Андрей Кузнецов, студент второго курса бакалавриата «Прикладная математика и информатика»
«Во время соревнования параллельно с выполнением задания приходится просматривать материалы по тематике, необходимую литературу, а также существующие подходы и методы. На олимпиаде было две задачи — “Геоаналитика” и “Модели оттока”. В первой известна информация о карточных транзакциях клиентов, нужно предсказать вероятность снятия наличных в том или ином банкомате. Во второй требуется, используя банковские данные за 6 месяцев, спрогнозировать вероятность снижения пользовательской активности в следующие 6 месяцев.
Контесты по машинному обучению обычно проходят продолжительное время. На выполнение заданий было дано почти два месяца. Для достижения высоких результатов необходимо анализировать решения прошедших конкурсов, а также тратить много времени на тренировки, практику и изучение нового материала. Нужно знать много идей и алгоритмов, придумывать что-то нестандартное.
По сравнению с прошлыми годами и многими другими соревнованиями в целом, в этот раз задачи были сложнее. Конкурс проходил на удобной и стабильной платформе. Была большая конкуренция, много опытных специалистов принимало участие. Поэтому радость от победы еще сильнее!»
Ученые Высшей школы экономики приняли активное участие в работе Data Fusion 2024. Научный руководитель Центра ИИ НИУ ВШЭ Алексей Наумов на сессии «Обзор ключевых исследований в области ИИ в России» представил передовые направления исследований и достижения ученых Вышки. «Одним из наших последних достижений стала статья, попавшая в 5% лучших на международной конференции AISTATS 2024. Мы доказали, что обучение генеративных потоковых сетей (GFlowNets) эквивалентно некоторой регуляризованной задаче обучения с подкреплением. Это открытие позволит напрямую применять большое количество существующих техник и алгоритмов обучения с подкреплением для улучшения работы генеративных потоковых сетей», — рассказал он.
В этом году уже 8 публикаций от Центра ИИ приняты на топовые конференции, такие как ICML, NeurIPS, ICLR, AISTATS и др. Исследователи работают и над диффузионными моделями, которые позволяют генерировать сложные структуры белков и молекул, а также данные, которые лежат на ограниченных многообразиях.
Центр ИИ также представил прикладные разработки в интересах индустриальных партнеров. Например, специализированная NLP-модель, разработанная для Сбера, генерирует удобочитаемое описание причин обращений клиентов для улучшения интерпретируемости тематик, полученных из кластеризации потока обращений клиентов. Решение позволяет банку ускорить обработку более 300 тысяч обращений клиентов в день.
В работе Data Fusion 2024 приняли участие и другие представители ВШЭ. Руководитель департамента анализа данных и искусственного интеллекта ФКН Сергей Кузнецов выступил модератором кейс-сессии «Есть ли будущее у символьного ИИ или нейронные сети все победят?», на которой обсуждались перспективы символьного ИИ в свете задач по созданию доверенного искусственного интеллекта. Доцент департамента анализа данных и искусственного интеллекта ФКН Алексей Незнанов на этой сессии выступил с докладом на тему «Управление знаниями и гибридные интеллектуальные системы в корпоративном окружении, 20 лет спустя».
Сергей Кузнецов также принял участие в сессии «Прогресс или регресс: куда ведет нас искусственный интеллект — эксперты о трендах» и провел беседу с президентом Индийского статистического института Санкаром Кумаром Палом на тему «Опыт Индии: развитие ИИ-технологий и DS-науки».
Директор Центра языка и мозга Ольга Драгой приняла участие в пленарной дискуссии «Интеллект больших генеративных моделей — возможно ли рождение мышления из языка». Эксперты обсуждали вопросы возможности извлечения интеллекта из речи, поиска основы для развития ИИ, формирования среды, в которой будет развиваться ИИ.
Ученые НИУ ВШЭ также представили результаты своих исследований на постерной сессии:
Константин Вишневский, директор Центра стратегической аналитики и больших данных ИСИЭЗ, и Мария Сварчевская, ведущий эксперт ИСИЭЗ, тема: «Система интеллектуального анализа больших данных iFORA»;
Александр Кирдеев, стажер-исследователь Международной лаборатории биоинформатики Института искусственного интеллекта и цифровых наук, тема: «Прогностические модели в персонализированной медицине»;
Мария Сакиркина, главный аналитик факультета географии и геоинформационных технологий, тема: «Геоаналитика и геоданные: оценка природно-климатических рисков».
Конференция Data Fusion 2024 прошла в Москве 17–18 апреля. В ее работе приняли участие председатель правительства РФ Михаил Мишустин, вице-премьер Дмитрий Чернышенко, первый заместитель председателя Банка России Ольга Скоробогатова, президент — председатель правления банка ВТБ Андрей Костин, президент компании «Ростелеком» Михаил Осеевский, генеральный директор VK Владимир Кириенко, другие представители бизнеса и государства, ведущие ученые и эксперты в области анализа больших данных и технологий искусственного интеллекта.