• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

«Нейросети могут давать настолько же точные оценки, как и человек»

«Нейросети могут давать настолько же точные оценки, как и человек»

© Высшая школа экономики

Голосовые помощники стали частью обычной жизни. Они могут строить маршрут, включать музыку и фильмы, отвечать на вопросы. Качество речи голосовых ассистентов требует оценки. Для решения этой задачи студенты мастерской по прикладному искусственному интеллекту ИМШ НИУ ВШЭ и VK разработали нейросети, способные оценивать синтез речи.

Никита Шевцов

«Технологии Text-to-Speech превращают текст в речь. Это те самые голоса, которые мы слышим в навигаторах или аудиокнигах. Чтобы понять, насколько хорошо работает синтез, раньше требовалась ручная проверка: люди слушали записи и выставляли оценки. Мы решили автоматизировать этот процесс. Студентам мастерской предстояло создать систему, которая заменит субъективную оценку на нейросетевую модель. Ручная разметка не только дорогая и долгая, но и требует участия множества специалистов», — говорит Никита Шевцов, руководитель проекта мастерской по прикладному искусственному интеллекту ИМШ НИУ ВШЭ и VK.

Студенты мастерской ИМШ и VK использовали открытые англоязычные датасеты SOMOS, содержащие 20 100 аудиофрагментов, 200 TTS-систем, 987 асессоров и более 350 000 оценок.

На их основе были подготовлены и внедрены две метрики: MOS (Mean Opinion Score) — оценка одного аудиофайла от 1 до 5; SBS (Side-by-Side) — сравнение двух аудиофрагментов с выбором лучшего. Также были разработаны пять моделей: для MOS — MOSNet, MOSNetBert, WhisperBert; для SBS — NeuralSBS, NeuralSBSBert. Модели работают как в аудиоформате, так и в мультимодальном формате.

«Мы увидели, что нейросети могут давать настолько же точные оценки, как и человек. MOS-модели показали RMSE ≈ 0,4, что близко к человеческой погрешности 0,62. Модель NeuralSBS определяет лучшее аудио в 73% случаев — на уровне среднего субъективного слушателя. Это открывает путь к ускорению и удешевлению оценки качества TTS», — отметил Никита Шевцов.

Следующий этап — переобучение моделей на русском языке. Команда также рассматривает возможность интеграции оценочных моделей в пайплайны CI/CD, чтобы внедрить автоматическую проверку качества в производственные процессы генерации речи.

«Автоматическая оценка синтеза речи — это шаг к более надежным и масштабируемым TTS-системам. Мы собираемся сделать ее доступной для широкой разработки», — добавил Никита Шевцов.

Вам также может быть интересно:

«Прямое включение в научный процесс»: в магистратуре НИУ ВШЭ будут готовить нейробиологов

Решение об открытии новой магистерской программы «Нейробиология» по направлению подготовки «Биология» принял Ученый совет университета. Ее студенты получат доступ к уникальному оборудованию и станут частью исследовательских групп, смогут работать в научной сфере, в медицине и фармацевтике, IT и нейротехнологиях, а также в области образования и HR-службах.

От климатических рисков до торговых войн: в Вышке состоялась конференция по финансовой экономике

Как меняются инвестиционные решения в условиях инфляционных шоков и применения методов машинного обучения? Можно ли предсказать финансовые риски через новые метрики? Какова роль климатической устойчивости банков и как геополитические потрясения влияют на глобальные цепочки создания стоимости? Эти и другие ключевые темы стали предметом обсуждения на прошедшей недавно 14-й Международной московской конференции по финансовой экономике, организованной Международным институтом экономики и финансов (МИЭФ) ВШЭ.

«Выигрывают те, кто умеет быстро адаптироваться и внедрять инновации»

НИУ ВШЭ запускает образовательную программу «ИИ-лидеры: бизнес-лаборатория для руководителей». Обучение рассчитано на 6 месяцев в очном формате, что позволяет глубоко погрузиться в материал и обменяться опытом с коллегами. Программа стартует в феврале 2026 года.

Ученые НИУ ВШЭ оценили отдачу космических инвестиций: каждый рубль может принести пять

Вложения в космическую отрасль приносят экономике значительную выгоду. Согласно расчетам Института статистических исследований и экономики знаний ВШЭ и «Организации «Агат» госкорпорации «Роскосмос», каждый вложенный в космический проект рубль способен приносить более 5 рублей валовой добавленной стоимости и почти 3 рубля налоговых доходов федерального бюджета. Ученые предложили модель, которая позволяет обосновывать решения о бюджетном финансировании не только с точки зрения отраслевых задач, но и с позиции вклада в макроэкономические показатели и структурное развитие экономики. Статья опубликована в журнале «Экономика космоса».

ВШЭ ищет новые идеи для ИИ-агентов: стартовал конкурс инициатив

Высшая школа экономики приглашает исследователей и преподавателей представить концепции новых цифровых продуктов на базе искусственного интеллекта. Лучшие проекты получат экспертную и технологическую поддержку. Заявки принимаются до 19 декабря.

В Вышке создан Институт робототехнических систем

Решение об этом принял Ученый совет НИУ ВШЭ. У нового института будет мощная фундаментальная база, он будет сотрудничать с другими профильными подразделениями, вовлекать студентов и аспирантов в исследования и разработки. К каким практическим результатам приведет работа института и как планируется организовать взаимодействие с его индустриальным партнером, «Вышке.Главное» рассказал первый проректор НИУ ВШЭ, директор Института статистических исследований и экономики знаний Леонид Гохберг.

Подведены итоги Конкурса инноваций в образовании — 2025

22 ноября в конгресс-холле Альфа-Банка состоялась церемония награждения финалистов, победителей в номинациях и абсолютного победителя Конкурса инноваций в образовании (КИвО-2025). Он проводится 12-й раз, и сегодня это хорошо известный в образовательном сообществе флагманский проект Высшей школы экономики, объединяющий формальное образование, EdTech и частные инициативы.

От импортозамещения к прорыву: как Россия движется к технологическому суверенитету

Доля импорта в затратах на производство и реализацию продукции в России сократилась почти в два раза с 2021 по 2024 год. Об этом свидетельствуют данные исследования НИУ ВШЭ, представленные на круглом столе, посвященном технологическому суверенитету. Эксперты также обсудили, как перейти от импортозамещения в промышленности к прорыву на глобальных рынках. Мероприятие прошло в рамках Дискуссионного экспертного форума НИУ ВШЭ.

Вышка Онлайн представила документальный фильм о влиянии ИИ на нашу жизнь

27 ноября на всех онлайн-площадках Вышки Онлайн состоялась премьера документального фильма «После промпта» от онлайн-кампуса НИУ ВШЭ. Его авторы исследуют, как искусственный интеллект меняет работу, карьерные траектории и профессиональное развитие специалистов. Это первый видеопроект, полностью реализованный командой онлайн-кампуса НИУ ВШЭ совместно с приглашенным режиссером Ольгой Науменко.

«Показать науку через игру»: в Вышке состоялся фестиваль «Республика ученых»

В середине ноября в атриуме корпуса университета на Покровском бульваре при поддержке Центра академического развития студентов прошел Фестиваль науки НИУ ВШЭ «Республика ученых». Событие помогло студентам познакомиться с различными объединениями исследователей Вышки. В этом году в празднике приняли участие Центр научной интеграции и Центр академического письма, а также студенческие организации, которые представили свою деятельность через интерактивные форматы.