«VK Видео» значительно улучшила доступность контента: видео с субтитрами увеличены в 10 раз и улучшена точность обработки речи

Специалисты видеоплатформы «VK Видео» увеличили количество видео с субтитрами в десять раз и значительно улучшили точность автоматической расшифровки речи на своей платформе.

Представители VK отметили, что благодаря этим изменениям, просмотр видео стал более комфортным. Теперь речь говорящих преобразуется в текстовые субтитры, оформленные в виде предложений с правильными знаками препинания и заглавными буквами, с учётом характеристик разговорной речи, специализированной лексики и неологизмов. Данная технология применяется как для профессионального контента, так и для пользовательских видео. В VK уверены, что это новшество будет особенно полезно для людей с нарушениями слуха и в ситуациях, когда включение звука нежелательно.

«В ленте пользователя на главном экране 80% видео будут снабжены новыми субтитрами. Автоматические субтитры в VK Видео создаются с помощью ML-моделей. Аудиоданные из видео проходят через несколько этапов обработки. Сначала нейросеть устраняет фоновый шум, выделяет речь и переводит её в текст, а затем другие модели обрабатывают расшифровку. На заключительном этапе AI синхронизирует текст с аудиотреком. AI-модель позволяет допускать на 30% меньше ошибок, чем аналогичные решения для генерации субтитров в других сервисах», — пояснили в VK.

Ранее сервис «VK Видео» представил функцию «Картинка в картинке» для веб-версии, которая даёт возможность пользователям смотреть видео в мини-плеере, не отвлекаясь от других задач. В настройках плеера добавлена опция, позволяющая активировать режим просмотра видео в отдельном окне. Мини-плеер может быть размещён как поверх открытого браузера, так и поверх других окон на рабочем столе.

В декабре 2024 года VK запустила обновлённую веб-версию платформы «VK Видео» на отдельном домене vkvideo.ru. В VK сообщили Хабру, что пользователи теперь могут входить на страницу видеосервиса напрямую через адресную строку браузера, что упрощает поиск фильмов, трансляций, шоу и авторского контента.