Социальная сеть ВКонтакте реализовала технологию машинной расшифровки голосовых сообщений, которые отправляют друг другу пользователи. Это избавит от необходимости прослушивать их, что удобно далеко не в каждой ситуации.
Социальная сеть "ВКонтакте" реализовала технологию машинной расшифровки голосовых сообщений, которые отправляют друг другу пользователи. Это избавит от необходимости прослушивать их, что удобно далеко не в каждой ситуации.
О новой возможности в мобильном приложении VK Вестям.Ru сообщили в пресс-службе "ВКонтакте". Для расшифровки полученной в виде сообщения аудиозаписи и превращения ее в текст "искусственным интеллектом" достаточно одного нажатия. В соцсети подчеркивают, что расшифровку берет на себя созданная разработчиками "ВКонтакте" новая нейросеть. Она, в отличие от ранее существовавших алгоритмов преобразования голоса в текст, учитывает высокую нагрузку платформы, русскоязычный сленг и сложные условия записи.
По сути над задачей работают три нейросети, рассказал директор "ВКонтакте" по исследованиям в области искусственного интеллекта Павел Калайдин. "Одна отвечает за распознавание, вторая находит подходящие слова, а третья расставляет знаки препинания. Вместе они станут самым высоконагруженным сервисом по распознаванию речи на русском языке", — заявил он. Чтобы обучить нейросети, не нарушая конфиденциальности переписки пользователей, участники программы VK Testers записывали специально подготовленные фразы. Также качество распознавания оценивалось с помощью обратной связи от тестировщиков.
Пока новая функция есть лишь у некоторых пользователей мобильного приложения социальной сети, но в течение недели должна появиться у всех. Чтобы она сработала, сообщение не должно превышать по длительности 30 секунд (длиннее лишь каждое десятое из отправляемых через "ВКонтакте" сообщений). Функция работает и с отправленными, и с полученными аудиозаписями. Кроме того, она позволяет находить "голосовые" обычным текстовым поиском.
По данным "ВКонтакте", голосовыми сообщениями в социальной сети ежемесячно обмениваются 30 миллионов пользователей. В будущем разработчики обещают реализовать расшифровку звуковых посланий и в веб-версии социальной сети, а также для длинных и пересланных сообщений.