Голос городов. Выставка художников проекта ВКонтакте с авторами. выставка. Санкт-Петербург 2022 — Музей современного искусства Эрарта
Музей современного искусства Эрарта представил работы победителей конкурса для непрофессиональных и начинающих художников «Голос городов»
-
Более 100 произведений авторов из разных регионов страны
-
Видеоарт и трехмерные объекты, цифровая и традиционная живопись в едином выставочном пространстве
-
Максимальная свобода самовыражения
Музей Эрарта и ВКонтакте с авторами предложили многочисленной аудитории начинающих художников и художников-любителей поделиться размышлениями о жизни в городе и опубликовать свое видение этой темы. Банальность названия, напоминающего газетный штамп, не помешала получить живой отклик. Художнику свойственно поэтизировать действительность, а обращаясь к повседневному опыту, он, собственно, и открывает в себе творца.
Запросы и надежды обитателей мегаполисов стимулировали невероятный рост интереса к урбанистике — всякого рода исследованиям всего на свете: от принципов застройки до запахов кофеен или популяций крыс в городской среде. Практически каждый человек, обсуждающий в социальной сети уборку снега, цены на коммунальные услуги или пробки на дорогах, примеряет на себя роль урбаниста. Выставка предлагает щедрый материал для подобных штудий.
В глаза бросаются два топоса — общих места. Во-первых, кажется, панельная застройка существует повсеместно! Часть работ посвящена томлению духа в замкнутом пространстве и одиночеству. Но многие авторы сознательно преображают родные бетонные фасады. На картинах они пламенеют на закате или переливаются всеми цветами в вечернее время благодаря свету окон.
Здесь важно обратить внимание, что городской пейзаж — это всегда изображение человека. Он может быть как автопортретом, так и картиной целого общества с его нравами и настроениями. В экспозиции бодрые деловые небоскребы и пестрый торговый центр соседствуют с элегическими руинами. Этим и хороша большая групповая выставка: она позволяет посетить сразу несколько десятков городов по всей России и предлагает более сотни маршрутов для прогулки.
Голос городов [ПАША В КВАДРАТЕ]. Специальный выпуск блога
текущие выставки
все выставки
как развивалось распознавание речи ВКонтакте — ВКонтакте на vc.
ruС миллионами часов голосовых и звуком «ъ».
5713 просмотров
Привет! На связи команда прикладных исследований ВКонтакте. Недавно мы открыли доступ для сторонних разработчиков к ASR — технологии распознавания речи, которая считывает голос и переводит его в текст. Как это работает, для чего нужно и почему мы решили поделиться нашими наработками с миром? Рассказываем обо всём по порядку.
Что такое ASR
ASR, или automatic speech recognition, — это технология, которая помогает переводить устную речь в текст. После этого с текстом можно делать почти что угодно: передавать в поиск или переводить в голосовые команды для техники, использовать для управления в играх и сервисах. Чаще всего ASR используют в голосовых помощниках, умных устройствах, для расшифровки аудио и видео. Но области применения ограничены только фантазией разработчиков и исследователей — мы увидим ещё немало крутых кейсов.
Идея переводить голос в текст появилась очень давно, однако с практикой был статус «всё сложно». Как итог, технология ASR начала становиться массовой только несколько лет назад. Тогда мы и начали исследовать, как использовать распознавание речи в продуктах: в первую очередь в расшифровке голосовых сообщений, которую мы запустили два года назад.
С чего начиналась технология ASR ВКонтакте
Почему мы начали с распознавания голосовых? Всё просто — так мы примирили два лагеря: тех, кому дует, и тех, кому душно. Прочитать текстовое сообщение — быстрее, чем послушать голосовое. По тексту проще найти, у какого именно выхода из метро вы назначили встречу, так легче воспринимать числа, адреса и номера телефонов. Но записывать голосовые бывает удобнее, чем печатать, — особенно когда едешь за рулём, моешь посуду или появилась минутка между рабочими встречами.
Распознавание речи помогло найти компромисс. Благодаря ему можно общаться так, как хочется: слушать или читать, говорить или печатать. Люди становятся ближе друг другу — и это самое ценное.
Расшифровка голосовых — что внутри
Чтобы всё работало, мы используем наши собственные технологии и щепотку волшебства. После того как пользователь записывает аудио, оно попадает на сервер. Там запись обрабатывают три нейросети.
- Акустическая модель отвечает за распознавание звуков. Она поймёт вас, даже если вы пытаетесь найтись с другом в шумном баре или среди гула на футбольном матче.
- Языковая модель формирует из звуков слова. Здесь происходит магия вне Хогвартса: набор звуков превращается в текст на экране.
- Пунктуационная модель определяет границы предложения, расставляет знаки препинания и заглавные буквы. Это нужно, чтобы на выходе получился связный логичный текст.
Что касается датасетов, то здесь мы всё тоже делали сами. Вот как мы собирали данные для обучения модели.
- Разработали модель, которая генерировала тексты.
- Попросили бета-тестировщиков из рядов VK Testers надиктовать эти тексты в голосовых. Ребята говорили как обычно и записывали голосовые в разных условиях: выходили к шумным дорогам, включали воду. А иногда мы искусственно добавляли шум к аудио — чтобы данные для обучения были максимально близки к жизни.
В результате нейросети умеют убирать паузы из записи, понимать неразборчивую речь, ненормативную лексику, заимствования, сокращения — это уникальные умения для подобных решений на рынке. Сленг стал для нас отдельным испытанием, но без его расшифровки в голосовых было бы не обойтись. Наши модели понимают, чем «крипота» отличается от «кринжа», кто такие «краш», «кун» и «тян», — и легко распознают все эти слова в речи.
Сперва можно было расшифровывать только голосовые не дольше 30 секунд. Но потом мы пошли дальше, и сейчас в текст можно переводить записи до 2 часов. Это все голосовые, которыми пользователи делятся друг с другом. Хотя ситуации бывают разными: иногда забываешь заблокировать телефон, прежде чем положить его в карман, — и друзья получают голосовые с тремя часами АСМР-шуршания.
Что говорят пользователи
Можно долго рассказывать о наших технологиях, но намного важнее — что говорят о них пользователи. А многие из них оказались довольны расшифровкой: фича спасает тех, кто не любит слушать голосовые. Пользователи отмечают, что текст распознаётся чётко — даже с учётом пунктуации. И что инструмент доступен бесплатно в отличие от других подобных решений на рынке.
Конечно, распознавание не может быть абсолютно точным — ни одна нейросеть не создаст расшифровку, корректную на 100% (к слову, это не под силу и человеку). Забавные ошибки случаются и у нас, это рождает шутки и мемы. Например, ВКонтакте есть целое сообщество, подписчики которого делятся друг с другом забавными результатами расшифровки голосовых.
Ещё оказалось, что ошибочные расшифровки можно использовать как механику для конкурсов. Такая идея пришла организаторам онлайн-игр по вселенной Гарри Поттера: в голосовых звучал рассказ от лица Джинни Уизли, Полумны Лавгуд и Невилла Долгопупса. По распознанному тексту нужно было отгадать, где находились персонажи.
Для особо внимательных мы приберегли пасхалки — например, распознавание звука «ъ». Мы умеем и такое! Фича быстро приобрела фанатов и запустила челлендж: пользователи снимали, как пытаются произнести твёрдый знак так, чтобы он попал в расшифровку. Некоторые из таких видео собрали миллионы просмотров.
Кстати, у нас есть ещё пара идей для челленджей. Попробуйте пораспознавать разные виды смеха — сможете отличить «ихихих» от «ахахаха»? Ещё можно посмотреть, как расшифруются ваши фырканья и кряхтения — то есть обычные звуки, которые издаёт офисный сотрудник после долгого рабочего дня. И, наконец, квест для самых продвинутых — повторить ЪУЪ из того самого мема. Mission impossible. Или нет?
Как результат, наш сервис по распознаванию речи стал одним из самых высоконагруженных среди подобных решений на русском языке. Каждый месяц пользователи ВКонтакте отправляют друг другу больше 2 млрд голосовых. Это миллионы часов аудио, которые обрабатывают нейросети.
ASR в других наших продуктах
Когда мы поняли, что распознавание голосовых оправдало ожидания (наши и пользователей), решили двигаться дальше и начать внедрять ASR в другие продукты. Так на платформе VK Видео появились автоматические субтитры. Они помогают смотреть видео без звука — это удобно, когда хочется отвлечься во время рабочего перерыва и не мешать коллегам. Или когда наушники далеко — например, по пути домой в метро.
Для автоматических субтитров мы взяли лучшее, что было в ASR: применили подход, похожий на тот, что использовали в голосовых. Но внесли несколько изменений.
• Обучили нейтральную языковую модель — потому что лексика в видео сильно отличается от того, как общаются пользователи в чатах. В итоге мы научились работать не только с разговорной речью, но и с литературной.
• Специально для видео разработали ещё одну модель. Она распределяет текст по кадрам, чтобы субтитры появлялись точно в момент, когда спикер произносит фразу.
Сейчас мы активно работаем над диаризацией — это когда речь разделяется на реплики. Так фразы разных спикеров в расшифровке будут самостоятельными, даже если собеседники общаются без заметных пауз.
И автосубтитры, и распознавание голосовых сообщений работают на основе модели шумоподавления. Мы используем её в VK Звонках, чтобы важному конфколу не помешали соседи с дрелью или громкие беседы рядом с переговоркой.
Также мы используем распознавание речи в роликах, чтобы формировать умные рекомендации. С помощью ASR алгоритмы лучше понимают, про что видео и у кого оно вызовет интерес.
Открываем доступ к ASR
Если технология успешно работает в наших продуктах, почему бы ею не поделиться? Ведь чем больше проектов с распознаванием речи будет на рынке, тем окажется лучше для всех его участников: повысится качество решений, появятся новые нестандартные идеи. Так подумали мы — и открыли доступ к ASR для сторонних разработчиков.
Для распознавания можно выбрать одну из двух моделей.
- Нейтральная модель подходит для разборчивой речи, как в интервью или телешоу, — её мы используем для субтитров.
- Спонтанная модель лучше распознаёт речь со сленгом и ненормативной лексикой — как у нас в голосовых.
Мы ориентировались в первую очередь на независимых разработчиков, которые находятся в начале своего пути. Решение подойдёт для перспективных стартапов, личных pet-проектов, сервисов платформы VK Mini Apps, обучения и саморазвития. Если вы создаёте свою инди-игру, можете внедрить голосовое управление — такое встречается нечасто, поэтому вызовет интерес у аудитории. Возможно, вы захотите вывести на рынок новый сервис для расшифровки интервью и лекций. Или даже сделать бота для бесплатной расшифровки голосовых в каком-нибудь мессенджере.
Планы
Мы уже получили много запросов на доступ к ASR, в том числе от крупных брендов. Возможно, совсем скоро наша технология появится в хорошо знакомых сервисах — с нетерпением ждём!
Что ещё по планам?
• Продолжим обучать нейросети, чтобы они корректно распознавали актуальную лексику. Язык постоянно развивается, в речи появляется всё больше слов. И мы постоянно обучаем модели на новых данных, чтобы они понимали, что такое «нёрф» и «катка в кс». Йоу-йоу, сноубординг, дискета!
• Продолжим повышать точность распознавания речи. Возможно, станет меньше мемов с неверными расшифровками. Но мы готовы пойти на такую жертву 🙂
• Будем улучшать пунктуационную модель и инструменты для шумоподавления, чтобы ни один сосед с дрелью вам не помешал.
• Посмотрим, в каких ещё продуктах ВКонтакте пригодится ASR. Тысячи наших инженеров бьются над тем, чтобы мы могли распознавать речь котиков. Шутка! Хотя кто знает — может быть, и такие задачи ждут нас в будущем.
Потенциал ASR огромен, так что нам только предстоит узнать все возможности технологии. А пока мы будем продолжать развивать распознавание речи — и, конечно, держать вас в курсе всех новостей.
Как Вконтакте переводит голосовые сообщения в текст? – SamaGame
Как Вконтакте переводит голосовые сообщения в текст?.
Содержание
- Как перевести голосовые сообщения в текст в чатах Вконтакте?
- У меня проблемы с переводом голосовых сообщений в текст во Вконтакте, что делать?
- Вконтакте распознает только полученные сообщения?
- Есть ли ограничение на продолжительность записи для распознавания текста?
Как Вконтакте переводит голосовые сообщения в текст?
Трудно всем угодить. И хотя одни ленятся писать текст и предпочитают оставлять звуковые сообщения, другие просто не могут его услышать по тем или иным причинам. Для решения этой ситуации в приложениях ВКонтакте для iOS и Android реализована новая функция. Позволяет преобразовывать звуковые сообщения в обычный текст.
♥ ПО ТЕМЕ: Как скачать видео с Вконтакте, YouTube, Facebook, Instagram, Одноклассники на компьютер: лучшие бесплатные сервисы.
Надо сказать, что голосовые сообщения — популярный формат общения ВКонтакте. Ежемесячно 30 миллионов человек обмениваются информацией таким образом в социальной сети.
Как перевести голосовые сообщения в текст в чатах Вконтакте?
Все, что вам нужно сделать, это нажать кнопку «Ах», которая появится рядом со звуковым сообщением. Далее распознаванием речи будет управлять полноценная нейросеть, созданная и обученная инженерами ВКонтакте. Уникальность этой сети в том, что она учитывает платформу загрузки, распознает русский сленг и учитывает плохие условия записи. Кроме того, нейросеть распознает голос быстрее человека.
Сама задача расшифровки аудиосообщений по-своему уникальна, это не то же самое, что распознавание адреса голосовым помощником. Говорим с ним внятно, а с друзьями болтаем на бегу, с шумами. Нейронная сеть должна выровнять распознанные совы в связный текст. Фактически в обработке участвуют три сети: одна распознает аудио, вторая находит и упорядочивает подходящие слова, а третья уже упорядочивает знаки препинания.
♥ ПО ТЕМЕ: Как скачать видео из ВК (ВКонтакте) на iPhone или iPad и смотреть их без интернета.
У меня проблемы с переводом голосовых сообщений в текст Вконтакте, что делать?
Если эта опция отсутствует, обновите мобильное приложение Вконтакте до последней версии.
♥ ПО ТЕМЕ: Генератор QR-кодов ВКонтакте, или как создавать крутые QR-коды со своим дизайном.
Вконтакте распознает только полученные сообщения?
Распознаются как полученные, так и отправленные сообщения.
♥ ПО ТЕМЕ: Как включить озвучивание текста (чтение вслух) на iPhone и iPad.
Есть ли ограничение на продолжительность записи для распознавания текста?
Есть ограничение: продолжительность записи не должна превышать 30 секунд. Однако под этот критерий попадает 90% всех аудиосообщений ВКонтакте.
Технология поможет найти нужную информацию в переписке – теперь ее можно будет найти по тексту. Разработчики обещают, что в будущем возможность распознавания текста появится не только в мобильной, но и в веб-версии клиента Вконтакте. Ограничения по продолжительности аудио исчезнут, а также можно будет работать с переадресованными сообщениями.
Сервис работает полностью в автоматическом режиме, сотрудники ВКонтакте не имеют доступа к личным сообщениям пользователей, как текстовым, так и голосовым. А во время обучения отобранные тестировщики записывали специально подготовленные фразы, после чего давали отзывы о качестве распознавания. Тестирование сервиса началось в марте, но это не первая нейросеть ВКонтакте, которая работает над улучшением сервиса социальной сети. В МФТИ даже есть собственная лаборатория искусственного интеллекта.
ADA Australia — Ваши защитники интересов пожилых людей и лиц с ограниченными возможностями
Обновления и ресурсы COVID-19
Карьера
Адвокат вернул мне достоинство и привлек к ответственности моего поставщика услуг. Вы так изменили мою жизнь. Мое поколение не любит шумихи, но адвокат все сделал настолько профессионально, что всех уважали.
Защита интересов пожилых людей
Мне очень понравилось обучение, оно было проведено очень профессионально и легко для понимания. Это дало нам хорошее представление о роли взрослых опекунов и их обязанностях.
Обучение принятию решений
Адвокат был просто замечательным, благодаря ему у меня дела в доме престарелых улучшились.
Защита интересов пожилых людей
Мой отец был очень доволен поведением адвоката и ее помощью. Она сразу обратила внимание на проблемы моего отца и помогла добиться отличного результата
Защита интересов пожилых людей
Мне 82 года, живу один. Адвокатирование было для меня замечательным, так как я не понимал, что делать, и адвокат помог мне.
Защита интересов пожилых людей
Я хотел бы поблагодарить своего адвоката за всю тяжелую работу, которую она проделала для решения моих проблем, и за то, что она дала мне силы, когда я думал, что это невозможно.
Защита интересов пожилых людей
Я думаю, важно, чтобы кто-то вроде вашего адвоката защищал интересы гомосексуалистов, находящихся в интернатах. В вашей визитке сказано, что вы даете людям право голоса, и вы сделали это для меня.
Адвокатура
Стресс из-за моего провайдера был настоящей проблемой и причинял мне много беспокойства. Мой адвокат встал на защиту моих прав и дал мне силы решить вопрос с ними. Спасибо.
Защита интересов пожилых людей
Я все равно был бы крайне огорчен, если бы вы не пришли мне на помощь.