Голосовой ассистент «Алиса» научилась узнавать всех членов семьи / Хабр
denis-19Время на прочтение 2 мин
Количество просмотров9.5K
Облачные сервисы *Умный дом IT-компании Голосовые интерфейсы *
11 октября 2022 года «Яндекс» рассказал, что голосовой ассистент «Алиса» научилась узнавать всех членов семьи, а все умные колонки компании с «Алисой» получили функцию совместного использования.
В компании рассказали Хабру, что раньше «Алиса» старалась учесть вкусы всех членов семьи, смешивая их любимые треки. В итоге пользователям не всегда удавалось слушать только то, что нравится. Теперь «Алиса» может различать голоса членов семьи и каждый сможет слушать свою любимую музыку и персональный поток треков. Эти возможности уже доступны во всех умных колонках «Яндекса».
Раньше, если владелец устройства просил «Алису» запомнить свой голос, то остальные пользователи уже не могли ставить лайки.
«Колонка с «Алисой» — это семейное устройство. С ней общаются дети, мамы и папы, подростки и люди пожилого возраста. У каждого свои музыкальные пристрастия, поэтому так важно, чтобы «Алиса» узнавала по голосу всех членов семьи», — рассказал руководитель «Алисы» и умных устройств «Яндекса» Сергей Мельник.
Также управление умным домом стало доступно всем членам семьи в приложении «Дом с Алисой». Теперь не нужно ждать владельца устройства, чтобы запустить через приложение домашние гаджеты. Это сможет сделать любой пользователь из домашней группы со своего смартфона. «Алиса» может запомнить до пяти членов семьи, включая владельца устройства. Для этого нужно попросить близких скачать приложение «Дом с Алисой» и пригласить их управлять умным домом. После этого члены семьи смогут познакомиться с «Алисой», чтобы она запомнила их голоса. Пошаговую инструкцию можно найти на сайте «Алисы».
10 октября 2022 года голосовому ассистенту «Алиса» от компании «Яндекс» исполнилось 5 лет. Этот сервис теперь умеет намного больше, чем разработчики себе представляли на старте проекта. «Яндекс» выпустила свой голосовой помощник «Алису» в 2017 году. Сервис использует технологии SpeechKit для распознавания голоса и Turing, чтобы подобрать подходящий по смыслу ответ.
Теги:
- Голосовой ассистент
- Алиса
- Яндекс
- семья
Хабы:
- Облачные сервисы
- Умный дом
- IT-компании
- Голосовые интерфейсы
Всего голосов 15: ↑12 и ↓3 +9
Комментарии 26
Денис @denis-19
Информационная служба Хабра
Комментарии Комментарии 26
Как «Яндекс» создавал «Алису» — Будущее на vc.ru
Разработчики голосового ассистента — об особенностях российской аудитории, преимуществах перед конкурентами и перспективах технологии.
55 449 просмотров
Кратко
- 10 октября 2017 года «Яндекс» официально представил своего голосового ассистента «Алиса».
- В основе «Алисы» — нейронные сети, которые распознают речь, интерпретируют её , составляют ответы и синтезируют голос помощника. «Алиса» обучается на огромных массивах текстов, чтобы общаться с пользователем на свободные темы.
- Одна из главных сложностей в разработке такой системы: понять, что будет интересовать пользователей, и как они будут об этом спрашивать. Кто-то спрашивает у поисковика «где я», кто-то — «какая моя геолокация».
- Основные отличия «Алисы» от конкурентов (к примеру, Siri) — интеграция с собственной поисковой системой компании и наличие нейронной сети, с помощью которой помощник самостоятельно генерирует новые реплики.
Почему «Яндекс» взялся за разработку голосового ассистента
К 2017 году своих голосовых помощников представили крупнейшие мировые ИТ-компании: на англоязычном рынке работает Siri от Apple, Assistant от Google, Alexa от Amazon, M от Facebook, Cortana от Microsoft. На азиатском — Duer от Baidu и Bixby от Samsung.
Весной 2017 года тестирование собственного голосового помощника запустил российский «Яндекс». Ассистент по имени Алиса встроен в поисковое приложение компании. Пользователь может решить свою задачу в форме диалога с ассистентом — вместо ввода запроса в поисковую строку. 10 октября 2017 года компания объявила об официальном запуске сервиса — помощник появился в стабильной версии поискового приложения для Android и iOS, а также в бета-версии «Голосового помощника» для Windows.
За создание «Алисы» компания принялась в конце 2016 года. Сервис начали разрабатывать потому, что вся индустрия движется в этом направлении: пользователь хочет и готов решать свои задачи в форме диалога с виртуальным помощником, готовы к этому и алгоритмы, — и можно переходить от голосового ввода к осмысленному диалогу.
Когда у пользователя появляется возможность задать вопрос голосом, он начинает говорить по-человечески. Вместо «Лада калина 2007 карданный вал дёшево купить» спрашивает: «Где мне купить карданный вал на «Ладу Калину» 2007 года»? Не выдумывает поисковый запрос, не формулирует его, как он привык это делать, а просто спрашивает.
В этом направлении параллельно движутся и поисковые алгоритмы, и диалоговые интерфейсы. Но в голосовом помощнике есть привязка к контексту — то есть способность удерживать смысл реплик и понимать, связаны ли с ними последующие высказывания.
Скажем, вы спросили «Алису»: «Какая завтра погода?» — она ответила вам: «+7 и ясно». Следующий вопрос может оказаться: «А на выходных?» Его легко понять человеку, но сложно машине — ведь в нём нет даже ключевого слова «погода». Диалоговый помощник умеет сопоставлять реплики и понимать, что вы всё ещё говорите о погоде.
Значит, когда мы от простого голосового ввода переходим к диалогу, то делаем это, чтобы дать пользователям возможность говорить так, как они привыкли — вот и всё.
Илья Субботин, руководитель продукта «Алиса»
По словам разработчиков, пользователи «Яндекса» уже умеют обращаться к сервисам компании голосом — команда «Слушай, Яндекс» работает и в «Поиске», и в «Навигаторе», и в других приложениях. Так что привыкать к новому интерфейсу им не придётся.
Илья Субботин, руководитель продукта «Алиса»
С пользовательской точки зрения, говорит команда проекта, с появлением «Алисы» меняется несколько вещей. Помимо диалогового интерфейса, помощник обрёл личность — «Алиса» проявляет эмоции, умеет шутить и «не терпит унизительного обращения в свой адрес». К ней теперь можно обращаться по имени: «Слушай, Алиса».
С технологической — за работу помощника теперь отвечает многослойная нейросеть, которая учится на массивах текстов, понимает смысл запроса и самостоятельно синтезирует речь.
Как работает «Алиса»
«Алиса» встроена в поисковое приложение «Яндекса».
Под капотом
В основе «Алисы» — нейронные сети: они распознают речь, анализируют её, определяют тематику диалога, выделяют полезную для поиска информацию, синтезируют ответы помощника.
Почти все вычисления, помимо голосовой активации (распознавания фразы «Слушай, Алиса»), проводятся в облаке. «Конечно, было бы интересно перенести часть вычислений на смартфон, чтобы «Алиса» иногда могла работать и без интернета, — говорит Илья Субботин. — Но вычислительная мощность смартфонов слишком низкая для таких задач».
Технологии машинного обучения дошли до уровня, когда пользователь может просто говорить с приложением и видеть, что то его понимает, — а синтезированный голос приобретает звучание, близкое к естественному.
команда «Алисы»
При этом мировое научное и технологическое сообщество находится лишь в начале пути — алгоритмы будут совершенствоваться и дальше. Распознавание речи, синтез, определение тематики беседы — всё это должно работать ещё лучше.
Есть общие продуктовые метрики, по которым можно оценивать работу помощника, — удовлетворенность пользователя, частота использования приложения. Но есть и более сложные параметры, объясняет Субботин. Например, умение находиться в контексте беседы: помощник должен помнить, о чём его спросил пользователь, уметь верно интерпретировать дополнительные вопросы и давать релевантные ответы.
«От релевантности одного конкретного диалога в будущем можно будет переходить к персонализации и мультизадачности: в идеале, когда я собираюсь на работу, я смогу спросить, что надеть, «Алиса» посмотрит погоду, маршрут до офиса, решит, на чем лучше доехать, и исходя из этого посоветует мне, что надеть».
Как объективно оценивать способность системы вести диалог, пока не ясно. Длина диалога мало говорит о его содержательности: беседа может затянуться, если пользователю интересно обсудить что-то с ассистентом или если помощник долго не может решить его задачу. Но и короткий диалог не всегда говорит об успешном решении проблемы.
Акцент на поиске
Разработчики голосового помощника Siri от Apple намеренно наращивают количество диалоговых сценариев — чтобы не демонстрировать пользователю поисковую выдачу. Перед командой «Алисы» такой задачи не стоит, потому что «Алиса» — другой продукт.
Apple поступает так не от богатства выбора. Просто это не поисковая компания. Мы абсолютно другие. Для нас поиск на первом месте — это лучший продукт, который у нас есть.
Загадывать, как интегрированный с поиском помощник будет адаптирован для работы на других устройствах, пока рано, считает руководитель продукта «Алиса»: индустрия пока не выяснила, какие именно устройства окажутся востребованы у аудитории, а кроме того, такие устройства будут предполагать разные сценарии взаимодействия, под которые можно будет адаптировать систему.
«У пользователя в любом случае есть задача, которую он хочет решить — взаимодействуя с голосовой колонкой или, допустим, системой управления автомобилем. В случае с колонкой упор будет сделан, вероятно, на музыке или новостях — и у нас есть музыкальный и новостной сервисы. В автомобиле водителя интересуют карты. Вряд ли он будет спрашивать у машины: «пластиковые окна купить дёшево»».
Крупные технологические компании делают ставку на развитие экосистем «умных» устройств — и это расширяет возможности взаимодействия с помощником. Если для ответа на вопрос устройству без экрана понадобится показать поисковую выдачу или открыть приложение, помощник сможет запустить нужный сервис на другом — например, на смартфоне.
«Это лишь вопрос адаптации под устройство, — продолжает Субботин. Но, по-честному, мы пока ничего не знаем. Один из лидеров отрасли — Amazon, — до сих пор экспериментирует с форматами: у компании есть колонка Echo, мини-версия Echo Dot, варианты с камерой, с экраном».
Личность
Личность «Алисы», считают разработчики, — одно из её главных конкурентных преимуществ. Проекты, рассчитанные на англоязычную аудиторию, не пытаются создать сильную эмоциональную связь с пользователем, а наоборот, скорее от него отстраняются.
Чтобы дать ассистенту личность, команде нужно было определиться с полом, возрастом, именем и чертами характера персонажа, описать поведение и составить реплики, которые помощник будет использовать для диалога с пользователем — «редакторские» ответы.
Вместе с журналистом, писателем и бывшим руководителем группы маркетинга поиска «Яндекса» Владимиром Гуриевым разработчики описали характер персонажа и выбрали для него подходящие реплики.
Всего команда описала около 320 сценариев, в которых помощник отвечает редакторскими репликами. Для каждого из таких сценариев заложено от двух до семи ответов, которые система выбирает случайным образом. «Этого достаточно, чтобы сформировать личность, но недостаточно, чтобы потрепаться обо всём на свете», — говорит Субботин.
Разработчики решили, что ассистент будет молодой девушкой, которая всегда готова помочь владельцу смартфона, но при этом не допускает панибратского отношения. Она корректна и держит дистанцию, когда её пытаются оскорбить, но не высокомерна и не кичится своими знаниями.
Помощник также должен быть ироничным и — это важно в контексте систем искусственного интеллекта — самоироничным. «Дело в том, что наш алгоритм речевого синтеза, — да и все алгоритмы конкурентов, — не очень-то хороши в эмоциях. «Алиса» немножечко над собой посмеивается, добавляя слова «шутка» или «сарказм», где это нужно. Потому что она знает про себя, что пока не может хорошо интонировать», — объясняют разработчики.
Как выбирали имя
Команда составила список имён, которые, как показалось сотрудникам, лучше всего подходили к выбранным чертам характера. К имени предъявлялись также технические требования: например, в нём не должно было быть буквы «р» — её не выговаривают маленькие дети.
Кроме того, имя не должно было входить в другие слова или фразы. В качестве одного из вариантов разработчики рассматривали имя Майя — но оно могло спровоцировать ошибки распознавания на фразах вроде «Девятое мая». Важно было также, чтобы имя не входило в список наиболее популярных женских имён в России — чтобы сократить количество ложных активаций. Алиса в такой список не входит, но для тех пользователей, у кого в семье есть Алиса, останется возможность активировать помощника командой «Слушай, Яндекс».
Определившись с вариантами, разработчики вместе с социологами и аналитиками «Яндекса» составили опрос для пользователей сервиса «Толока». В нём компания просила определить черты характера девушки по имени. «Пользователей нельзя спросить прямо, какое имя больше подходит ассистенту, и мы спросили хитро. Взяли нужные нам характеристики — и наоборот, совсем неподходящие, и стали спрашивать: если у девушки вот такое имя, то она скорее, например, добрая или агрессивная?».
С большим отрывом, говорит Субботин, в опросе победило имя «Алиса». «И никто за время тестирования ни разу не сказал нам, что это плохое имя».
Как «Алиса» обучалась во время тестирования
Всего в тестировании ассистента приняло участие несколько десятков тысяч человек, а продлилось оно пять месяцев.
Главное, что мы выяснили за это время, — что двигаемся в верную сторону. И что те вопросы, которые, как мы думали, должны волновать пользователей, действительно их интересуют.
Перед запуском тестирования было важно определить наиболее вероятные сценарии взаимодействия: вопросы, которые пользователи будут задавать «Алисе», — а также понять, как именно они будут их задавать.
«Мы понимали, что людей волнует, к примеру, погода. Отлично, чтобы рассказать о погоде, надо на что-то среагировать — на какие-то пользовательские фразы», — рассказывает Субботин. Определившись с темой, разработчики описали самые простые сценарии: например, когда пользователь просто спрашивает: «Какая сейчас погода?». Затем добавили более сложные варианты: прогноз погоды на конкретное число, на несколько дней, на несколько дней в следующем месяце.
Ещё одна популярная тематика — определение местоположения. Изначально команда «Алисы» собрала несколько реплик, которыми пользователи могли бы активировать сценарий, но выяснилось, что зачастую люди задают вопросы совсем не так, как могли предположить разработчики. «Мы включили: «где я», «где я нахожусь», «какое моё местоположение», «какой у меня сейчас адрес». А пользователь спрашивает: «Подскажи, пожалуйста, где моя геолокация». Такое мы не могли предусмотреть».
Разработчики отслеживают типы запросов пользователей и релевантность ответов помощника и добавляют в ассистента новые сценарии, которые не были заложены в него изначально.
Команда также занимается разработкой специальной диалоговой модели — внутри компании её называют «болталкой», — которая в будущем может взять на себя всё общение с пользователем на отвлечённые темы и обучаться новым репликам самостоятельно.
«Болталка» обучается на больших массивах текстов, в том числе диалогов. Порой, говорят создатели, они не могут предугадать ответы «Алисы» — настолько человечными они оказываются, — а иногда она может и нахамить собеседнику. Но разработчики отслеживают некорректные реплики и удаляют их из системы.
Скриншоты диалогов во время тестирования помощника
Алиса, можно с тобой поговорить?
Я вздохнул, лежа на кровати. Дверь открылась, и он вошел. Он выглядел раздраженным и сел за стол.
"Белла, я-"
"Эдвард, остановись. Как ты мог так на меня кричать? Я волнуюсь так же, как и все остальные! Я никогда не думал, что такое может случиться! Кричать на меня таким образом только хуже, Эдвард. Я тебя понимаю" беспокоюсь, но поговори со мной и скажи, что ты думаешь».
Он покачал головой, глядя на меня.
«Я не могу потерять тебя, Белла. Не могу».
Ну, он не собирался.
"Ты не будешь, Эдвард."
Он начал нервничать, и я видел, что он не собирается меняться. Я покачал головой, глядя на него.
"Эдвард, если ты не собираешься меня слушать, просто уходи."
Он покачал головой и вышел, хлопнув дверью. Я не мог поверить, что он так себя ведет! Дверь открылась, и я подумал, что он возвращается, чтобы поспорить.
"Эдвард, если хочешь поспорить, просто уходи."
"Белла, это я."
Я обернулся и увидел обеспокоенную Алису. Она подошла к кровати, села рядом со мной.
"Извините, я думал..."
"Что я был моим братом. Что случилось?"
Я посмотрел на свои руки и задумался. Я понимаю, что он боится. Но я должен.
"Вы слышали, что сказал Карлайл? Глупый вопрос, конечно слышали. Мы поспорили. Он сказал что-то о том, что не хочет жить без меня, и ну.......... ..... Как будто мои чувства по этому поводу не имеют значения. Я так же напуган, как и он. Я просто не знаю, что с ним делать, Элис?
Она схватила меня за руку и посмотрела на меня.
"Он беспокоится о тебе, Белла. Мы все волнуемся. Никто из нас никогда не думал, что это возможно. Но он должен тебя выслушать. Конечно, ты боишься, он должен это увидеть. Я знаю, что могу. Поговори с ним , Белла. Он любит тебя, он боится, что потеряет тебя.
"Я пытался, пикси. Он все говорит, что не будет жить без меня."
Алиса провела рукой по волосам, размышляя. Я сжал ее руку, наблюдая за ней.
"Хорошо, давай попробуем вот что: что ты хочешь сделать с его поведением?"
"Кроме того, что задушить его?"
Это заставило ее рассмеяться.
"Предоставьте это мне. А если серьезно, что вы хотите сделать с тем, как он с вами обращается?"
Я покачал головой, размышляя. Если бы он продолжал в том же духе, я не думаю, что смогу с этим мириться. Я знал, что Элис могла видеть то, что я собирался сказать, но она знала, что мне нужно было поговорить об этом на самом деле.
"Я не думаю, что смогу больше вынести этого, Алиса. Я действительно не могу."
Она кивнула, глядя в сторону. Я не знала, чего хотела, но знала, что не могу долго слушать вопли Эдварда.
"Вам двоим нужно поговорить друг с другом."
Я кивнул, наблюдая за ней.
"Я знаю. Я поговорю с ним позже. Как вы с Джаспером?"
Она пожала плечами, и я понял, что что-то не так.
"Алиса, почему мне кажется, что что-то не так?"
"Белла, не беспокойся об этом. Просто в данный момент все немного сложно. Он не может быть рядом с тобой, и это его беспокоит."
Я кивнул, он не мог быть рядом, так как они выяснили, что мне нужно, и я знал, что его это беспокоит.
"Это не его вина. Я бы хотел, чтобы он был рядом, но он не может. Но это еще не все. Ты ничего не сможешь скрыть от меня, пикси."
Алиса покачала головой.
"Белла, ничего. Ты себя хорошо чувствуешь?"
Я кивнул, увидев, что она пытается сменить тему.
"Я в порядке, и ты не выберешься отсюда. Что случилось, Алиса?"
"Ты же не собираешься сдаваться?"
Я только что посмотрел на нее. Она знала меня лучше, чем это.
"Алиса, ты меня лучше знаешь. Что-то меня беспокоит, и я хочу знать, что именно."
Кто-то постучал в дверь, и Алиса посмотрела на меня.
"Это Эдвард. Я поговорю с тобой позже."
Она вышла, когда он вошел. Он сел на кровать, и я знал, что он собирается поднять этот вопрос.
"Белла, прости за свою реакцию. Я боюсь тебя потерять. Не знаю, что бы я без тебя делал."
"Эдвард, ты не будешь. Все будет хорошо."
Он покачал головой, и я вздохнул.
"Белла, не говори так. Это не будет хорошо. Это не будет хорошо, это не так. И я не знаю, что делать."
"Может помочь поговорить со мной, а не кричать на меня. Эдвард, я так же напуган, как и ты."
Он просто смотрел на меня, и я видел, что он не собирается меня слушать. Я не могла оставаться с ним, если он собирался так со мной обращаться. Я знаю, что все это сплошная неразбериха, но я не могу позволить ему так со мной обращаться.
"Белла, ты не понимаешь. Я не буду жить без тебя..."
"Эдвард... Знаешь что? Я так больше не могу."
Казалось, он понял, что я имел в виду, и разозлился.
"Белла, нет. Пожалуйста, я боюсь того, что с тобой может случиться. Элис больше ничего о тебе не видит, и я не знаю, что произойдет."
"Я боюсь, Эдвард! Я знаю, что она ничего не видит, но это не ее вина! Никто не знает, что произойдет, но они не кричат на того, кого должны любить".
И что случилось? Начался кричащий матч.
«Эдвард! Стоп, это не работает. Я больше не могу».
Он встал и посмотрел на меня.
"Прости, Белла. Я не понимаю, что происходит, и это меня пугает."
"Я знаю, Эдвард. Я боюсь. Но это явно не сработает. Я-"
«Нет, Белла, это сработает. Мы просто должны слушать друг друга».
О нет, он хотел, чтобы я согласился со всем, что он говорил.
"О нет. Я не собираюсь верить всему, что ты делаешь. Я знаю, чего хочу, и я не собираюсь менять то, во что я верю, ради кого-то другого. изменять."
Он покачал головой, не слушая. Это не разлучит нас..................... Не так ли?
Алиса Купер-Talk Talk (1980, Vinyl)
Подробнее изображения
A | Talk . | ||
B | Танцуй себя до смерти Автор сценария – Элис Купер (2), Фрэнк Крэндалл Автор сценария – Элис Купер (2), Фрэнк Крэндалл | 3:10 |
- Компания звукозаписи – WEA Musik GmbH
- Фонографические авторские права ℗ – Warner Bros. Records Inc.
- Издатель – Ezra Music
- Издатель – Leforge Publishing
- Инженер – Ян Тейлор
- Продюсер – Рой Томас Бейкер0193 Сторона B, опубликованная Ezra Music/Leforge Publishing — BMI
℗ 1980 Warner Bros. Records Inc.
- Код цены: Ⓝ
- Общество прав: GEMA
- Код этикетки: LC 0392
- 2
- A): WBS 49526-A
- Матрица / биение (сторона биения B): WBS 49526-B
- Матрица / биение (сторона биения A, травленая): WEA 17697-A PF
- Матрица / биение (сторона биения B, травление): WEA 17697-B PF
Talk Talk (7″, 45 RPM, Single, Promo, Stereo, Mono) Warner Bros. Records WBS49526 US 1980 New Submission
Talk Talk (7″, 45 RPM, Single, Promo) Warner Bros. Records WBS 49526 Canada 1980 Recently Edited
Talk Talk (7″, 45 RPM, Single, Winchester Pressing) Уорнер Бразерс Рекордс WBS49526 US 1980 New Submission
Talk Talk (7″, 45 RPM, Single) Warner Bros.