Разное

Алиса яндекс поговорить с ней: Алиса — голосовой помощник от компании Яндекс

28.04.2021

Содержание

Кто такая Алиса? Основные преимущества и назначение Алисы

Голосовой помощник Алиса. Что она из себя представляет и для чего она может пригодиться? А также разбор основных преимуществ.

Кто такая Алиса? Основные преимущества и назначение Алисы

12 Июля, 2019 Автор: Максим М

Вы наверняка слышали про Алису, а если нет, то сейчас мы подробно расскажем о ней и ее возможностях.
Алиса – это голосовой помощник от компании Яндекс, с которым можно поговорить «по-человечески». Алиса — это достойный аналог «Окей гугл» от Google.

Алиса создана, чтобы помогать людям решать повседневные задачи: она может найти информацию в интернете, подсказать, где поужинать, какая будет погода и многое другое. При этом вам не нужно переключаться между приложениями — Алиса сама обратится к разным сервисам Яндекса и ответит на вопросы. Впрочем, запускать приложения она тоже умеет.

Чтобы получить доступ к Алисе вам нужно устройство, на котором установлен Яндекс.

Браузер.
Подробнее про Алису можно почитать тут:

  1. Кто такая Алиса и как ей пользоваться?
  2. https://alice.yandex.ru

Также в Алисе есть навыки.
Навыки — это своего рода отдельное приложение, которое находится в Алисе. Навыки позволяют разработчикам добавлять сценарии общения с пользователями на сервисы Яндекса.
Проще говоря навыки расширяют возможности Алисы. Вы можете создать навык, который будет помогать пользователям найти что-либо на вашем сайте голосом.
У многих так же сложилось мнение что навыки — это игрушка. И от части это действительно так. На данный момент каталог навыков по большей части состоит из игр. Но есть и действительно хорошие и полезные навыки, которые существенно упрощают взаимодействие пользователя с сервисами той или иной компании. Главное сделать удобный и качественный навык.

К слову, вы можете заказать создание навыка у меня.

У навыков также есть и недостатки.
Одним из недостатков является то, что пользователь может осуществлять какие-либо действия с вашими сервисами или данными, не заходя на сайт. Это является преимуществом для пользователя, так как ему не обязательно заходить на сайт и пытаться что-то найти. Пользователю гораздо проще запустить навык, и уже в навыке найти всё необходимое. Поэтому здесь главное заинтересовать пользователя и не навязывать явный переход на ваш сайт.

Например:

  • Если у вас интернет-магазин, то почему не позволит пользователю выбрать нужные товары в навыке, и уже на процессе оформления заказа предложить перейти на сайт.
  • Так же вы можете создать навык, который будет отвечать на часто задаваемые вопросы. В данном случае не будет необходимости переводить пользователя на сайт, а также это снизит нагрузку на операторов, так как им не придется отвечать на часто задаваемые вопросы.

Согласитесь это же удобно, просто и эффективно. Не так ли?

У Алисы большой потенциал, и ее можно использовать в любой отрасли. Все ограничивается лишь вашей фантазией.

Алиса нужна, как минимум, потому что она упрощает нам жизнь, а большое количество навыков позволяет все хранить в одном месте, и порой пропадает необходимость скачивать какое-либо приложение.
За голосовыми помощниками будущее.
Если Вы сомневаетесь о необходимости создания навыков, то рассмотрите все преимущества Алисы, и Вы поймете, что их больше, чем недостатков. Лучше войти в эту экосистему раньше, и получить преимущества сейчас, чем потом, когда будет поздно.
Если вы до сих пор сомневаетесь, то можете лично написать мне, и я наглядно продемонстрирую все преимущества навыков, а также подскажу как именно вы сможете использовать Алису для своих нужд.
Моя почта: [email protected]

Основные преимущества Алисы

Давайте рассмотрим основные преимущества голосового ассистента Яндекс Алиса

  • Выгодная площадка для бизнеса

    Голосовой помощник становится неотъемлемой частью жизни человека. Алису скачали уже более 50 миллионов раз.
    Помимо этого, Алисой ежедневно пользуется больше 8 млн. человек.

  • Удобство

    Алисой крайне удобно пользоваться, ведь куда проще спросить и сразу узнать ответ чем заходить на сайт и что-то искать.

  • Современность

    За голосовыми помощниками будущее, и многие это понимают и развиваются в данном направлении. Согласитесь, компания со своим навыком в Алисе, выглядит выигрышнее, чем компания без него

  • Удобный и простой способ взаимодействия

    Голосовой помощник поддерживает общение на естественном для человека языке, распознает смысл сказанного и переводит его в запросы.
    Не обязательно уметь писать, можно просто спросить. В связи с этим, с Алисой спокойно дружат маленькие дети.

Какие преимущества даст Вам Алиса?

Рассмотрим какие преимущества способна дать Алиса, если подключить её уже сегодня

  • Сократятся расходы на персонал

    Алиса может отвечать на запросы клиента вместо человека, причем делает это намного быстрее!

  • Усилится эффективность рассылок

    Алиса персонализирует контент под каждого клиента, отдавая лишь необходимое.

  • Повышается лояльность клиентов

    Алиса доступна всегда и везде. Поэтому Вы находитесь на связи с каждым клиентом в любое время суток, в любом месте.

  • Увеличивается количество покупателей

    Алиса — новый канал для связи, с большим количеством пользователей.

  • Увеличивается удовлетворенность пользователей

    Алиса — крайне удобный голосовой помощник, пользователи будут благодарны Вам за то, что вы упростили их жизнь. И как следствие они будут рекомендовать Вас всем!

#Теги

яндекс.диалогиалисаvuiголосовое управлениенавыки Алисы

Кто такая Алиса, где она живет и как можно её использовать

В статье я расскажу Вам о том, как правильно пользоваться Алисой. Узнаем, где именно она живет, как её запустить и использовать в повседневной жизни, а также я расскажу вам о навыках.

Читать статью

Платформа умного дома Яндекса

Умный дом Яндекса позволяет управлять домашней техникой с помощью голосовых команд — через Алису.

Читать статью

Как правильно спроектировать свой навык

Разработка сценария — один из самых сложных этапов создания навыка. Поэтому мы разработали рекомендации для тех, кто только приступает к этому ответственному делу.

Читать статью

Как приступить к разработке навыков

Выберите свой способ: соберите навык на конструкторе без программирования, используйте готовые шаблоны, напишите навык с нуля или закажите навык у профессионалов.

Читать статью

ЛЁГКИЙ диалог: проектируем навык для голосового помощника Яндекс.Алиса

IT-гиганты готовы общаться с нами голосами Алисы, Google Assistant и других подобных помощников, лишь бы продать собственные сервисы. Но кто научит технологичных ассистентов разговаривать на нашем языке

Читать статью

Нельзя просто так взять, и не заказать разработку навыка у победителя Премии Алиса!

Заинтересовала Алиса? Захотелось создать свой собственный навык?
Заполняйте анкету. И получите свой навык как можно быстрее!

Как я могу к Вам обращаться

Пожалуйста укажите свое имя, чтобы я смог с Вами связаться!

Ваша почта

Пожалуйста укажите свою почту для связи!

Телефон

Пожалуйста укажите свой номер телефона!

Комментарий/Пожелание

Как со мной связаться?

Свяжитесь со мной по любому поводу!
Я с радостью отвечу на все вопросы!

Вверх 👆

О чём робот говорит с вашим ребёнком? «Яндекс» научил «Алису» разговаривать с детьми, и это может быть опасно

«Алиса» научилась разговаривать с детьми. Это как?

Люди боятся подпускать детей к технологиям, проблема актуальна не только в России. В США среди обеспеченных семей полный отказ от гаджетов в воспитании ребёнка — распространённое решение. Вальдорфская школа, популярная среди сотрудников Силиконовой долины, учит детей вообще без электронных устройств. Есть и другие частные школы Калифорнии, также работающие по старинке. Там вместо цифровой грамотности и презентаций в PowerPoint дети играют в традиционные игры, много времени уделяют чтению вслух и другим видам речевой деятельности.

В Соединённых Штатах есть стереотип, что в сети много сидят дети из слабо обеспеченных семей. Суждение подкрепляется научным исследованием. По данным компании Common Sense Media, подрост­ки из семей с низким доходом проводят у экранов в среднем 8 часов, а более обеспеченные – меньше 6 часов.

Акции «Яндекса» подскочили в цене после новостей о покупке банка «Тинькофф»

В России появился повод для ещё одной фобии. Голосовой помощник «Алиса» научился различать детей и взрослых по голосу. В зависимости от этого он меняет алгоритмы действий. Детскими помощница считает голоса, принадлежащие людям в возрасте до 10–12 лет. В частности, она по-разному отвечает на одни и те же вопросы от тех и других. Ведя диалог с детьми, «Алиса» подбирает наиболее подробные и понятные им объяснения.

В случае с другими командами ассистент также ведёт себя по-разному со взрослыми и с детьми. На запрос включить музыку от ребёнка «Алиса» ставит детские песни, новости — детский выпуск с Radio Disney и так далее.

Таким образом, ещё одно устройство стало более доступным и даже специально ориентированным на детей. Это же — один из страхов родителей. Причём их отношение — как правило, одна из двух крайностей. Одни дают ребёнку планшет на весь день, другие боятся, что устройства будут мешать его развитию. Кроме того, «Яндекс.Станции» с «Алисой» активно продвигаются. В одном из магазинов «Яндекс.Станция» мини-формата даётся в подарок при покупке популярного смартфона.

Фото © Shutterstock

В Сети есть масса историй о зависимости детей от гаджетов. Одна из популярных: в планшете можно увеличивать изображение, ребёнок пользуется возможностью, а потом подходит к окну, замечает интересный ему предмет и начинает водить пальцами по стеклу, пытаясь увеличить изображение. Якобы так стирается грань между виртуальной и материальной реальностью.

Разберёмся, опасна ли умная колонка для ребёнка.

Что за детский режим и для чего он нужен?

Распознавание детей — это не особый детский режим, а дополнение для лучшего взаимодействия с людьми разного возраста. Это сделано для того, чтобы усовершенствовать семейный режим и упростить взаимодействие между ребёнком и голосовым помощником. С ним ребёнок получит доступ к ориентированному на него контенту.

Наша задача — с помощью настроек дать детям лучший опыт взаимодействия с колонками, и мы хотели достигнуть этого не только ограничениями, но и правильными рекомендациями контента, который действительно интересен детям, — подкасты, музыка, интересные факты и так далее, — рассказали Лайфу в пресс-службе «Яндекса».

Родительского контроля у колонки с «Алисой» нет, ограничений по времени тоже. Единственное — при общении с ребёнком включается безопасный режим. В нём помощник блокирует выдачу контента с матом и откровенными сценами.

Напрягает и другой факт. В разработке детского режима не принимали участия психологи и другие профессионалы, ориентированные на работу с детьми. Это исключительно разработка «Яндекса», и её процесс взаимодействия с детьми не контролируется.

Фото © Shutterstock

Детский режим у «Алисы» — не инновация среди смарт-колонок и не самое совершенное решение. Голосовой помощник Alexa от Amazon предлагает систему родительского контроля Kids+, она удобнее и универсальнее. Родитель лучше контролирует поток контента, который получает ребёнок. На специальной панели он может управлять фильтрами и выбрать, какой тип контента можно отображать, а какой нет, устанавливать временные ограничения — например, ребёнок может пользоваться устройством лишь два часа в сутки. Кроме того, в 2018 году была выпущена Echo Dot, колонка компании, специально ориентированная на детей. «Алиса» — универсальное устройство, и внимания к детям там меньше.

Опасно ли пользоваться колонками и почему родители боятся? Что говорят психологи?

  • Названа возможная дата презентации iPhone 12

    23 сентября 2020, 13:02

  • Apple выпустит мини-модель нового iPhone

    21 сентября 2020, 19:27

  • «Что вообще происходит?» Почему iOS 14 — повод сменить iPhone на Android

    20 сентября 2020, 06:30

Настороженность спровоцирована неизвестностью. Для родителей гаджеты вроде голосовых помощников — новое, плохо изученное устройство. Они сами не сталкивались с ними и не могут оценить их влияние на человека, отсюда и боязнь за ребёнка.

Родителей пугает не «Алиса» и не гаджеты, их пугает непонятность и неизвестность того, чего в их личном опыте не было: ни в их опыте как детей, ни в их опыте как взрослых. Многие взрослые не знают об «Алисе» и многих других полезных гаджетах, потому что не знают о них вообще и потому что зачастую знакомы даже не со всеми функциями своего смартфона, — говорит кандидат педагогических наук Елена Богданова.

Насчёт стёртой грани между виртуальной и материальной реальностью переживать тоже не стоит. Важность виртуальной реальности давно возросла в нашей жизни, это нормально, что ей уделяется много времени. И дальше ей будет уделяться ещё больше внимания.

С точки зрения строения психического аппарата нас должно пугать, когда стирается грань между реальностью и фантазией. Когда человек не понимает, где заканчивается его воображение и начинается материальный мир. А виртуальная реальность, нематериальная, к этому не относится. Это не воображение, а часть реальности, — считает семейный психолог Анна Хныкина.

«Умную» колонку могут взломать. Она уязвимее операционных систем смартфона и компьютера

Главная проблема голосовых ассистентов и смарт-колонок — высокая уязвимость перед хакерскими атаками. Виной тому беспечность самих пользователей — они уделяют мало внимания безопасности. Колонку нужно стабильно обновлять, за загрузкой апдейтов нужно следить.

Фото © Depositphotos

Недавно все устройства с Bluetooth оказались уязвимы перед взломом. В их число входят и смарт-колонки. Эксперты CERT и Bluetooth Special Interest Group (SIG) нашли уязвимость — BLURtooth. С её помощью хакер может подключиться к устройству, перехватить данные и взять его под контроль.

Уровень безопасности голосовых помощников весьма низкий. В частности, смарт-колонки подвержены уязвимостям в протоколе Bluetooth, как и прочие устройства с этим типом связи. Также для защиты данных требуется регулярная установка обновлений. Голосовые ассистенты требуют усиленного внимания к безопасности и защите от взлома, — рассказали Лайфу в пресс-службе Group-IB.

На практике опасения экспертов оправдывают себя: взломать умную колонку крайне просто. И при этом можно получить серьёзный урон, потому что она является сердцем умного дома. В прошлом году команда Light Commands заметила, что чувствительность колонок позволяет активировать их не только голосовой командой, но и лазером. Так злоумышленник может открыть электронный замок и попасть в дом.

Компания заостряет внимание на обновлениях. Последняя версия программного обеспечения всегда лучше защищена от хакеров. Если колонка не обновляется, не пользуйтесь ею и смените её. Также Group-IB рекомендует использовать стойкие уникальные пароли.

Почему детей нельзя лишать технологий? И как ограничивать их время с колонкой?

Доставка несчастья. Новый способ интернет-мошенничества угрожает фанатам «Яндекс.Еды» и «Перекрёстка»

Психолог Анна Хныкина успокаивает родителей и рекомендует не переживать на тему вовлечённости детей в технологии. Наибольший стресс вызывают эпизоды, когда ребёнок пытается взаимодействовать с реальными предметами как с виртуальными. Это нормально. Такое может возникнуть из-за переутомления, но о нарушении психики точно не свидетельствует.

Фото © Shutterstock

Такое бывает и у взрослых людей. Попытка взаимодействовать с реальными предметами как с виртуальными — это нормально. Мозгу нужно время, чтобы переключиться из одного процесса в другой, — говорит эксперт.

Ещё один страх: из-за вовлечённости в цифровые технологии у детей снижаются творческие способности и интеллект. Например, они хуже рисуют и не умеют завязывать шнурки. Психолог Анна Хныкина объясняет это тем, что у детей, с раннего возраста погружённых в гаджеты, мозг работает быстрее рук, отсюда и трудности с рисованием и прочим. Но, по её словам, это не является проблемой.

Кроме того, отказ от гаджетов навредит ребёнку, а не поможет. Это усложнит процесс социализации: у ребёнка не окажется общих тем со сверстниками, ему будет трудно адаптироваться к взрослой жизни, когда владение устройствами и приложениями — уже навык по умолчанию.

Важно знать меру и самостоятельно контролировать степень пользования ребёнка гаджетами. Тогда он получит от них исключительно пользу.

Это вопрос меры и баланса. Крайности создают люди, когда не способны определиться с мерой и договориться, когда и сколько времени можно проводить с гаджетом и без. Нужно решить этот вопрос. Это не проблема гаджетов, это проблема отношений между людьми, — говорит Елена Богданова.

При этом есть и противоположная точка зрения. Одна из школ в Великобритании выяснила, что отказ от устройств повышает успеваемость учащихся. Дети, относившиеся к группе с низкой успеваемостью, стали лучше учиться. Такого же мнения придерживаются и в Силиконовой долине. Причём в дорогих частных школах, где устройства запрещены, учатся и дети IT-специалистов, разрабатывающих те самые гаджеты. Они создают их и при этом не доверяют им. «Яндекс», в свою очередь, навязывает вашему ребёнку колонку почти бесплатно.

Алиса. Как Яндекс учит искусственный интеллект разговаривать с людьми / Блог компании Яндекс / Хабр Уже сейчас приложения распознают точные голосовые команды, заложенные в них разработчиками, но с развитием технологий искусственного интеллекта они научатся понимать значение произвольных фраз и даже поддерживать разговор на любую тему. Сегодня мы расскажем читателям Хабра, как мы приближаем это будущее на примере Алисы, первого голосового помощника, который не ограничивается набором предопределенных ответов и использует для общения нейронные сети.

Несмотря на кажущуюся простоту, голосовой помощник — один из самых амбициозных технологических проектов Яндекса. Из этого поста вы узнаете о том, с какими трудностями сталкиваются разработчики голосового интерфейса, кто на самом деле пишет ответы для виртуальных помощников и что общего у Алисы с искусственным интеллектом из фильма «Она».

На заре своего существования компьютеры в основном использовались на крупных научных или оборонных предприятиях. Тогда о голосовом управлении думали только в фантастике, а в реальности операторы загружали программы и данные с помощью куска картона. Не самый удобный способ: одна ошибка, и нужно начинать все сначала.

С годами компьютеры стали более доступными и стали использоваться в небольших компаниях. Специалисты управляют ими с помощью текстовых команд, вводимых в терминале. Хороший, надежный способ — используется в профессиональной среде и по сей день, но требует подготовки. Поэтому, когда в домах обычных пользователей стали появляться компьютеры, инженеры стали искать более простые способы взаимодействия машины и человека.

В лаборатории Xerox зарождается концепция графического интерфейса WIMP (Windows, Icons, Menus, Point-n-Click) — она нашла широкое применение в продуктах других компаний. Больше не нужно было запоминать текстовые команды для управления домашним компьютером — их заменили жесты и щелчки мышью. Для своего времени это была настоящая революция. И вот мир приближается к следующему.

Сейчас почти у каждого в кармане есть смартфон, вычислительной мощности которого хватит, чтобы отправить корабль на Луну. Пальцы заменили мышь и клавиатуру, но с ними мы совершаем все те же жесты и щелчки. Это удобно делать сидя на диване, а не в дороге или на ходу. В прошлом для взаимодействия с компьютерными интерфейсами человеку приходилось изучать язык машин. Мы считаем, что сейчас самое время научить устройства и приложения общаться на языке людей. Эта идея легла в основу голосового помощника Алисы.

Алису можно спросить [Где поблизости можно попить кофе?], а не диктовать что-то типа [кофейня улица космонавтов]. Алиса посмотрит в Яндексе и предложит подходящее место, а на вопрос [Отлично, как добраться?] даст ссылку на уже построенный маршрут в Яндекс.Картах. Она умеет отличать точные вопросы по факту от желания увидеть классические результаты поиска, хамство — от вежливой просьбы, команду открыть сайт — от желания просто поболтать.

Может даже показаться, что где-то в облаке работает чудо-нейронная сеть, которая в одиночку решает любые задачи. Но на самом деле за ответом Алисы кроется целая цепочка технологических проблем, которые мы учимся решать 5 лет. И начнем мы нашу экскурсию с самого первого звена — с умения слушать.

Привет Алиса

Искусственный интеллект из научной фантастики умеет слушать — людям не нужно нажимать на специальные кнопки, чтобы включить «режим записи». А для этого нужна голосовая активация — приложение должно понимать, что к нему обращается человек. Это не так просто, как может показаться.

Если просто запустить запись и обработку всего входящего аудиопотока на сервер, то очень быстро разряжается батарея устройства и расходуется весь мобильный трафик.

В нашем случае это решается с помощью специальной нейросети, которая обучена исключительно распознавать ключевые фразы («Привет, Алиса», «Слушай, Яндекс» и некоторые другие). Поддержка ограниченного количества таких фраз позволяет выполнять эту работу локально и без обращения к серверу.

Если сеть научится понимать всего несколько фраз, можно подумать, что сделать это достаточно просто и быстро. Но нет. Люди произносят фразы в далеко не идеальных условиях, но в окружении совершенно непредсказуемого шума. И у всех разные голоса. Поэтому, чтобы понять всего одну фразу, нужны тысячи обучающих конспектов.

Даже небольшая локальная нейросеть потребляет ресурсы: нельзя просто взять и начать обрабатывать весь поток с микрофона. Поэтому во главе угла используется менее тяжеловесный алгоритм, который быстро и дешево распознает событие «речь началась». Именно он включает нейросетевой движок распознавания ключевых фраз, который в свою очередь запускает самую сложную часть — распознавание речи.

Если для обучения всего одной фразе нужны тысячи примеров, то можете себе представить, насколько кропотливо обучить нейросеть распознавать любые слова и фразы. По той же причине распознавание выполняется в облаке, куда передается звуковой поток и откуда возвращаются готовые ответы. Точность ответов зависит от качества распознавания. Именно поэтому основная задача состоит в том, чтобы научиться распознавать речь так же хорошо, как человек. Кстати, люди тоже ошибаются. Считается, что человек узнает 96-98% речи (метрика WER). Нам удалось добиться точности 89-95%, что не только сравнимо с уровнем живого собеседника, но и уникально для русского языка.

Но даже речь, совершенно преобразованная в текст, ничего не будет значить, если мы не сможем понять смысла сказанного.

Какая завтра погода в Санкт-Петербурге?

Если вы хотите, чтобы ваше приложение отображало прогноз погоды в ответ на голосовой запрос [погода], то тут все просто — сравните распознанный текст со словом «погода» и при совпадении выведите ответ. И это очень примитивный способ взаимодействия, потому что в реальной жизни люди задают вопросы по-другому. Человек может спросить помощника [Какая завтра погода в Питере?], и его это не должно смущать.

Первое, что делает Алиса, когда получает вопрос, — распознает сценарий. Отправить поисковый запрос и показать классические результаты с 10 результатами? Искать один точный ответ и тут же давать его пользователю? Выполнить действие, например открыть веб-сайт? А может просто поговорить? Научить машину точно распознавать сценарии поведения невероятно сложно. И любая ошибка здесь неприятна. К счастью, у нас есть вся мощь поисковой системы Яндекс, которая каждый день сталкивается с миллионами запросов, ищет миллионы ответов и учится понимать, какие из них хорошие, а какие нет. Это огромная база знаний, на базе которой можно обучить другую нейросеть — такую, которая с большой долей вероятности «поймет», чего именно хочет человек. Ошибки, конечно, неизбежны, но люди их тоже совершают.

С помощью машинного обучения Алиса «понимает», что фраза [Какая завтра погода в Санкт-Петербурге?] является запросом погоды (кстати, это явно простой пример для иллюстрации). Но о каком городе идет речь? На какой день? Здесь начинается этап получения распознавания именованных объектов из пользовательских реплик. В нашем случае важную информацию несут два таких объекта: «Питер» и «завтра». А Алиса, за плечами которой технологии поиска, «понимает», что «Питер» — это синоним «Санкт-Петербург». Санкт-Петербург», а «завтра» — это «текущая дата + 1».

Естественный язык — это не только внешняя форма наших сигналов, но и их связность. В жизни мы не обмениваемся короткими фразами, а ведем диалог — это невозможно, если не помнить контекст. Алиса запоминает его — это помогает ей справляться со сложными языковыми явлениями: например, справляться с многоточием (восстановлять пропущенные слова) или разрешать кореференции (определять объект по местоимению). Так вот, если спросить [Где находится Эльбрус?], а потом указать [А какая у него высота?], то помощник найдет правильные ответы в обоих случаях. А если после вопроса [Какая сегодня погода?] спросить [А завтра?], Алиса поймет, что это продолжение диалога о погоде.

И еще кое-что. Помощник должен не только понимать естественный язык, но и уметь на нем говорить — как человек, а не как робот. Для Алисы мы синтезируем голос, изначально принадлежавший актрисе дубляжа Татьяне Шитовой (в России официальный голос — Скарлетт Йоханссон). Она озвучивала искусственный интеллект в фильме «Она», хотя вы могли помнить ее по голосу чародейки Йеннифэр в «Ведьмаке». Причем речь идет о достаточно глубоком синтезе с помощью нейросетей, а не о нарезке готовых фраз — записать все их разнообразие заранее невозможно.

Выше мы описали особенности естественного общения (непредсказуемая форма реплики, пропущенные слова, местоимения, ошибки, шум, голос), с которыми нужно уметь работать. Но у живого общения есть еще одно свойство – мы не всегда требуем от собеседника конкретного ответа или действия, иногда нам просто хочется поговорить. Если приложение отправит такие запросы в поиск, то вся магия будет уничтожена. Именно поэтому популярные голосовые помощники используют базу редакционных ответов на популярные фразы и вопросы. Но мы пошли еще дальше.

Чат?

Мы научили автомобиль отвечать на наши вопросы, вести диалог в контексте определенных сценариев и решать проблемы пользователей. Это хорошо, но можно ли сделать ее менее бездушной и наделить человеческими свойствами: дать ей имя, научить говорить о себе, поддерживать беседу на свободные темы?

В индустрии голосовых помощников это достигается с помощью редакционных ответов. Специальная команда авторов берет у пользователей сотни самых популярных вопросов и на каждый пишет несколько ответов. В идеале это нужно делать в едином стиле, чтобы из всех ответов формировалась вся личность помощника. Для Алисы тоже пишем ответы — но у нас другое. Что-то особенное.

Помимо топа популярных вопросов есть длинный хвост низкочастотных или даже уникальных фраз, на которые заранее подготовить ответ невозможно. Вы уже догадались, как мы решаем эту проблему, верно? Использование другой модели нейронной сети. Для ответов на неизвестные ей вопросы и замечания Алиса использует нейросеть, обученную на огромной базе текстов из интернета, книг и фильмов. Ценителям машинного обучения может быть интересно, что мы начали с 3-х слойной нейросети, а сейчас экспериментируем с огромной 120-слойной. Детали прибережем для профильных постов, а здесь скажем, что текущая версия Алисы пытается отвечать на произвольные фразы с помощью «нейросетевого говоруна» — как мы его называем внутри.

Алиса узнает из огромного количества различных текстов, в которых люди и персонажи не всегда ведут себя вежливо. Нейронная сеть может вообще не научиться тому, чему мы хотим ее научить.

— Закажи мне бутерброд.
— Управляй.

Как и любого ребенка, Алису нельзя научить не хамить, оберегая ее от всех проявлений грубости и агрессии — то есть обучая нейросеть на «чистой» базе, где нет хамства, провокаций и прочих неприятных вещей, которые часто встречается в реальном мире. Если Алиса не знает о существовании таких выражений, она будет отвечать на них бездумно, случайными фразами — для нее они так и останутся неизвестными словами. Дайте ей лучше узнать, что это такое — и выработайте определенную позицию по этим вопросам. Если вы знаете, что такое мат, то можете либо ругаться в ответ, либо говорить, что с руганью разговаривать не будете. И моделируем поведение Алисы так, чтобы она выбрала второй вариант.

Бывает, что собственная реплика Алисы полностью нейтральна, но в заданном пользователем контексте ответ перестает быть безобидным. Однажды во время закрытого тестирования мы попросили пользователя найти какое-то заведение — кафе или что-то в этом роде. Он сказал: «Найди еще одну такую ​​же». И в этот момент в Алисе случился баг, и вместо запуска скрипта поиска организации она дала довольно дерзкий ответ — что-то вроде «поищи на карте». И ничего не искала. Пользователь сначала удивился, а потом удивил и нас, похвалив поведение Алисы.

Когда Алиса использует «нейросетевой говорун», в ней может проявиться миллион разных личностей, так как нейросеть впитала понемногу от автора каждой реплики из обучающей выборки. В зависимости от контекста Алиса может быть вежливой или грубой, веселой или депрессивной. Но мы хотим, чтобы личный помощник был целостной личностью с четко определенным набором качеств. Здесь на помощь приходят наши редакционные тексты. Их особенность в том, что изначально они были написаны от лица той личности, которую мы хотим воссоздать в Алисе. Получается, что можно и дальше тренировать Алису на миллионах строк случайных текстов, но отвечать она будет с оглядкой на стандарт поведения, заложенный в ответах редакции. И это то, над чем мы уже работаем.

Алиса стала первым известным нам голосовым помощником, который пытается поддерживать общение не только с помощью ответов редакции, но и с помощью обученной нейросети. Конечно, нам еще очень далеко до того, что изображают в современной фантастике. Алиса не всегда точно распознает суть реплики, что влияет на точность ответа. Поэтому у нас еще много работы.

Мы планируем сделать Алису самым гуманоидным помощником в мире. Чтобы привить ей сочувствие и любопытство. Сделать его проактивным — значит научить вас ставить цели в диалоге, проявлять инициативу и вовлекать собеседника. Сейчас мы находимся и в самом начале пути, и в авангарде наук, изучающих эту область. Чтобы двигаться дальше, вы должны сдвинуть этот край.

Пообщаться с Алисой можно в приложении Яндекс для Android и iOS, в Бета-версиях для Windows, а вскоре и в Яндекс.Браузере. Нам было бы интересно обсудить, каким вы видите будущее голосового интерфейса и сценарии его использования.

Голосовые помощники: шутки Кортаны и сбережения Алисы

Согласно исследованию eMarketer, только в США количество устройств с голосовыми помощниками достигнет 67 миллионов. Такое решение достаточно удобно. Они позволяют оперативно найти ответ на вопрос, вызвать такси, заказать товар, позвонить, проложить маршрут или просто поговорить о посторонних вещах.

Голосовой помощник — это сервис на основе искусственного интеллекта, способный распознавать человеческую речь и выполнять определенные действия в ответ на голосовую команду. Голосовые помощники чаще всего применяются в смартфонах, умных колонках и браузерах.

В 2018 году было внедрено огромное количество таких решений. Поэтому исследователи из маркетингового агентства Stone Temple Consulting решили сравнить интеллектуальные возможности помощников, задав им вопросы различной сложности. Вот финалисты:

  • Google Ассистент: 100% правильных ответов;
  • Cortana: 90% правильных ответов;
  • Alexa: 80% правильных ответов;
  • Siri: 80% правильных ответов.

Поскольку исследование было сосредоточено на рынке США, Алиса не была включена в рейтинг. Тем не менее, решение Яндекса не уступает зарубежным аналогам и может предложить российским пользователям больше возможностей, чем другие помощники.

Рассмотрим преимущества и недостатки пяти голосовых помощников.

Google Assistant — это самая продвинутая версия одного из первых голосовых помощников Google. Он совместим с Android, iOS и браузером Chrome. Google Assistant интегрирован со всеми сервисами Google и умеет вести диалог. Однако русский язык доступен только в тестовом режиме.

Плюсы.  Этот помощник узнает все, что сможет, о своем владельце. Этот факт определенно пугает, но таким образом виртуальный помощник от Google стал самым точным среди других. Google Ассистент отлично прокладывает оптимальные маршруты до дома с учетом местоположения пользователя, предлагает подборку новостей, а также анализирует электронные письма и поисковые запросы. Кроме того, его можно интегрировать с некоторыми внешними сервисами: управление заметками на смартфонах, чтение сообщений и воспроизведение музыки.

Минусы.  В отличие от других участников топ-листа, Google Ассистент не стремится завоевать ваше доверие. Его голос монотонный и холодный, что не способствует общению.

Cortana, Microsoft

Cortana — виртуальный помощник от Microsoft. Он доступен для Windows, iOS и Android, но его возможности ограничены в последних двух.

Плюсы. После нескольких лет бездействия Кортана стала более интересным чат-ботом. Помощник обладает отличным чувством юмора и может предложить множество забавных ответов на ваши шутки. Кортана умеет управлять напоминаниями и календарем, отслеживать посылки, ставить будильник и искать новости. Он взаимодействует с несколькими приложениями Windows и с недавнего времени может общаться с другими ботами через Skype. Если вы спросите, он процитирует Шекспира.

Минусы. Отсутствие русского языка.

Alexa, Amazon

Alexa — один из самых популярных ботов в мире. Виртуальный помощник встроен во все аудиоустройства Amazon (Echo, Echo Dot, Tap) и в консоль Fire TV.

Плюсы. Alexa может воспроизводить музыку и читать новости из нескольких источников. Он предоставляет информацию о погоде и пробках, а также заказывает товары на Amazon Prime с помощью голоса. Он поддерживается большим количеством умной бытовой техники. В отличие от остальных помощников, Alexa может работать с любым внешним приложением или сервисом благодаря открытому API.

Минусы. Русский язык отсутствует. Помощник не совместим со смартфонами, поэтому его можно применять только дома. Кстати, не удивляйтесь, если любой ваш запрос приведет к рекомендации купить что-то на Amazon.

Siri, Apple

Siri — это голосовой помощник Apple, который работает только на ее устройствах.

Плюсы.  Siri хорошо понимает естественную речь. Он быстро обрабатывает запросы новостей, погоды, спорта, фильмов и маршрутов. Помощник может установить необходимый будильник. В отличие от Google Assistant, Siri взаимодействует с некоторыми элементами умного дома. Умеет вести диалог и давать подсказки. Наличие множества языков, включая русский.

Минусы.  Отсутствие открытого API означает, что Siri не сможет воспроизвести песню в Spotify, добавить задачу в Slack и прочитать сообщение в Viber. На фоне конкурентов ограниченные возможности этого голосового помощника выглядят довольно странно: совместимость с внешними приложениями является обязательным дополнением для других помощников.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *