Главная блога

Как работают виртуальные агенты: главные навыки голосовых помощников

Рутинные задачи все чаще решают с помощью ИИ. Автоматизация простых, но трудоемких процессов экономит деньги компании и освобождает время сотрудников. Neuro.net создает технологии для автоматизации колл-центров и развития возможностей виртуальных агентов. Наши ИИ-агенты умеют консультировать, проводить опросы и анализировать информацию, оказывать поддержку клиентам. А главное, строить осмысленный диалог: узнать виртуального агента получается только у 1% собеседников.

Рассказываем о навыках и обучении современных голосовых помощников и о том, почему правильно понимать фразы собеседника — это еще не все.

Виртуальные агенты Neuro.net эффективно работают благодаря нескольким технологическим особенностям. Они умеют:

  • распознавать эмоции, пол и возраст собеседника;
  • строить осмысленный диалог.

Обсудим, чем может быть полезна каждая из функций — и как это работает.

Голос и пол

Функцию распознавания пола собеседника придумали для голосовых агентов, которые проводили опросы. Анкеты обычно включают пункт “пол респондента”. Если звонок делает человек, ему не нужно спрашивать, с кем он говорит: с мужчиной или с женщиной. А вот для электронного собеседника это было настоящей проблемой.

Почему это важно? Агент, который может определить пол собеседника, не только естественнее строит диалог, но и может персонализировать общение.

Как это работает? Сначала цифровой агент обрабатывает небольшой (до 20 мс) фрагмент разговора. Он очищает речь от посторонних шумов, затем преобразует ее в понятные системе данные и распознает пол по определенным коэффициентам (тембральные резкость, теплота, глубина и т.д.). Агенты, которые не работают с этими коэффициентами, могут принять ребенка за женщину, неверно распознать высокий мужской или грубый женский голос и определить собеседника, как мужчину, если он сказал “hello”, а затем кашлянул.

Цифровой оператор может определять пол как во время разговора по первой фразе клиента, так и в оффлайн режиме на основании записи. В более чем 95% диалогов пол распознается правильно. А еще электронному собеседнику требуется на это всего 120-150 мс. Отсутствие долгих пауз делает разговор естественным.

Возрастные категории

Функция определения возраста разрабатывалась для решения 2-х основных задач:

  • Чтобы цифровой оператор определял несовершеннолетних собеседников и не предлагал им участие в опросах, которые не ориентированы на эту группу;
  • Чтобы персонализировать диалоги.
    Распознавать возраст агент может благодаря тем же технологиям, которые помогают ему отличать мужчин от женщин. Точность определения здесь превышает 90%.

Распознавание эмоций

С помощью данной функции виртуальный агент может по голосу определить настроение собеседника: негативное, нейтральное или позитивное. Это позволяет настроить соответствующий ход диалога. Например, если клиент позвонил с негативными эмоциями, и во время разговора негатив сохраняется, то ИИ-агент понимает, что лучше перевести звонок на эксперта-человека. А если негативные эмоции сменились на позитивные (так бывает в большинстве случаев), значит, все идет хорошо и переключать клиента на человека нет необходимости. Как и в случае с распознаванием пола и возраста, в основе технологии заложены алгоритмы машинного обучения.

Искусство диалога

Голосовые агенты — хорошие собеседники. В отличие от простых чат-ботов и умного меню IVR они могут поддерживать сложные диалоги и развивать тысячи сценариев беседы.

Оптимальное решение для исходящих звонков — линейный сценарий. Например, если агент проводит опрос, нам неважно, что именно ответит собеседник. Зато очень важно пройтись по всем вопросам из списка.

А вот для технической поддержки или колл-центра лучше подходят нелинейные сценарии. Цифровому оператору предстоит выяснить, кто ему звонит и по какому вопросу. Поэтому очень важно, что именно будет отвечать собеседник.

Современные голосовые агенты строят диалог благодаря глубокому обучению нейросетей. Они могут обучаться на накопленных данных и со временем все лучше понимают смысл сказанного: начинают справляться даже с такими оборотами, как “да нет” или “возможно, нет” Точность распознавания речи доходит до 98%.

Не заменяем, а расширяем возможности

Мы уверены, что наши цифровые агенты на базе голосового ИИ прекрасно справляются с рутинной работой. А со временем мы научим их делать это еще лучше. Агенты снижают нагрузку на колл-центры, затраты на найм сотрудников, на аренду и содержание помещения. Они успешно берут на себя до 80% нагрузки операторов первой линии и оставляют для экспертов-людей только по-настоящему творческие задачи и вопросы.

Готовы начать?

Узнайте, как улучшить клиентский опыт, повысить операционную эффективность вашего бизнеса и достигнуть больших результатов с продуктами от Neuro.net

Выберите язык