Какие тонкости речи способны учитывать ИТ-системы в call-центрах?
В современном мире стремительно развиваются Интернет и сети передачи данных, все более искушенными и требовательными становятся потребители услуг, что заставляет совершенствовать технологии. Устройства стремительно «умнеют» и предлагают широкий выбор возможностей для запроса и предоставления контента.
Сегодня нет недостатка в средствах доступа к информации. Важно, чтобы они соответствовали современным требованиям: точность, достоверность, простота и высокая скорость получения данных.Отдельно хотелось бы рассказать о решениях, использующих возможности голоса. Они внедряются повсеместно, хотя еще не так давно это казалось чем-то немыслимым и даже фантастическим. Всего несколько лет назад трудно было представить, что возможна аутентификация клиентов по голосу, голосовое управление системами самообслуживания для получения информации от контакт-центра или автоматический анализ всего объема записанных разговоров, например, в целях контроля качества работы операторов или определения эффективности проведения рекламной кампании. Сегодня это вполне работающие решения.
Голосовая идентификация
С человеческого голоса достаточно легко можно сделать «отпечаток», чтобы впоследствии использовать его для распознавания личности. Благодаря характерным искажениям звука, обусловленным строением гортани, носа и другим индивидуальным особенностям звуковоспроизведения, каждый голос является уникальным настолько, что при наличии голосового слепка человека, его можно идентифицировать по речи с очень высокой точностью. Это очень похоже на проверку родства по ДНК.
При этом голосовой отпечаток не привязывается, обственно, к речи человека (конкретным словам или определённой фразе), а характеризует голос в целом.
Сравнение речи человека с отпечатком голоса строится с помощью анализа опорных точек в речи, например, характерных для переходов между звуками. Система реагирует на различные физические характеристики: всего учитывается около 70 биометрических показателей, в числе которых: акцентированные звуки, особенности произношения, темп речи, тип произношения слов и звуков, физические характеристики голоса.
Точность идентификации зависит от качества соединения, наличия посторонних шумов и длительности разговора, в течение которого надо определить ключевые особенности речи и найти идентичный слепок в базе данных. В среднем распознавание голоса занимает 5–15 секунд, точность при этом варьируется от 80 до 100% в зависимости от качества канала связи. В итоге, когда клиент звонит и начинает говорить, система уже запускает процесс идентификации.
Чем может быть полезна эта технология?
Например, компания имеет голосовые отпечатки потенциальных мошенников (или ещё какой-то список людей под особым контролем), и примерно первые 10 секунд общения клиента с оператором контакт-центра происходит сравнение его речи с голосовыми отпечатками из этой базы данных. Если абонент там обнаружен, оператор получает соответствующий сигнал. Также срабатывают другие уведомления, например, для службы безопасности.
Или - нужно подтверждение личности клиента, чтобы предоставить ему доступ к информации по счету. Сравнив его голос с зарегистрированным в базе данных отпечатком, система подтвердит его личность и откроет доступ к данным.
Аналитика речи
Отдельно можно выделить системы речевой аналитики (Speech Analytics), которые получают все большее применение именно в профессиональных контакт-центрах. Они помогают отследить паузы, фиксировать моменты, когда говорящие перебивают друг друга или меняется интонация беседы, выявлять неточности следования стандартному скрипту, проводить мониторинг по заданным категориям слов, причем для всех 100% записанных разговоров. Применять их можно в различных ситуациях. Например, для оценки качества работы. Скажем, распознавание ключевых слов или фраз помогает выявить, кто из операторов невежливо и некомпетентно строит диалог, либо использует слова-паразиты. Супервайзер получает аналитику по этой теме, может прослушать диалоги, существенно сокращая время на поиск нужного разговора.
Дополнительную информацию такие системы получают с помощью анализа эмоциональной окраски речи. В зависимости от вашего эмоционального состояния меняется фактическая частота тех или иных звуков в речи, а также высота произнесения некоторых гласных. По большей части алгоритмы определения эмоционального состояния закрыты. Точность у них не очень высокая, поэтому одно из немногих практических применений - это знание того, в каком состоянии клиент звонил несколько раз до этого. На российском рынке анализ эмоций используют в дополнение к аналитике речи, для более точной расшифровки «плохих» или «хороших» вызовов. Серьезный интерес к подобным решениям замечен со стороны коллекторских агентств, сотовых операторов, крупных банков, сетевых ритейлеров, дистрибьюторов и даже от государственных компаний.
Системы голосового управления и синтеза речи
В центрах обработки вызовов могут использоваться комплексные решения. Например, система голосового управления (Interactive Voice Response, IVR), функционирующая совместно с технологиями распознавания (Automatic Speech Recognition, ASR) и синтеза речи (Text-to-Speech, TTS). Чаще всего IVR используется для того, чтобы озвучить позвонившему какое-то конкретное число: баланс на счету, сумму следующего платежа по кредиту. Проще говоря, IVR умеет обращаться в базу данных, забирать оттуда информацию по определённым правилам и зачитывать это клиенту. Синтез речи используется и для проведения обзвона по базе клиентов. Так, в розничных сетях для подтверждения заказа может перезвонить робот, чтобы подтвердить дату и время доставки. Или такой пример из нашей практики — простой, но в то же время удобный сервис для поиска ближайших банкоматов. Клиент называет свое местоположение и в ответ получает адреса ATM и отделений с актуальной информацией о времени их работы.
Голосовое управление предоставляет бизнесу множество интересных возможностей: сокращается время обслуживания клиентов, снижается нагрузка на операторов call-центра. За меньшее время система способна обслужить большее число пользователей, а значит, компания в целом более эффективно использует свои ресурсы. Как показывает практика, потребители уже готовы работать с автоматизированной системой с голосовым управлением и не испытывают неудобства, а иногда даже и не подозревают, что общаются с автоматом.
Автор: Сергей Чеховских, руководитель направления call-центров компании КРОК
Изображение: Vladimir Engel/123rf.com
Свежие комментарии