Technologie do monitorowania rozmów z klientami

3 min.

4 321

W poprzednim tekście pisałam o rozwiązaniach Speech Analytics jako MUST HAVE dla tych firm, które wysoki poziom obsługi klienta wpisują w swoją strategię wzrostu biznesu. (Jedyny słuszny monitoring rozmów)

Jakie mamy na rynku technologie i czym się należy kierować przy ich wyborze? Jak w większości życiowych przypadków … to zależy ;-)

Analityka mowy to proces analizy nagranych rozmów telefonicznych z klientami. W praktyce mamy do czynienia z dwoma systemami rozpoznawania mowy: fonetycznym i LVCSR (large-vocabulary continuous speech recognition). Oba pozwalają na analizowane rozmów z klientami w celach gromadzenia informacji o jakości obsługi w call center, o zachowaniach klientów, dla potrzeb szkoleniowych czy – co jest główną kryterium inwestycji w takie rozwiązanie – dla szybkiej identyfikacji problemów i kryzysów w firmie.

Wybór odpowiedniej sprowadza się do zrozumienia, jakiego rodzaju informacje chcemy otrzymywać z nagranych rozmów.

Fonetyczny system indeksowania i wyszukiwania rozmów

W uproszczeniu, analiza fonetyczna opiera się na założeniu istnienia w mowie skończonej liczby jednostek fonetycznych. Działa ona w ten sposób, że rozpoznaje ona w poszczególnych słowach fonemy, czyli najmniejsze jednostki dźwięku, które mogą coś znaczyć, po czym łączy się te fonemy w określone słowa (zapisane w słowniku).

W praktyce system fonetyczny analizuje rozmowę, dzieli słowa na fonemy. Na przykład, gdy szukamy w rozmowach słowa „dziękuję”, system konwertuje to słowo na fonemy, znajduje dopasowania i generuje nam raport z takimi rozmowami.

Jest to wspaniały system, jeśli chcemy wyszukiwać słowa, których jeszcze nie zna słownik. Wadą, jak łatwo się domyślić, jest to, że mamy dużo bliskich, ale nie całkiem trafionych wyników. Na przykład zamiast "sklep" otrzymamy "klep" czy „zlep”. Spędzimy dużo czasu na eliminacji fałszywych trafień. Podsumowując, wysoki zwrot wyników, niski poziom dokładności i ręczna obróbka rekordów.

LVCSR (large-vocabulary continuous speech recognition) znany również jako speech-to-text, automatic speech recognition

Ten system rozpoznawania mowy również rozpoznaje fonemy, ale grupuje je w słowa, które znajdują się w słowniku systemu. Czyli zamiast szukać określonego fonemu, system szuka wybranych słów kluczowych. Oznacza to dużo pracy na początku, więcej czasu zajmuje wygenerowanie wyników (system szuka fonemów i tysięcy pasujących słów), ale są one bardziej dokładne. Mniejsza jest częstotliwość występowania “fałszywych” rekordów. W efekcie system jest szybszy niż fonetyczny.

Rozbudowaną formą jest Direct Phrase Recognition, gdzie zamiast konwersji mowy na fonemy lub tekst, bezpośrednio analizuje się mowę, szuka konkretnych fraz, które zostały wstępnie określone jako istotne dla firmy. Ponieważ żadne dane nie zostaną utracone w konwersji za pomocą tej metody, wyniki na ogół zapewniają najwyższą niezawodność danych.

Który system wybrać?

Dr Marie Meteer, w doskonałym artykule zatytułowanym “Choosing the Right Technology for your Speech Analytics Project” stwierdza, że "systemy fonetyczne są świetne, jeśli szukasz rzadkich zdarzeń i słów, które mogą wystąpić tylko raz. Na przykład, jeśli chcesz wiedzieć, czy ktoś kto do firmy zadzwonił i użył słowa AMAZON”

Systemy fonetyczne są również idealne do szybkiego przetwarzania dużej liczby nagrań pod warunkiem, że nie robimy tego często. Jeśli wyszukiwanie wygeneruje wiele fałszywych rekordów i nie jest to dla nas niedogodnością czy zagrożeniem, systemy fonetyczne są w porządku.

Systemy LVCSR, oparte na wyszukiwanych słów kluczowych są bardziej przydatne, jeśli szukamy zdarzających się powszechnie zdarzeń jak reklamacje, rezygnacje, zwroty, dostawa. Czyli takich, które są nieodłączną i niepokojącą częścią każdej biznesowej działalności. Jeśli nie mamy zasobów ludzkich do żmudnego przeglądania raportów z systemu fonetycznego, jeśli chcemy więcej dokładnych i trafnych wyników – ten system jest dla nas.

Zaletą LVCSR jest też to, że daje nam kontekst. Jeśli ogólnym celem analityki rozmów jest odkrywanie różnych zależności, powiazań, trendów i zdobywanie informacji – to jest odpowiednie rozwiązanie.

Oczywiście najlepszą wydajność otrzymamy łącząc obie opcje w dobrze zintegrowany, wydajny system.

Jeśli Twoja firma rozważa implementację Speech Analytics, tu możesz ściągnąć opracowanie wyjaśniające działanie, korzyści i zwrot z inwestycji.

analiza mowy