Başarılı Bir Diyalogsal Müşteri Yolculuğunun Temeli: Konuşma Tanıma

By October 10, 2020Blog Gönderileri
The Pillar of a Successful Conversational Journey Speech Recognition

Konuşma teknolojileri, müşteri yolculuğunu dönüştürür. Müşterilerin sistemlerle etkileşimde bulunmak için kendi kelimelerini kullanmalarına izin veren konuşma teknolojisi, en doğal iletişim yöntemini sunar ve konuşma yolculuğu, konuşma tanıma teknolojisiyle başlar.

Otomatik konuşma tanıma (ASR) olarak da bilinen Konuşma Tanıma (SR), konuşulan kelimeleri ve cümleleri yakalar ve bunları makine tarafından okunabilir bir biçime dönüştürür. Bu, kullanıcıların, tuşlama veya veya buton gibi geleneksel araçları kullanmak yerine konuşarak cihazları ve sistemleri kontrol etmesine izin veren ilk adımdır.

Konuşma Tanıma neden önemlidir?

İlk adım olarak, konuşma tanımanın doğruluğu, başarılı bir konuşma yolculuğunun anahtarıdır. Sesi doğru şekilde metne çeviremezseniz, müşterilerinizin ne dediğini anlayamaz ve sorunlarını çözemezsiniz. SR’ın doğruluğu, self servis uygulamaların verimliliğini artırır ve şirketlerin gelişmiş müşteri deneyimi sunmasına olanak tanır. SR, konuşma çözümlerini güçlendiren temel teknoloji olduğundan, bir konuşma sisteminin başarısı, SR teknolojisinin yeteneklerine bağlıdır. Diğer bir deyişle, makineler ve müşteriler arasında sorunsuz bir konuşma sağlamak için kapsamlı bir konuşma tanıma çözümü çok önemlidir.

Etkili bir diyalog ürünü sunmak için, SR çözümünüzün;

  • yüksek tanıma doğruluğuna sahip olması
  • gelişmiş doğal dil desteği sunması
  • birden çok dili ve aksanı desteklemesi
  • Yapay zeka (AI), doğal dil işleme (NLP) ve makine öğrenimi (ML) gibi birden fazla teknolojiyle kolayca entegre olması
  • Omnichannel dağıtımı destekleyen esnek bir yapıya sahip olması gerekir.

Sestek SR nasıl öne çıkıyor?

20 Yıllık Birikim

Sestek SR, Sestek’in son derece hassas konuşma çözümleri oluşturmadaki 20 yıllık deneyiminin ürünüdür. İlk günden beri, teknolojimizi daha doğru ve sağlam hale getirmek için çalışıyoruz. Sürdürülebilir Ar-Ge faaliyetleri ve Neural Network (sinir ağları) gibi en son teknolojileri kullanarak Sestek Konuşma Tanıma’yı sürekli geliştiriyor ve tanıma doğruluğunu artırıyoruz.

Uçtan Uca Diyalog

Sestek SR, Sesli IVR, Sanal Asistanlar ve Konuşma Analizi gibi ana ürünlerimizin arkasındaki temel teknolojidir. Ayrıca Sestek SR, çok kanallı otomasyon çözümlerimizin bir bileşenidir. Yani, müşterileriniz için konuşma çözümleri oluşturmak istediğiniz herhangi bir kanalda bu teknolojiden yararlanabilirsiniz.

Farklı Sektörler İçin Özel Üretim

En iyi müşteri hizmetini sunma konusunda her şirketin farklı öncelikleri vardır. Doğru konuşma yolculuğunu inşa etmek için her işletmenin herkese uyan tek bir çözüm yerine özel çözümlere ihtiyacı vardır.

Sestek Konuşma Tanıma’nın son derece özelleştirilebilir yapısı, her şirket için özel olarak hazırlanmış bir konuşma çözümü oluşturmamızı sağlar. Teknoloji, endüstri ve dikey ihtiyaçlara göre belirli dil modelleri ile eğitilebilir.

Yapılması Zor, Uygulanması Zor

Şirket içi kaynaklarla konuşma çözümleri oluşturmak  önemli ölçüde zaman ve çaba gerektirebilir. Deneyimli satıcılarla işbirliği yapmak paradan daha fazla tasarruf sağlayarak kuruluşunuzdaki farkındalığa katkıda bulunabilir. Ancak bu, teknoloji sağlayıcınızla yakın bir ilişki gerektirir. Teknoloji sağlayıcınızın ihtiyaçlarınızı hızlı bir şekilde anlaması ve kanıtlanmış süreçler ve gelişmiş araçlarla akıllı rehberlik sunması gerekir. Sestek, strateji oluşturma, uygulama tasarımı, dağıtım, test ve optimizasyon dahil olmak üzere uçtan uca profesyonel hizmetler sunar. Ekibimizin uzmanlığı, 20 yıllık konuşma çözümleri geliştirmekten kazanılan konuşma teknolojisindeki uygulamalı deneyime dayanmaktadır. Bu, küresel rakiplerimizin dağıt ve unut yaklaşımından en önemli farkımızdır.

SR Doğruluk Testi

Sestek SR, sürekli Ar-Ge çalışmalarımızın ürünüdür. Ürünümüzü en son teknoloji ve yöntemlerle tanıma doğruluğunu artıracak şekilde optimize ediyoruz.

Son zamanlarda, teknolojik bir sıçrama olarak bir sinir ağını kullandığımız yeni bir model geliştirdik. Ve bu modelin başarısını ölçmek için, konuşmadan metne motorumuzun doğruluğunu test ettik. Motorumuzu Google ve IBM’in SR motorlarıyla karşılaştırdık.

Manuel test için, çağrı merkezi kayıtlarından alınan iki set rastgele veri kullandık; tıbbi makalelerin iki set kaydı. Otomatik test için 3 YouTube videosu kullandık.

Manuel testte, kayıtlar dinlenmiş ve tüm otomatik transkripsiyonlu kelime / ifadeler doğru / yanlış olarak etiketlenmiş ve veri seti içinde hesaplanan son kelime-hata oranları yapılmıştır. WER (kelime-hata oranı), SR motorları için yaygın bir ölçüdür; toplam hata kelimesinin (ikameler, silmeler ve eklemeler) referanstaki toplam kelime sayısına oranıdır. Oran ne kadar küçükse, motor o kadar doğru olur.

İlk tablo manuel hesaplamanın sonuçlarını ve ikincisi, referans metin kullanılarak otomatik olarak hesaplanan sonucu gösteriyor. Sonuçlar şöyle:

Manuel Ölçüm

Kelime Hata Oranı (Word Error Rate) Google IBM Sestek Current Sestek New
Temsilci Kaydı %9.0 %11.9 %5.5 %4.0
Müşteri Kaydı %4.9 %6.5 %5.0 %4.2
Medikal Metin 1 %3.4 %4.0 %3.4 %2.
Medikal Metin 2 %3.2 %3.0 %5.8 %4.3

Otomatik Ölçüm

Kelime Hata Oranı (Word Error Rate) Google IBM Sestek Current Sestek New
Youtube’dan videolar %18 %11.5 %9.3 %7.1

Yukarıda görüldüğü gibi, YENİ yaklaşımımız doğruluk için yaklaşık % 30 iyileştirme sağlıyor.

Bu rakamlarla, kesinlikle daha iyi olduğumuzu veya geri kalanının kesinlikle daha kötü olduğunu söylemiyoruz. Konuşma tanıma süreci, geniş bir alanda milyonlarca parametrenin hesaplanmasını ve optimize edilmesini içerir ve büyük ölçüde stokastiktir (istatistiksel olarak analiz edilebilen ancak kesin olarak tahmin edilemeyen model olarak mühendisler dediğimiz şey). Bir teknoloji sağlayıcının SR motoru belirli bir kayıt için diğerlerinden daha iyi performans gösterebilir, ancak aynı motor başka bir motor için daha kötü performans gösterebilir.

SR teknolojimizin Google ve IBM gibi milyar dolarlık teknoloji sağlayıcılarla kolayca rekabet edebileceğini öneriyoruz.

Daha fazla bilgi edin

Konuşma tanıma , konuşma otomasyonunda kullanılan önde gelen teknolojiler arasındadır. Bu teknolojinin performansı, diyalogsal müşteri hizmetlerinin başarısında çok önemli bir rol oynar. İşletmeler, kullanımı kolay ve gelişmiş bir konuşma sistemi sunarak müşteri deneyimini iyileştirebilir. Bu nedenle doğru konuşma tanıma teknolojisini seçmek, alınması gereken önemli bir karardır. Sestek, sadece gelişmiş teknik özellikleri ve yüksek doğruluk oranları ile değil, 20 yıllık bilgi birikimi ve fark yaratan profesyonel hizmetleriyle de etkin bir çözüm sunuyor. Konuşma Tanıma teknolojimizi Türkçe, İngilizce, Flamanca, Fransızca, Rusça ve Arapça dillerinde test etmek için buraya tıklayın.

Yazar: Aylin Tan, Ürün Yönetimi Uzmanı, Sestek