Google以丰富的对话情境资讯改进客服中心AI的语音辨识能力

行情2021-02-21 08:04:32

最佳答案

2018年Next大会上推出的人工智慧预包装服务客服中心AI（Contact Center AI），现在Google透过增加人工智慧理解对话情境的方法，进一步强化虚拟代理人语音辨识的能力，用户现在还可以更灵活地自订定义SpeechContext类别，减少人工智慧对于文字概念混淆的问题。

Google提到，即便客服中心虚拟代理人的语音辨识精準度达90％，但是比起实验室，实际使用环境以及杂讯的影响，在部分情况下，仍然会使得自动语音辨识的结果变得很糟，因此现在Google进一步更新客服中心AI所使用的技术，特别是在Dialogflow以及云端语音转文字两服务，以提升辨识品质。

Dialogflow让用户能够在网页、行动应用程式或是热门的传讯平台，建构对话服务，而这次更新，Google为Dialogflow加入了自动语音调适能力（Auto Speech Adaptation），以对话情境资讯，解决虚拟代理人混淆单字发音的问题。

由于许多单字的读音很相似，在电话中可能无法很清楚传递，像是cheese和these的发音，还有可能把mail误翻成male或nail，但是当虚拟代理人知道这些对话背景，发生在速食餐厅或是商品退货时，便不容易混淆这些字。用户只要在Dialogflow控制台中，将自动语音调适功能打开，就能让语音辨识準确度上升40％以上。

Google也改进了互动式语音应答（IVR）以及电话虚拟代理人，所使用的云端语音转文字基线模型，而这将会使语音转录的结果更好，Google以电话用语的常用短句最佳化了该模型，使得新模型的表现，在美国英文上的辨识準确度提高15％，再加上自动语音调适功能，还能进一步提升辨识的品质。

开发人员在使用云端语音转文字服务时，能使用SpeechContext参数来控制情境资讯，让语音转录更加精确，以让虚拟代理人更精準地辨识企业产品等特定名词。

而现在Google在SpeechContext中新增类别，而预定义的类别则对应到流行或是通用的概念上，使用情境像是在数字沟通时，4个数字的组合可能代表年、时间或是金钱，而开发者可以在SpeechContext类别，调校整个自动语音辨识的单字列表，改善输入语音的转录结果。

不过，Google也提到，使用SpeechContext这样的工具，会增加部分短句被撷取的机率，这可能降低了语音有提及却没出现在转录文字上的错误，但同时也会增加语音未提及却出现在转录文字的情形，自动语音调适的强度需要权衡结果进行调整，而SpeechContext的Boost功能解决了开发者这样的烦恼，可以自动为使用案例调整语音调适的最佳强度。

过去云端语音转语音服务，处理语音只能以1分钟为单位，而这对于需要较长时间转录文字的使用案例，像是会议、即时影片或是电话等是个大问题，现在Google将处理语音时间上限提高至5分钟，而且API也允许开发人员开启新的串流对话，来接续前一个串流对话，以做到无限时间的串流语音转录文字。

免责声明：本文由用户上传，如有侵权请联系删除！

标签：

上一篇：Google云端现整合跨云连续交付平台Spinnaker

下一篇：Logitech的CircleView是一款不错的安全摄像头

Google以丰富的对话情境资讯改进客服中心AI的语音辨识能力

热门文章

栏目推荐

Google以丰富的对话情境资讯改进客服中心AI的语音辨识能力

猜你喜欢

最新文章

热门文章

栏目推荐