微软推出新一代全双工语音交互技术可预测人类即将说的内容-浙江大学教育培训网

微软推出新一代全双工语音交互技术可预测人类即将说的内容

发布日期：2018-04-02

微软（亚洲）互联网工程院宣布率先推出新一代的语音交互技术：全双工语音交互感官（Full-duplex Voice Sense），并已完成产品化落地。与既有的单轮或多轮连续语音识别不同，这项新技术可实时预测人类即将说出的内容，实时生成回应并控制对话节奏，从而使长程语音交互成为可能。

此外，采用该技术的智能硬件设备，将不再需要用户在每轮交互时都说出唤醒词，仅需一次唤醒，就可以轻松实现连续对话，将语音交互的自然度推进到一个新的层次。

目前，该技术已首先在微软小冰全球产品线中落地。其中在中国市场，除落户中国科技馆的小冰电话亭外，微软还与小米公司进行合作将该技术应用于米家生态链Yeelight语音助手的市售硬件产品上。这是全球首个搭载全双工语音交互感官的智能设备，也是内置微软小冰的首个“双AI”智能设备。在日本市场，小冰凛菜已通过该技术实现在直播平台中的落地，首个车载智能项目也已开始路试。微软计划于未来六个月内，完成该技术在更多产品线中的覆盖。

语音交互是对话式人工智能及智能硬件设备的基础之一。对此，微软小冰全球研发负责人周力博士表示：“从已落地的产品数据和用户反馈中，我们观察到一个普遍现象：用户一旦使用过微软小冰的全双工语音交互感官之后，再与其他语音助手交互时，他们普遍会开始感到不习惯，甚至会频繁忘记要对其他语音助手说唤醒词——新技术促进拟人自然度的显著提升，使人们对过去单轮或多轮连续语音交互体验的满意度迅速下降。这种新老交替的现象，符合我们的研发预期。”